Technologie
Google bringt Bewegung ins Bild: Wie Veo 2 und Whisk Animate die KI-Videogenerierung aufmischen

Google bringt Bewegung ins Bild: Wie Veo 2 und Whisk Animate die KI-Videogenerierung aufmischen

Larissa Ceccio | 16.04.25

Mit Veo 2 und Whisk Animate läutet Google die nächste Videoära ein – aus Prompts werden Clips in Sekunden. Doch auch Adobe, OpenAI und spezialisierte Player ziehen nach. Was Creator und Brands jetzt auf dem Schirm haben sollten.

Was bislang professionelle Kamerateams, Motion-Designer und Post-Production erforderte, wird nun in Sekunden von einem neuen KI-Modell umgesetzt. Mit Veo 2, Googles jüngster Entwicklung im Bereich der generativen Videotechnologie, können Abonnent:innen von Gemini Advanced sowie Google One AI Premium kurze, visuell hochwertige Clips direkt aus Textbeschreibungen generieren. Ein Beispiel, das Google auf X teilt, macht das Potenzial greifbar.

Veo 2 steht ab sofort weltweit für zahlende User zur Verfügung und ist direkt im Dropdown-Menü der Gemini App auswählbar. Parallel dazu verkündet Google Labs die Einführung von Whisk Animate – einem neuen Feature, das es Nutzer:innen ermöglicht, generierte Bilder in animierte Clips zu verwandeln. Allerdings ist es bislang Usern außerhalb der EU vorbehalten; wann ein globaler Roll-out stattfindet, bleibt abzuwarten.

Beide Anwendungen basieren auf Veo 2 und bieten unterschiedliche Einstiegspunkte in die KI-gestützte Videoerstellung: einerseits prompt-basiert via Gemini, andererseits visuell-bildbasiert via Whisk. Zwei Tools, zwei kreative Workflows – beide mit Veo 2 im Herzen. Doch was genau steckt hinter dem Veo-2-Modell, das Google CEO Sundar Pichai als „big leap forward for video gen“ bezeichnet? Und wie positioniert sich Google im Wettbewerb mit Adobe, OpenAI und weiteren Akteur:innen im zunehmend dynamischen Markt für generative Videotechnologie?


Google und generative KI-Suche:
Müssen wir SEO völlig neu denken?

Smartphone und Laptop Screen mit AI Overviews und AI Mode von Google
© Google via Canva


Von der Vision zum Video: Was Veo 2 leisten kann

Veo 2 ist Googles neuestes High-End-Videomodell für generative Künstliche Intelligenz und ab sofort über Gemini Advanced verfügbar – Googles KI-Angebot für zahlende Nutzer:innen.

In Kombination mit der ebenfalls KI-gestützten Bildplattform Whisk können Nutzer:innen somit nicht nur Text-to-Video-Generierung nutzen, sondern auch Bilder in kurze, animierte Clips verwandeln.

Die Ergebnisse sind auf bis zu acht Sekunden begrenzt, aber in puncto Qualität und Stilvarianten lässt Veo 2 aufhorchen: Flüssige Bewegungen, realitätsnahe Szenen und eine gute physikalische Logik der Animationen machen es möglich, dass Charaktere glaubwürdig handeln – egal ob als Claymation-Figur oder in realistischer Umgebung. Wer bereits ein Google One AI Premium-Abo hat, kann Veo 2 direkt im Gemini-Menü auswählen. Das Modell versteht laut Google nicht nur Bewegung, sondern auch kreative Details in Prompts immer besser – was insbesondere im Marketing-Kontext eine entscheidende Rolle spielt. Denn: Je präziser die Eingabe, desto filmreifer das Ergebnis.

Noch nicht in Europa, aber schon im Rennen

Whisk Animate ist bisher nur außerhalb der EU verfügbar. Der internationale Roll-out folgt damit einem bekannten Google-Muster – schnell, ambitioniert, aber nicht synchron mit europäischen Datenschutzstandards. Für Nutzer:innen in Europa heißt das vorerst: abwarten, während andere bereits experimentieren. Dennoch positioniert sich Veo 2 klar als ernstzunehmender Gegenpol zu anderen Schwergewichten der KI-Videogenerierung – etwa Adobe Firefly oder OpenAIs Sora. Beide gelten als maßgebliche Treiber:innen im Rennen um die Zukunft von KI-generierten Bewegtbildern, verfolgen aber unterschiedliche Ansätze. In einem Übersichtsartikel stellen wir dir beide Modelle vor.


Adobe Firefly oder OpenAI Sora?
Das beste KI-Tool für deine Videos

Startbildschirm von Adobe Firefly
Startbildschirm von Adobe Firefly, © Adobe via Canva


Adobe hat kürzlich ein neues Firefly Videomodell vorgestellt – aktuell noch im Betastadium, aber mit einem starken Fokus auf kreative Kontrolle, stilistische Vielfalt und professionelle Workflows.

Auf Threads ansehen

Die hauseigene Forschungsabteilung bezeichnet Firefly Video bereits als „breakthrough“ für Creator. Der Fokus liegt dabei klar auf professionellen Design und Content Teams, die generative KI gezielt in bestehende Workflows integrieren wollen – etwa im Zusammenspiel mit Tools wie Premiere Pro oder After Effects. Adobe verfolgt damit einen produktionsnahen Ansatz, der sich deutlich vom kreativen Explorationsraum bei Google Labs unterscheidet.

OpenAIs Sora wiederum bleibt vorerst ein faszinierendes Versprechen: Die Anfang des Jahres veröffentlichten Demovideos sorgten für enorme Aufmerksamkeit in der Tech-Community. Ein öffentlicher Zugang zum Modell steht bislang jedoch aus. Zwar beeindruckt Sora mit realitätsnahen Sequenzen und komplexen Szenenkompositionen, doch mangels Transparenz bleibt es für viele Marktteilnehmer:innen aktuell eine Black Box.

Neben den großen Namen drängen auch kleinere, hochspezialisierte Anbieter:innen in den Markt: So etwa Evolving AI, deren Modell Kling 2.0 zuletzt mit besonders flüssigen Bewegungsabläufen und physikalisch stimmigen Simulationen für Aufsehen sorgte.

Auf Threads ansehen

Solche Entwicklungen zeigen: Der Wettbewerb wird nicht nur schneller, sondern auch vielfältiger – und fordert etablierte Akteur:innen zunehmend heraus.

Kurz, cineastisch, KI-generiert: Was Marketer jetzt über Videogenerierung wissen sollten

Für Content Teams, Marken und Agenturen zeichnet sich ein klarer Trend ab: Video-Content auf Basis von Text- und Bild-Inputs wird nicht nur leichter zugänglich, sondern zunehmend strategisch relevant. Tools wie Veo 2 und Whisk Animate könnten Produktionsprozesse beschleunigen, Social-Media-Formate transformieren und neue Wege der visuellen Kommunikation eröffnen – vorausgesetzt, regulatorische Hürden wie der eingeschränkte EU-Zugang werden mittelfristig überwunden. Besonders für das Marketing bedeutet das: Prompt-Kompetenz wird zur Schlüsselqualifikation. Google selbst empfiehlt Nutzer:innen, möglichst präzise und detailreiche Prompts zu formulieren. Denn je klarer die Anweisung, desto überzeugender das Ergebnis. Das verändert nicht nur kreative Prozesse, sondern auch die Art und Weise, wie Texte künftig gedacht und geschrieben werden – weg vom klassischen SEO-Text, hin zum durchdachten KI-Skript.

Ob ein Fallschirmschriftzug oder eine surreale Traumlandschaft: Veo 2 demonstriert, wie nah wir der KI-gestützten Videorevolution bereits sind – zumindest technisch. Die hohe Qualität, die Geschwindigkeit der Umsetzung und die stilistische Bandbreite setzen neue Maßstäbe für digitales Storytelling. Und Google bringt sich mit Gemini, Veo 2 und Whisk klar in Stellung: als kreative Infrastruktur für eine Zukunft, in der aus Ideen bewegte Bilder werden – in Sekunden statt in Produktionszyklen.

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*