midjourney introduces video generation and it's surpassing all my expectations.

Doch was steckt technisch hinter V1? Und wo positioniert sich das Modell im Vergleich zu Sora, Firefly und Veo?

Bilder in Bewegung: Das kann Midjourneys neues V1-Modell

Midjourney V1 funktioniert als Image-to-Video-Modell: Nutzer:innen laden ein Bild hoch – oder nutzen ein mit Midjourney erzeugtes – und bekommen vier fünfsekündige Videos zurück. Besonderheit: Auch externe Bilder können nun hochgeladen und animiert werden – die Nutzer:innen markieren dabei das Bild als „start frame“ und geben per Text-Pprompt an, wie es sich bewegen soll.

Der Zugang bleibt, wie bei den Bildmodellen, zunächst exklusiv über Discord und nur als Web-Version verfügbar. Das Preismodell startet bei zehn US-Dollar pro Monat im Basic-Plan. Für intensivere Nutzung gibt es Pro- und Mega-Abos (60 und 120 US-Dollar), die in der langsameren Relax Mode unbegrenzte Generierungen ermöglichen.

Ein wichtiger Punkt: Eine Videogenerierung kostet aktuell etwa achtmal mehr als ein Bild. V1-Nutzer:innen werden also schneller ihr monatliches Generierungslimit erreichen. Midjourney betont in der Ankündigung jedoch selbst, dass die Kosten für Videojobs bewusst niedrig gehalten wurden:

This is amazing, surprising, and over 25 times cheaper than what the market has shipped before.

Das Pricing soll in den kommenden Wochen noch weiter optimiert werden – je nach Nutzungslast und Server-Kapazitäten.

Spielraum für Kreativität: Diese Features bringt V1

Anders als viele der auf kontrollierbare Videomodelle für Werbung ausgerichteten Konkurrenz, bleibt Midjourney seiner kreativen Linie treu. So können User einstellen:

Automatische Animation (zufällige Bewegungen)

Manuelle Animation (präzise Steuerung per Texteingabe)

Motion Control (Low Motion oder High Motion)

Im Low Motion-Modus bleibt die Kamera eher ruhig, der Bildinhalt bewegt sich subtil. Der Modus High Motion sorgt für dynamischere Bewegungen, birgt aber auch die Gefahr von stilistischen Fehlern.

Videos lassen sich auf bis zu 21 Sekunden verlängern. Erste Demos zeigen den typischen Stil von Midjourney: traumhaft, sphärisch, eher künstlerisch als realistisch. Ein Überblick über die Bildqualitäten und kreativen Möglichkeiten von Midjourneys Bildmodellen gibt unser Artikel.

© Midjourney via Canva

Zwischen Vision und Klagewelle: Der größere Plan hinter V1

V1 ist laut Midjourney-Chef David Holz nur ein Zwischenschritt: Das Unternehmen will Modelle entwickeln, die künftig für Realtime Open World Simulations geeignet sind. In der Pipeline: 3D-Modelle und Echtzeit-AI-Engines.

The next year involves building these pieces individually, releasing them, and then slowly, putting it all together into a single unified system,

so Holz. Doch der Launch passiert nicht ohne Gegenwind. Nur eine Woche zuvor wurde Midjourney von Disney und Universal verklagt. Der Vorwurf: KI-generierte Bilder sollen urheber:innenrechtlich geschützte Charaktere wie Homer Simpson oder Darth Vader abbilden.

Gerade in Hollywood wächst die Sorge, dass KI-Tools wie Midjourney das kreative Handwerk verdrängen oder entwerten könnten.

Wie schlägt sich V1 im Konkurrenzvergleich?

Der Markt für KI-Video-Tools ist 2025 dynamisch: OpenAIs Sora, Adobe Firefly, Runway Gen-4 und Google Veo 3 bringen bereits starke Modelle an den Start. Viele davon zielen auf realistische und kommerziell verwertbare Inhalte. Wie aktuell etwa Googles Veo 3, das inzwischen in die YouTube-Shorts-Strategie integriert wird – mehr dazu in unserem Artikel.

YouTube Shorts-Hintergrundbild, © YouTube via Canva

Midjourney bleibt hier explizit anders: kein Tool für generische B-Roll – also ergänzende Schnittbilder, wie sie oft in Werbe-Spots oder Corporate Videos eingesetzt werden – sondern ein kreatives Werkzeug für Artists und Early Adopter. Für Marken und Agenturen, die visuell auffällige Inhalte und künstlerisch geprägte Assets suchen, könnte V1 daher spannende Optionen bieten.

Midjourney bleibt der kreative Underdog im KI-Video-Rennen

Midjourney V1 liefert zunächst genau das, was man vom Startup erwarten konnte: ungewöhnliche, künstlerische Videos statt fotorealistischer Clips. Wer auf kommerzielle B2B-Kampagnen zielt, dürfte bei Firefly oder Sora aktuell besser bedient sein. Für die Creator Economy, die Gaming-Szene oder progressive Marken eröffnet V1 dagegen viel kreativen Spielraum.

Entscheidend wird sein, wie sich die Community und das Pricing entwickeln – und ob Midjourney langfristig über Discord hinausgeht. In jedem Fall bringt V1 frischen Wind in den heiß umkämpften Markt der KI-Videogenerierung.