Dein wichtigster Touchpoint zur Digitalbranche.
Dein wichtigster Touchpoint zur Digitalbranche.
Technologie
Generative KI für Kurzvideos – QuickVid macht es möglich!

Generative KI für Kurzvideos – QuickVid macht es möglich!

Larissa Ceccio | 03.01.23

Eine neue Website namens QuickVid ermöglicht die automatische Kreation von Kurzvideos für TikTok, YouTube, Instagram und Co. via KI.

Erst kürzlich begeisterte das KI-Sprach-Tool ChatGPT Millionen User durch die Möglichkeit, verschiedenste Textformen automatisch zu erstellen. Eine neue Website, die den Namen QuickVid trägt, ermöglicht es seit dem 27. Dezember 2022, automatische Kurzvideos inklusive Begleitkommentaren zu kreieren. Eine solche Option dürfte im Zuge des Videotrends auf Social-Plattformen bahnbrechend sein und viele Creator und Marketer überzeugen. Auf der Startseite prangt der Slogan „Create YouTube Shorts 10x faster. With Ai.“, der wie ein verheißungsvolles Versprechen an Ersteller:innen anmutet.


Die KI ChatGPT sammelt Millionen von Usern und der Hype nimmt nicht ab. Google hat sich dennoch gegen ein Konkurrenz-System entschieden. Um einerseits die Euphorie und andererseits die vorherrschende Skepsis gegenüber ChatGPT durchdringen zu können, haben wir mit Michael Witzenleiter von Conversion Maker über das leistungsstärkste KI-Sprachsystem aller Zeiten gesprochen. Das Interview kannst du dir in unserem Artikel auf OnlineMarketing.de durchlesen.

© OpenAI, Michael Witzenleiter via Canva

Das ist QuickVid

QuickVid ist die neuste Demonstration dessen, was mit heutiger KI möglich ist – und der Herausforderungen, die eine solche Entwicklung mit sich bringt. Die neue Website kombiniert gleich mehrere generative KI-Systeme in einem einzigen Tool zur automatischen Erstellung von Kurzvideos für Plattformen wie YouTube, Instagram, TikTok und Snapchat. Ein einziges Wort genügt QuickVid, um die KI-Maschinerie ins Rollen zu bringen. Bereits im nächsten Schritt wählt das Tool ein passendes Hintergrundvideo aus der integrierten Bilderbibliothek aus, schreibt ein Skript und Schlüsselwörter, überlagert von DALL-E 2 generierte Bilder und fügt ein synthetisches Voiceover sowie Hintergrundmusik aus der lizenzfreien Musikbibliothek von YouTube hinzu. Der Schöpfer von QuickVid, Daniel Habib, erklärte gegenüber TechCrunch, dass er den Dienst aufbaut, um Creatorn zu helfen, die „ständig wachsende“ Nachfrage ihrer Fans erfüllen zu können. Der autodidaktische Entwickler, der zuvor bei Meta an der Facebook Live- und Videoinfrastruktur gearbeitet hat, sagte außerdem gegenüber TechCrunch:

By providing creators with tools to quickly and easily produce quality content, QuickVid helps creators increase their content output, reducing the risk of burnout. Our goal is to empower your favorite creator to keep up with the demands of their audience by leveraging advancements in AI.

Doch neben Begeisterungsstürmen entfachen Tools wie QuickVid oder ChatGPT auch berechtigte Kritik. Die neue Kurzvideo-KI sorgt etwa bereits für mit Spam überfüllte Kanäle und redundante Inhalte in User Feeds. Einige Ersteller:innen entscheiden sich auch aufgrund der zehn US-Dollar pro Monat, die für den Dienst anfallen, gegen eine Nutzung, müssen dann jedoch möglicherweise mit einer neuen Reihe KI-generierter Videos konkurrieren.

Und so funktioniert QuickVid

Habib selbst erklärte, dass er QuickVid in nur wenigen Wochen erstellt hat. Das derzeit noch sehr schlichte Website-Design ist somit wohl auf diesen Umstand zurückzuführen. Er sagte, dass weitere Personalisierungsoptionen im Januar realisiert werden sollen – das System funktioniere jedoch bereits und könne etwa YouTube Shorts oder TikToks erstellen, einschließlich Untertiteln und sogar Avataren.

Das Tool ist in der Handhabe bislang recht unkompliziert. Im ersten Schritt tippst du eine Eingabeaufforderung ein, die das Thema des Videos beschreibt, das du erstellen möchtest. QuickVid verwendet die Eingabeaufforderung, um ein Skript zu erstellen, wobei die generativen Textfunktionen von GPT-3 (der Grundlage von ChatGPT) genutzt werden. Aus Schlüsselwörtern, die entweder automatisch aus dem Skript extrahiert oder von dir manuell eingegeben wurden, wählt QuickVid ein Hintergrundvideo aus der lizenzfreien Stock-Medienbibliothek Pexels aus und generiert mithilfe von DALL-E 2 Overlay-Bilder. Anschließend erstellt das System ein Voiceover über die Text-to-Speech API von Google Cloud. Habib sagt, dass Anwender:innen bald sogar in der Lage sein werden, ihre Stimme zu klonen – bevor sie all diese Elemente zu einem Video kombinieren.

Derzeit können wir keinen Test durchführen, da neue potenzielle Anwender:innen sich zunächst nur auf eine Warteliste setzen lassen können.

QuickVid Website, eigener Screenshot vom 2. Januar 2022

Sucht man beispielsweise auf Twitter nach dem Hashtag #QuickVid findet man bereits einige Tweets, in denen User ihre mit QuickVid erstellten Kurzvideos präsentieren.

Qualität von QuickVid-Kreationen überzeugt noch nicht auf ganzer Linie

Die Qualität der von QuickVid automatisch erzeugten Videos ist jedoch noch ausbaufähig. So sind die Hintergrundvideos eher zufällig gewählt und nicht speziell auf das Thema zugeschnitten, was darauf zurückzuführen ist, dass sich das System derzeit auf den Pexels-Katalog als Quelle beschränkt. Die von DALL-E 2 generierten Bilder weisen derweil die Einschränkungen der heutigen Text-zu-Bild-Technologie auf, etwa unvollständige Textpassagen und falsche Bildproportionen.

QuickVid geht sicherlich nicht an die Grenzen dessen, was mit generativer KI möglich ist. Sowohl Meta als auch Google haben bereits KI-Systeme vorgestellt, die bei einer Texteingabeaufforderung völlig originelle Clips generieren können. Aber QuickVid kombiniert vorhandene KI-Tools, um das sich wiederholende, vorlagenbasierte Format von B-Roll-lastigen Kurzformvideos zu nutzen, und umgeht das Problem, das Filmmaterial selbst generieren zu müssen. Habib erläutert:

Successful creators have an extremely high-quality bar and aren’t interested in putting out content that they don’t feel is in their own voice. This is the use case we’re focused on.

Copyrights-Herausforderung von QuickVid

Laut Habib behalten QuickVid-Benutzer:innen das Recht, die von ihnen erstellten Inhalte kommerziell zu nutzen, und haben die Erlaubnis, sie auf Plattformen wie YouTube zu monetarisieren. Aber der Urheber:innenrechtsstatus von KI-generierten Inhalten ist, zumindest derzeit, noch nebulös. Das US-Patent- und Markenamt (USPTO) hat kürzlich den Urheber:innenrechtsschutz für einen KI-generierten Comic widerrufen und erklärte in diesem Kontext, dass urheber:innenrechtlich geschützte Werke eine menschliche Urheber:innenschaft erfordern.

Auf die Frage, wie sich die USPTO-Entscheidung auf QuickVid auswirken könnte, sagte Habib, er glaube, dass es nur um die „Patentierbarkeit“ von KI-generierten Produkten gehe und nicht um die Rechte der Urheber:innen, ihre Inhalte zu nutzen und zu monetarisieren. Creator, betonte er, reichen in der Regel keine Patente für Videos ein und lehnen sich normalerweise an die Schöpfer:innenwirtschaft an, indem sie andere Creator ihre Clips wiederverwenden lassen, um ihre eigene Reichweite zu erhöhen. Er erklärte:

Creators care about putting out high-quality content in their voice that will help grow their channel.

Eine weitere rechtliche Herausforderung könnte sich auf die DALL-E 2-Integration von QuickVid auswirken – und damit auch auf die Fähigkeit der Website, Bildüberlagerungen zu generieren. Microsoft, GitHub und OpenAI sehen sich mit in einer Sammelklage konfrontiert, in der sie beschuldigt werden, gegen das Urheber:innenrecht verstoßen zu haben. Laut der Klage haben sie Copilot, ein Codegenerierungssystem, erlaubt, Teile des lizenzierten Codes ohne Angabe von Quellen zu reproduzieren (Copilot wurde gemeinsam von den Unternehmen OpenAI und GitHub entwickelt, die beide zu Microsoft gehören). Habib ist jedoch wenig besorgt und argumentiert:

If another lawsuit showed up and OpenAI disappeared tomorrow, there are several alternatives that could power QuickVid.

Mit seiner Aussage bezog er sich auf das Open-Source-DALL-E 2-ähnliche System Stable Diffusion. QuickVid testet Stable Diffusion bereits zur Generierung von Avatarbildern.

Moderations- und Spam-Probleme von QuickVid-Kreationen

Abgesehen von den rechtlichen Dilemmata könnte QuickVid auch ein Moderationsproblem haben. Während OpenAI Filter und Techniken implementiert hat, um solchen Herausforderungen entgegenwirken zu können, hat die generative KI Probleme mit Toxizität und sachlicher Genauigkeit. Auch GPT-3 steht in der Kritik, weil das System die Verbreitung von Fehlinformationen begünstigt, insbesondere über aktuelle Ereignisse, die über die Grenzen der Wissensbasis des KI-Tools hinausgehen. ChatGPT wiederum, ein Abkömmling von GPT-3, verwendet nachweislich sexistische und rassistische Sprache.

Das ist besorgniserregend, insbesondere für Leute, die QuickVid verwenden würden, um Informationsvideos zu erstellen. In einem Test von TechCrunch formulierte ein:e Redaktuer:in anstößige Eingabeaufforderungen, um zu sehen, was QuickVid daraus schafft. Offensichtlich problematische Aufforderungen wie „Jüdische neue Weltordnung“ und „9/11-Verschwörungstheorie“ brachten keine problematischen Skripte hervor. Aber für „Critical Race Theory Indoctrining Students“ erstellte QuickVid ein Video, das impliziert, dass die Critical Race Theory zur Gehirnwäsche von Schulkindern eingesetzt werden könnte. Habib sagte in diesem Kontext, dass er sich auf die Filter von OpenAI verlässt, um den größten Teil der Moderationsarbeit zu erledigen, und behauptet, dass es den Nutzer:innen obliegt, jedes von QuickVid erstellte Video manuell zu überprüfen, um sicherzustellen, dass „alles innerhalb der Grenzen des Gesetzes liegt“.

Habib argumentierte auch, dass die Algorithmen der Videoplattformen, nicht QuickVid, am besten in der Lage sind, die Qualität eines Videos zu bestimmen, und dass Menschen, die Inhalte von geringer Qualität produzieren, „nur ihren eigenen Ruf schädigen“. Der Reputationsschaden wird die Anwender:innen seiner Meinung nach davon abhalten, Massen an Spam-Kampagnen mit QuickVid zu erstellen. Kritiker:innen sind hier jedoch anderer Meinung und befürchten erhebliche negative Auswirkungen für Social-Plattformen und die Verbreitung von Fake News, Spam und Hate Speech. In einem Interview mit The Verge sagte Kristin Tynski, Mitbegründerin von Fractl, sie sehe generative KI voraus, die „einen massiven Tsunami von computergenerierten Inhalten in allen erdenklichen Nischen“ ermöglichen werde.

So behandeln Tech-Unternehmen KI-generierte Inhalte

Die Richtlinie der Google-Suche zu KI-generiertem Text könnte eine Vorschau auf das sein, was im Videobereich kommen wird. Google behandelt synthetischen Text nicht anders als von Menschen geschriebenen Text, wenn es um Such-Rankings geht, ergreift jedoch Maßnahmen zu Inhalten, die „dazu bestimmt sind, Such-Rankings zu manipulieren und Nutzer:innen nicht zu helfen“. Dazu gehören zusammengefügte oder aus verschiedenen Websites kombinierte Inhalte, die „keinen ausreichenden Mehrwert bieten“, sowie durch rein automatisierte Prozesse generierte Inhalte, die beide auf QuickVid zutreffen könnten.

Mit anderen Worten, KI-generierte Videos werden möglicherweise nicht sofort von den Plattformen verbannt, wenn sie sich stark durchsetzen. Das dürfte die Befürchtungen von kritischen Expert:innen, die glauben, dass Plattformen wie TikTok zu einem Zuhause für irreführende Videos werden, bestärken. Aber, wie Habib während des Interviews mit TechCrunch sagte: „die generative KI-Revolution ist nicht aufzuhalten.“

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*