Dein wichtigster Touchpoint zur Digitalbranche.
Dein wichtigster Touchpoint zur Digitalbranche.
Technologie
OpenAI: sCMs für schnellere Visual-Kreation, Journalismus-Push und Verstoß gegen das Copyright?

OpenAI: sCMs für schnellere Visual-Kreation, Journalismus-Push und Verstoß gegen das Copyright?

Niklas Lewanczik | 24.10.24

Hat OpenAI bewusst gegen das Copyright verstoßen, um eigene Modelle zu trainieren? Das wirft ein Ex-Angestellter dem Unternehmen vor, während dieses lokalen Journalismus fördert und Consistency Models einführt, die Diffusion Models übertrumpfen sollen.

Für das inzwischen weltbekannte KI-Unternehmen OpenAI kommen derzeit umfassende Produktentwicklungen und heftige Kritik zusammen. Die Company stellte unter der Woche diverse relevante Updates für User vor, startete eine Kooperation mit dem Lenfest Institute of Journalism und Microsoft für die Förderung des Lokaljournalismus und setzte zwei neue Personen in der Führungsriege ein. Doch besonders die Kritik eines ehemaligen Angestellten sorgt für Furore: Er gibt gegenüber der New York Times an, das Unternehmen habe das Copyright für das Training von KI-Modellen vielfach verletzt. So resümiert Suchir Balaji:

This is not a sustainable model for the internet ecosystem as a whole.

Zwischen Vorwürfen und ganz großen Updates: OpenAI als branchentreibende Brand

Suchir Balaji war einige Jahre lang als AI Researcher für OpenAI aktiv und hat das Unternehmen im Sommer verlassen. Im Beitrag von NYT-Reporter und KI-Experte Cade Metz wird erläutert, dass er erst spät realisiert habe, inwieweit OpenAI das Urheber:innrecht viele Creator und Medien missachten könnte, um KI-Modelle zu trainieren. Er sei zu dem Schluss gekommen, Dienste wie ChatGPT würden das Internet als ökonomischen und fairen Raum bedrohen. Auch deshalb habe der das Unternehmen verlassen.

Balaji wirft dem Unternehmen vor, bei der Datengenerierung nicht ausreichend differenziert zu haben. Zunächst habe man Projekte wie Rechercheprojekte für die Wissenschaft behandelt. Dabei sei die Übernahme diverser Daten vergleichsweise unproblematisch gewesen, da sie keinen konkreten kommerziellen Zweck untergeordnet gewesen sei. Das habe sich geändert, als OpenAI mit ChatGPT-Abonnements etc. vor allem kommerzielle Ziele zu verfolgen begann. Nun widerspricht das Unternehmen Vorwürfen wie jenen von Suchir Balaji, die nicht zum ersten Mal auftauchen. Auch die New York Times selbst zählt zu den Entitäten, die bereits wegen Copyright-Verstößen gegen OpenAI klagten. Und bei der Datengrundlage für das KI-Videogenerierungsmodell Sora könnten YouTube-Videos von Creatorn ohne deren Zustimmung genutzt worden sein.

OpenAI aber sieht die Nutzung öffentlich verfügbarer Daten unter dem US-Prinzip des Fair Use und rechtlicher Präzedenzfälle als lauter an. Dabei wird besonders die Veränderung von Inhalten und Kontexten durch KI-Modelle hervorgehoben. Allerdings erklärt Balaji gegenüber der NYT:

There are occasionally circumstances where an output looks like an input. A vast majority of things generated by a ChatGPT or an image generation system do not draw heavily from a particular piece of content.

Nur eine umfassende Regulierung könne diese Probleme zwischen Rechtehalter:innen an Werken und Unternehmen, die KI-Modelle trainieren, lösen. Alternativ gibt es vielfach auch Lizenzvereinbarungen zwischen Plattformen und Tech-Unternehmen, die die Datennutzung legitimieren sollen.

sCMs für schnellere Bildgenerierung: Wieder ein neues Modell

Gerade die Aussage zu den Ähnlichkeiten von Output und Input passt gut zu einer neuen Entwicklung von OpenAI. Das Unternehmen stellte kürzlich die sogenannten sCMs vor. Dabei handelt es sich um Consistency Models, die die Visual-Generierung vereinfachen und beschleunigen sollen, besonders im Vergleich zu den bewährten Diffusion Models.

Anders als Diffusion Models benötigen die sCMs nur zwei Sampling-Schritte. Diffusion Models fügen Bilddateien, vereinfacht gesagt, Noise hinzu, eine Art visuelles Rauschen, das die Bilder zuerst deskonstruiert und eine Datenbasis auf Grundlage der Eingangsdaten schafft. Im umgekehrten Prozess, auch Denoising genannt, wird wieder ein Visual generiert, das den Eingangsdaten stark ähnelt. Es geht also um eine Art Variantenmodell. Mit dem Prozess gehen aber Probleme einher, wie OpenAI anmerkt:

[…] Current sampling approaches of diffusion models often require dozens to hundreds of sequential steps to generate a single sample, which limits their efficiency and scalability for real-time applications. Various distillation techniques have been developed to accelerate sampling, but they often come with limitations, such as high computational costs, complex training, and reduced sample quality […].

Deshalb bietet das Unternehmen mit sCMs neue Consistency Models, die bald schlichtweg schneller Content erstellen sollen können. Auch die Skalierung für große Datensets soll dann einfacher umzusetzen sein. Noch besteht jedoch die Hürde, dass die Modelle auf Diffusion Models als Lehrmodellen basieren und daher hinsichtlich der Qualität des Outputs noch nicht auf dem gewünschten Level sind.

Noch mehr Details zum neuen Modelltyp kannst du im Blog Post nachlesen. Möglicherweise können sCMs Creator und Unternehmen bald ebenso bei der Arbeit unterstützen wie die ChatGPT Apps und das neue Coworking Tool Canvas.


Endlich ChatGPT Windows Desktop App und ein Canvas Update

Screen-Ansicht der ChatGPT Windows Desktop App, Farbverlauf hellblau im Hintergrund
© OpenAI via Canva


Neue Tools und neue Pläne für OpenAI und die User

In der Tech-Welt vergeht kaum eine Woche ohne große Neuankündigung vonseiten OpenAIs. Jüngst wurde beispielsweise verkündet, dass zwei neue Personen zur Führungsriege dazustoßen. Scott Schools wird Chief Compliance Officer, Dr. Ronnie Chatterji wird Chief Economist.

Diese Neuigkeiten kommen direkt nach der Bekanntgabe zum Start des Lenfest Institute AI Collaborative and Fellowship Programs. Damit können Publisher wie Chicago Public Media, The Minnesota Star Tribune, Newsday (Long Island, New York), The Philadelphia Inquirer und The Seattle Times Finanzierungen erhalten und gleichzeitig den Einsatz von generativer KI für den Publishing-Alltag erproben.

Für Journalist:innen und User in Deutschland dürfte derzeit aber von größerem Interesse sein, dass der Advanced Voice Mode für ChatGPT endlich auch in der EU ausgerollt wird (für Plus User zunächst).


ChatGPT:

Advanced Voice Mode mit Emotionserkennung auch in Deutschland

Smartphone Mockup mit ChatGPT Plus Advanced Voice Mode, Farbverlauf, helle Veilchenfarbe, im Hintergrunde
© OpenAI via Canva

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*