We’re developing a new tool to help distinguish between AI-written and human-written text. We’re releasing an initial version to collect feedback and hope to share improved methods in the future. https://t.co/4dQE3dX6vX

Was kann der AI Classifier von OpenAI – und was nicht?

Eine Identifikation von KI-generierten Texten kann in verschiedenen Szenarien relevant sein. So werden Lehrende derlei Texte von solchen unterscheiden wollen, die tatsächlich von Menschen geschrieben wurden, um Schüler:innen oder Studierende besser bewerten zu können. Doch auch bei automatisierten Desinformationskampagnen kann es von Vorteil sein, zu erkennen, ob eine KI Texte – möglicherweise sogar im Rahmen ihrer Limitierungen – mit entsprechenden Desinformationen erstellt hat. Insbesondere dann, wenn Texte von KI-Tools als von Menschen gemacht ausgegeben werden, kann sich eine Prüfung lohnen. In dem Blogpost zum neuen Tool heißt es vonseiten OpenAIs:

We’ve trained a classifier to distinguish between text written by a human and text written by AIs from a variety of providers. While it is impossible to reliably detect all AI-written text, we believe good classifiers can inform mitigations for false claims that AI-generated text was written by a human: for example, running automated misinformation campaigns, using AI tools for academic dishonesty, and positioning an AI chatbot as a human.

Jedoch zeigte sich das Tool im Belastungstest noch als nicht besonders ausgereift. Nur 26 Prozent der KI-Texte wurden vom Classifier als solche erkannt. Und in neun Prozent der Fälle, in denen von Menschen geschriebene Texte vorgelegt wurden, gab das Tool als Einschätzung ebenfalls „likely AI-written“ an. Dabei gibt das Unternehmen an, dass sich die Belastbarkeit des Tools verbessern wird, je mehr es trainiert wird.

We’re making this classifier publicly available to get feedback on whether imperfect tools like this one are useful. Our work on the detection of AI-generated text will continue, and we hope to share improved methods in the future.

Dementsprechend können User den AI Classifier bereits testen. Allerdings gibt es noch einige Limitierungen bei der Klassifikation. So ist die Erkennung bei Texten mit weniger als 1.000 Zeichen sehr unverlässlich und Texte in anderen Sprachen als Englisch können weitaus weniger gut den verschiedenen Kategorien zugeordnet werden. Eine Identifikation von sehr vorhersagbaren Texten – zum Beispiel Listen oder Rezepten – ist ebenfalls kaum verlässlich.

Erste Testszenarien mit gemischten Ergebnissen

Nutzer:innen können sich Beispiele für KI-Texte und von Menschen geschriebene Texte ansehen oder ihre eigenen Beispieltexte einfügen. Einen OnlineMarketing.de-Artikel erkannte das Tool richtig als „very unlikely AI-generated“.

Testtexteingabe bei OpenAIs AI Classifier, eigener Screenshot

Allerdings ordnet das Tool mitunter auch Texte, die ChatGPT verfasst hat, in diese Kategorie ein. SEO-Experte Barry Schwartz zeigt auf Twitter ein Beispiel einer erfolgreichen Klassifizierung; doch in den Kommentaren gibt es ebenso Beispiele für Fehleinschätzungen.