Technologie
SERP Scraping und Publisher-Unmut: Das Geschäft mit der KI-Suche von OpenAI und Perplexity

SERP Scraping und Publisher-Unmut: Das Geschäft mit der KI-Suche von OpenAI und Perplexity

Larissa Ceccio | 26.08.25

Im Zentrum der aktuellen Debatte um OpenAI und andere KI-Player steht ein fundamentaler Konflikt: Künstliche Intelligenz greift auf journalistische Inhalte zu – bislang ohne ein etabliertes Vergütungsmodell. Perplexity verspricht Publishern zwar im Rahmen eines neuen Modells Beteiligungen, muss sich jedoch gleichzeitig wegen mutmaßlicher Urheber:innenrechtsverstöße vor Gericht verantworten. Und während Verlage auf faire Bezahlung pochen, verschärft sich parallel der Wettbewerb zwischen den Tech-Größen selbst.

Wer profitiert von journalistischen Inhalten im KI-Zeitalter? Diese Frage spaltet die Digitalbranche. Medienhäuser kritisieren unter anderem, dass KI-Modelle Inhalte nutzen, ohne die Urheber:innen angemessen zu beteiligen. Zwei Dienste stehen dabei aktuell besonders im Fokus: ChatGPT von OpenAI und Perplexity. Während ChatGPT im Verdacht steht, auf Google-Daten zuzugreifen – ein Problem vor allem für Publisher, die auf den Traffic aus der Google-Suche angewiesen sind –, will Perplexity mit einem Vergütungsmodell Vertrauen schaffen und sieht sich gleichzeitig mit einer Klage konfrontiert.

Doch nicht nur Publisher gehen vor Gericht. Auch große KI-Dienste schießen inzwischen gegeneinander: Elon Musks Unternehmen xAI verklagt derzeit Apple und OpenAI wegen angeblich monopolistischer Praktiken und fordert Schadensersatz in Milliardenhöhe. In der Klage heißt es, Apple und OpenAI haben

Märkte abgeschottet, um ihre Monopole aufrechtzuerhalten und Innovatoren wie X und xAI am Wettbewerb zu hindern.

Der Wettbewerb wird damit nicht nur technologisch, sondern zunehmend juristisch ausgetragen. Parallel dazu steht auch Google unter Druck. Mit den AI Overviews hat der Konzern ein Feature ausgerollt, das Publishern spürbare Traffic-Verluste bringen könnte – und ebenfalls für rechtliche und politische Diskussionen sorgt. Mehr dazu liest du in unserem weiterführenden Artikel.


„Irreparabler Schaden“
– Publisher legen Kartellbeschwerde gegen AI Overviews ein

Europaflagge
Europaflagge, © Markus Spiske – Unsplash (Änderungen wurden vorgenommen via Canva)


ChatGPT im Fokus: Wie die KI an Echtzeitdaten kommt

ChatGPT gehört zu den meistgenutzten KI-Diensten. Seit 2023 bietet das Tool eine Browsing-Funktion, die Antworten zu aktuellen Themen wie Nachrichten, Sport oder Trends ermöglicht. Für diese Echtzeitdaten greift die KI auf externe Quellen zurück. Mehrere Experimente aus der SEO Community deuten darauf hin, dass ChatGPT dafür Google-Ergebnisse nutzt.

Search Engine Roundtable berichtete im Juli über Tests, die genau das zeigen. Der SEO-Experte Abhishek Iyer erstellte eine Seite mit einem erfundenen Begriff, der zuvor noch nie indexiert wurde und lies die Seite anschließend ausschließlich in der Google Search Console von Google allein indexieren. Kurz darauf tauchte sie in ChatGPT-Antworten auf, obwohl sie OpenAI nie gemeldet wurde.

Auch die SEO Consultant Aleyda Solis fand Hinweise.

Zunächst erstellte sie neuen Content und stellte sicher, dass dieser nicht in Suchmaschinen wie Bing oder in ChatGPTs Index vorkam. Anschließend ließ sie die Inhalte über Google indexieren. Wenig später erschienen die Informationen in ChatGPT-Antworten – zu einem Zeitpunkt, an dem Bing die Inhalte noch nicht erfasst hatte. Solis verglich die Formulierungen und stellte eine nahezu exakte Übereinstimmung mit den Google-Suchergebnis-Snippets fest. ChatGPT selbst gab an, dass es sich um Inhalte aus einem Search Engine Snippet handele. Ihre Schlussfolgerung:

Bestätigt – ChatGPT verwendet Google SERP Snippets für seine Antworten.

SerpApi als Schlüssel – und offene Fragen

Soweit bekannt, basiert ChatGPTs Suchfunktion offiziell auf Bing. Dass Google OpenAI den Zugriff auf seinen Index erlaubt, wäre äußerst ungewöhnlich. Barry Schwartz von Search Engine Roundtable konfrontierte OpenAIs CEO Sam Altman mit den Vorwürfen – eine Antwort erhielt er nicht.

Ein Bericht von The Information liefert jedoch eine mögliche Erklärung: Demnach greift OpenAI auf Daten von SerpApi zurück, einem Unternehmen, das sich auf das Auslesen von Suchmaschinenergebnissen spezialisiert hat. SerpApi scrapt unter anderem die Google-Suchergebnisseite und stellt die Daten strukturiert über eine API bereit. Laut The Information nutzt OpenAI diese Informationen, um ChatGPT-Antworten zu aktuellen Ereignissen wie Nachrichten oder Sport mit Echtzeitdaten anzureichern. Brisant ist dabei ein Detail: SerpApi führte OpenAI noch im Mai 2024 öffentlich als Kund:in auf der eigenen Website auf. Dieser Hinweis wurde inzwischen entfernt – ohne Angabe von Gründen. Damit bleibt offen, wie eng die Verbindung aktuell ist. Klar ist jedoch, dass diese Praxis Fragen nach Transparenz und nach der Herkunft der Daten aufwirft.

Eine Analyse von Ahrefs, einem Unternehmen, das im Bereich SEO Tools tätig ist, sorgt für zusätzlichen Kontext: Das Unternehmen untersuchte 118.000 ChatGPT-Fan-Out-Abfragen, also Anfragen, die an externe Quellen gehen. Das Ergebnis: 83,39 Prozent der von ChatGPT ausgewählten URLs erscheinen bei denselben Suchanfragen nicht in den Google-Ergebnissen. Nur 6,82 Prozent liegen in den Top Ten der SERPs.

Damit ist klar: ChatGPT spiegelt nicht einfach Googles Index, sondern arbeitet mit einem hybriden Ansatz. Neben eigenen Daten kombiniert die KI Ergebnisse aus mehreren Quellen – darunter Google und Bing sowie externe Dienste wie SerpApi, das auf das automatisierte Auslesen von Suchergebnissen spezialisiert ist. Darauf weist auch der SEO-Experte Glenn Gabe auf X hin.

Gabe betont, dass dieser Multi-Source-Ansatz nicht nur die Komplexität des Systems verdeutlicht, sondern auch die Frage aufwirft, wie transparent KI-Modelle bei der Herkunft ihrer Daten sein sollten. Und OpenAI ist nicht allein: Auch Perplexity setzt laut ihm und Branchenberichten auf ähnliche Mechanismen – daher lohnt es sich noch mehr das neue Vergütungsmodell des Unternehmens näher zu betrachten.

Perplexity unter Druck – und vor Gericht

Auch Perplexity, ein wachsender Dienst im Bereich KI-Suche, steht im Zentrum der Debatte. Der Ansatz: klassische Suchprozesse weiterentwickeln und Antworten direkt im Chat bereitstellen. Grundlage sind Inhalte aus dem Netz – und genau das bringt den Dienst nun in juristische Schwierigkeiten. Zwei große japanische Medienhäuser, Nikkei und Asahi Shimbun, haben Klage eingereicht. Der Vorwurf: Perplexity habe Inhalte „kopiert und gespeichert“, ohne Zustimmung. Das berichtet die Financial Times.

Die Klage reiht sich in eine wachsende Zahl von Verfahren rund um den KI-Markt ein. Erst kürzlich wurde bekannt, dass Elon Musks Unternehmen xAI Apple und OpenAI verklagt hat. Der Vorwurf: monopolistische Praktiken und die Behinderung des Wettbewerbs im Bereich der Künstlichen Intelligenz. Laut Reuters fordert xAI Schadensersatz in Milliardenhöhe. Diese Auseinandersetzungen zeigen, wie sehr sich der KI-Markt in Richtung regulatorischer und kartellrechtlicher Prüfungen bewegt – ein Umfeld, das auch Perplexitys Geschäftsmodell beeinflussen könnte.

Das neue Modell: Comet Plus

Als Reaktion auf die anhaltende Kritik und möglicherweise auch, um Vertrauen zu schaffen, führt Perplexity ein Umsatzbeteiligungsprogramm ein. Laut Bloomberg stellt das Unternehmen dafür 42,5 Millionen US-Dollar bereit. Das neue Modell trägt den Namen Comet Plus und basiert auf einem Abonnementprinzip. Nutzer:innen können zwischen bestehenden Zugängen wie „Pro“ oder „Max“ sowie einem neuen Paket für fünf US-Dollar monatlich wählen. Von den Einnahmen behält Perplexity 20 Prozent, die restlichen 80 Prozent fließen in einen gemeinsamen Pool für Publisher. Die Ausschüttung erfolgt auf Grundlage von drei Nutzungsszenarien:

  1. Direkte Besuche von Publisher Websites über den Comet Browser
  2. Erwähnungen in Suchergebnissen
  3. Nutzung der Inhalte durch KI-Agents

Jessica Chan, Head of Publisher Partnerships bei Perplexity, bestätigte gegenüber Digiday, das Modell sei aus intensivem Austausch mit Verlagen entstanden. Ziel sei es, die Beziehung zwischen KI-Diensten und Publishern neu zu definieren und mehr Transparenz zu schaffen.

Before Comet Plus, publishers rarely saw any revenue from this type of indirect engagement. This new evolution is to really fix that,

so Chan. Am bestehenden Werbeumsatzprogramm von Perplexity nehmen laut ihr unter anderem Blavity, Der Spiegel, Fortune, Gannett, The Independent und Time teil. Für Comet Plus nannte das Unternehmen bisher keine konkreten Namen. Klar ist jedoch: Perplexity gehört zu den ersten KI-Diensten, die Verlage für die tatsächliche Nutzung ihrer Inhalte vergüten.


Perplexitys Browser ist endlich da, auch für Unternehmen
– so teuer ist der Zugriff

Windows App von Perplexity
© Perplexity via Canva


Symbolpolitik oder echter Fortschritt?

Das Modell sendet ein Signal: Perplexity erkennt an, dass Inhalte einen Wert haben. Doch 42,5 Millionen US-Dollar sind für den globalen KI-Markt kaum mehr als ein symbolischer Betrag. Zudem hängt die Vergütung vom Erfolg des Comet Browsers ab – und dessen Reichweite ist bislang gering, betont Bloomberg im Bericht.

Die eigentliche Grundfrage bleibt bestehen: KI-Modelle greifen auf Inhalte zu, deren Urheber:innen kaum Kontrolle haben und bisher nur selten beteiligt werden. Juristische Klagen wie in Japan zeigen, dass freiwillige Modelle allein nicht reichen. Parallel dazu verschärfen sich die Spannungen in der Branche selbst: Während Publisher nach fairer Vergütung rufen, überziehen sich KI-Unternehmen inzwischen mit gegenseitigen Vorwürfen und milliardenschweren Klagen.

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*