Technologie
Texte, Bilder, PDFs: OpenAI launcht neuen AI Agent Deep Research für ChatGPT

Texte, Bilder, PDFs: OpenAI launcht neuen AI Agent Deep Research für ChatGPT

Niklas Lewanczik | 03.02.25

Mit nur einem Prompt findet und analysiert Deep Research bei ChatGPT hunderte Online-Quellen für umfassende Reports in Minuten. Auch kann der Agent dank o3 diverse Formate durchsuchen.

Nach Operator kommt Deep Research: OpenAI hat einen Agent vorgestellt, der auf Basis des umfassend bereitgestellten Modells o3 eine tiefgreifende Recherche für dich durchführen kann. Dabei soll diese in wenigen Minuten schaffen, wofür Menschen zahlreiche Stunden bräuchten. Allerdings gibt es noch einige Limitierungen.


Revolutionäres KI-Tool:

OpenAIs Operator steuert deinen Browser

Screenshot von Operator vor Farbverlauf
© OpenAI via Canva


Das kann Deep Research von OpenAI

Deep Research ist ein Agent, der über das KI-Tool ChatGPT für den eigenständigen Einsatz zur Bewältigung komplexer Aufgaben eingesetzt werden kann. Dabei sieht OpenAI in der Fähigkeit, aus bestehendem Wissen neues Wissen zu synthetisieren, einen weiteren Schritt auf dem Weg zur AGI (Artificial General Intelligence). Diese Fähigkeit basiert auf dem KI-Modell o3, das das Unternehmen in der mini-Version jüngst für alle User von ChatGPT und der API ausgerollt hat.

User können Deep Research nutzen und beispielsweise einen Prompt mit ChatGPT kreieren, der die Erstellung eines umfassenden Berichts zu einem spezifischen Rechercheprojekt ermöglicht. Dabei kann Deep Research nicht nur Textbeiträge aus dem Internet durchsuchen, sondern auch Formate wie Bilder und PDFs.

Basierend auf den gefundenen und relevanten Daten erstellt der neue Agent dann die Berichte. Das kann zwischen fünf und 30 Minuten dauern. Diese Berichte und die Option selbst sollen Menschen zugutekommen, deren Arbeit vielfach auf Recherchen und verlässlichen Berichten beruht. Das können Studierende sein, Finanzmitarbeiter:innen, Wissenschaftler:innen und Co.

Dank des Trainings der KI können sie unterschiedliche Berichte zusammenstellen lassen, von Wettbewersvergleichen, etwa einer Gegenüberstellung der wichtigsten Streaming-Plattformen, bis hin zu einer Analyse der besten Verkehrsmittel für bestimmte Wege. Im Rahmen der Analyse durch Deep Research wird während der Arbeit des Agents in einer Sidebar angezeigt, welche Schritte ausgeführt und welche Quellen genutzt werden. Denn es handelt sich um eine Multi-Step-Reasoning-Option. Diese soll den Unterschied zur schnellen Zusammenfassung einer KI nach einem simplen Prompt ausmachen können.

Zugriff und Hürden für Deep Research

Das neue agentische Feature kommt zunächst für User des Pro-Abonnements. Diese können dann pro Monte bis zu 100 Anfragen stellen. In der Folge sollen Plus, Team und Enterprise User den Zugriff erhalten. Noch arbeitet OpenAI daran, auch Nutzer:innen im UK, in der Schweiz und im EWR den Zugriff zu ermöglichen.

Während der Einsatz von Deep Research für viele User vielversprechend daherkommt, hat dieser auch seine Fallstricke. Zum einen gibt OpenAI an, dass der Agent mitunter zu Halluzinationen neigt. Dann können auch falsche Fakten oder Zusammenhänge auftreten, was für die Analyse insgesamt zum Problem wird, vor allen, wenn sich der Bericht darauf stützt. Auch die Unterscheidung zwischen gesicherten Fakten und Gerüchten funktioniert nicht immer. Zudem können Fehler bei der Formatierung auftreten. Künftig sollen auch interne Ressourcen und solche hinter Paywalls (mit Erlaubnis) genutzt werden können; noch bezieht sich die Analyse auf das Open Web samt hochgeladener Dokumente. Zum Problem könnte dabei womöglich noch werden, dass Deep Research Inhalte integriert, die zwar für die Öffentlichkeit gedacht sind, im Falle einer wörtlichen und direkten Übernahme aber zu einer Art des Zueigenmachens der Inhalte Dritter avancieren könnte. In diesem Kontext ist eine Differenzierung vonnöten.

OpenAI verspricht weitere Optimierungen von Deep Research, vor allem im Zuge der Modellweiterentwicklung von o3. Derweil bietet das Unternehmen neuerdings für ChatGPT User auch die hilfreiche Funktion Tasks, während die überholten Custom Instructions und der Screensharing Mode für den Advanced Voice Mode endlich in der EU verfügbar sind.


Tasks revolutioniert ChatGPT:

Intelligente Aufgabenplanung für alle?

ChatGPT Tasks Screenshot vor abstraktem Hintergrund
© OpenAI via Canva

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*