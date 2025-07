ChatGPT can now do work for you using its own computer. Introducing ChatGPT agent—a unified agentic system combining Operator’s action-taking remote browser, deep research’s web synthesis, and ChatGPT’s conversational strengths. pic.twitter.com/7uN2Nc6nBQ

Was das Besondere daran ist? Der ChatGPT Agent erledigt Aufgaben nicht mehr nur auf Zuruf, sondern direkt – mit Zugriff auf Anwendungen wie Gmail, Kalender-Tools oder Präsentations-Software. Laut OpenAI kann der Agent beispielsweise einen Termin vorschlagen, ein passendes Restaurant buchen und dabei auf persönliche Vorlieben eingehen – alles innerhalb eines Chats. OpenAI fasst zusammen:

Auch mit dem neuen Projects Update entwickelt sich ChatGPT weiter – von einer smarten Assistenz zur vernetzten KI-Arbeitsumgebung. Ganz ohne Tool-Chaos. Mehr dazu im Artikel.

© OpenAI via Canva

Kalender, Präsentation, Einkauf – in einem Ablauf

Die Einsatzmöglichkeiten sind vielfältig: The Verge sprach mit OpenAIs Head of Product Yash Kumar und Research Lead Isa Fulford über den neuen Agent. In einer Demo zeigte Kumar, wie dieser jede Woche automatisch einen Parkplatz für das Büro reserviert. Fulford nutzt ihn unter anderem für strukturierte Online-Bestellungen. Weitere Beispiele aus dem Test: ein automatisierter Einkauf für ein japanisches Frühstück, die Erstellung eines Wettbewerbsvergleichs inklusive Präsentationsfolien oder eine Recherche zu Nischenthemen mit geprüften Quellenangaben.

OpenAI zufolge wurde für den Agent ein eigenes Modell entwickelt, das mit mehreren Tools gleichzeitig umgehen kann, etwa einem Text-Browser, visuellen Interfaces und einem Terminal. Die Grundlage: ein Reinforcement-Learning-Ansatz, der bereits in früheren OpenAI-Produkten wie Operator oder Deep Research steckt. Fragen und Ideen können so direkt in Taten übersetzt werden, etwa bei Recherchen, Formularen oder Slidedecks. ChatGPT greift dabei aktiv auf verschiedene Tools zu und wechselt nahtlos zwischen Reasoning und Ausführung.

Nutzungskontrolle und Sicherheit: Der Agent arbeitet, aber du entscheidest

Mit dem neuen Agent-System können Nutzer:innen ChatGPT erstmals aktiv beauftragen, Aktionen im Netz auszuführen. Damit verbunden ist ein deutlich höherer Anspruch an Sicherheit und Kontrolle. OpenAI hat laut eigenen Angaben deshalb bestehende Schutzmechanismen aus der Operator-Vorschau ausgebaut und zusätzliche Sicherheitsfunktionen ergänzt, um etwa Risiken durch erweiterten Zugriff oder Terminal-Funktionen gezielt zu minimieren. Bevor der Agent E-Mails verschickt oder Buchungen durchführt, holt er explizit eine Erlaubnis ein. Bei sensiblen Anwendungen wie Banking oder E-Mail greift ein zusätzlicher Watch Mode, der für jeden Schritt eine Bestätigung verlangt. Nutzer:innen können Aufgaben jederzeit stoppen oder unterbrechen.

Auch beim Thema Datenschutz wurde nachgeschärft: Die Speicherfunktion wurde temporär deaktiviert, um sogenannte Prompt-Injection-Angriffe zu erschweren. Zusätzlich analysiert ein Echtzeitmonitor Eingaben auf potenzielle Risiken, etwa im biologischen oder chemischen Kontext. Damit reagiert OpenAI auf typische Schwachstellen früherer Agentensysteme. Die Risikominimierung greift auf mehreren Ebenen:

Bei besonders sensiblen Anwendungen ist eine Schritt-für-Schritt-Bestätigung durch Nutzer:innen erforderlich. Abwehr riskanter Aufgaben: Aufgaben mit besonders hohem Risiko, etwa Finanztransaktionen oder rechtliche Eingriffe, lehnt der Agent konsequent ab.

Auch langfristig sollen Sicherheit und Transparenz zentral bleiben. Cookies orientieren sich an den Richtlinien der jeweiligen Website, lassen sich aber in den Einstellungen jederzeit löschen. Im Übernahmemodus, bei dem Nutzer:innen den ChatGPT Browser direkt steuern, bleiben alle Eingaben privat. Laut OpenAI wird nichts auf Servern gespeichert. Ein zusätzliches Bug-Bounty-Programm soll die Community dabei unterstützen, Schwachstellen im neuen Agent-Modell frühzeitig zu erkennen – bevor daraus reale Risiken werden.

Benchmarks zeigen: Das neue Modell ist leistungsfähig

Laut OpenAI erzielt das zugrunde liegende Modell des Agent deutliche Fortschritte: Beim anspruchsvollen KI-Test Humanity’s Last Exam erreicht es rund 42 Prozent – ein klarer Sprung im Vergleich zu früheren Versionen. Auch im Benchmark FrontierMath zu komplexen Matheaufgaben sowie in praxisnahen Szenarien wie DSBench und SpreadsheetBench zeigt das Modell starke Verbesserungen. Bei Aufgaben aus dem Investmentbanking-Bereich schneidet es ebenfalls deutlich besser ab als frühere OpenAI-Systeme.

Das ist nicht selbstverständlich: In den vergangenen Jahren hat OpenAI, berichtete TechCrunch, aber Player wie Google oder Perplexity immer wieder KI-Agents vorgestellt, die ähnliche Aufgaben versprachen. Doch viele dieser frühen Systeme taten sich mit komplexeren Abläufen schwer und blieben in der praktischen Anwendung oft hinter den Erwartungen zurück, die Produktverantwortliche mit ihren Ankündigungen erzeugten.

Auch auf strategischer Ebene liefern sich dieselben Player ein zunehmend intensives Rennen: Der bevorstehende Launch eines eigenen KI-Browsers durch OpenAI gilt als direkte Herausforderung für Google und Perplexity. Hinzu kommen Pläne für ein Open-Weight-Modell, eigene AI Hardware und ein anhaltender Wettbewerb um die klügsten Köpfe der Branche. Mehr zu diesen Entwicklungen findet ihr in unserem Hintergrundbericht zu den Browser Wars.

OpenAI Office in München, © OpenAI via Canva

Von der Idee zur Aktion: Wie der ChatGPT Agent agentische KI Realität werden lässt

Mit dem neuen Agent kann ChatGPT nicht nur Inhalte generieren, sondern auch konkrete Aufgaben umsetzen: Termine planen, Recherchen durchführen, Präsentationen bauen. Möglich wird das durch ein System, das auf klare Strukturen, Nutzer:innenkontrolle und Transparenz setzt.

Zwar sind viele Funktionen noch in der Betaphase und ganz perfekt läuft es auch noch nicht. Doch das Potenzial ist spürbar: automatisierte Abläufe, smarte Unterstützung und flexibel anpassbare Ergebnisse. Schritt für Schritt entwickelt sich ChatGPT vom reinen Sprachmodell zum verlässlichen digitalen Co-Worker.