Technologie
GPT-4 ist da: Das sind die ersten faszinierenden Einsatzmöglichkeiten

GPT-4 ist da: Das sind die ersten faszinierenden Einsatzmöglichkeiten

Niklas Lewanczik | 15.03.23

GPT-4 von OpenAI ist ein multimodales und hochfunktionales KI-Modell, das als Eingabe neben Text auch Bilder akzeptiert. Es versteht Humor, besteht Examen mit Bravour und kann eine handschriftliche Notiz in eine Website verwandeln. Hier kommen erste Anwendungsoptionen.

Es ist so weit: OpenAI hat das lang ersehnte Sprachmodell GPT-4 veröffentlicht. Dieses ist deutlich leistungsfähiger als GPT-3.5 und dürfte den Einsatz von Künstlicher Intelligenz im Alltag und in verschiedenen professionellen Szenarien revolutionieren. Aus der Demo von OpenAI geht bereits hervor, welch umfassende Möglichkeiten das Modell bietet. Wir stellen dir diese samt einigen praxisnahen Anwendungen vor.

OpenAI rüstet auf: GPT-4 folgt nach Launch der ChatGPT API – und ist bereits bei Bing integriert

Erst Anfang März hat OpenAI die neue ChatGPT API für Entwickler:innen vorgestellt. Diese Schnittstelle hat unter anderem Snapchat für den Chatbot My AI genutzt. Jetzt folgt die nächste große Nachricht aus den Häusern Microsoft und OpenAI: Das neuronale Netzwerk GPT-4 wird als hochfunktionale Nachfolgelösung für GPT-3.5 ausgerollt. Zwar hat auch diese noch Limitierungen, wie Greg Brockman, President und Co-Founder bei OpenAI, angibt. Doch das Potential ist immens.

So wird GPT-4 tatsächlich bereits als Basis für das Prometheus Model des neuen Bing genutzt, wie Jordi Ribas, Corporate Vice President bei Bing und Microsoft, bestätigt.

In diesem Kontext sorgt das Modell für eine revolutionäre Search-Erfahrung, eröffnet zugleich aber auch ganz neue Kreations-, Chat- und Compose-Möglichkeiten. Die Integration von einer OpenAI-KI bei Microsofts Diensten wie Bing sorgt seit Wochen für Furore und diverse neue Anwendungsszenarien – dazu zählt auch der Celebrity Mode, der die KI eine Berühmtheit im Chat imitieren lässt. Darüber hinaus können User mit der Bing AI bei Skype, über die Windows 11 Taskbar und neuerdings auch im Edge Browser interagieren. Sie haben beispielsweise die Möglichkeit, dank des neuen Create and Compose Copilots im Browser in der Sidebar mithilfe der Bing AI Drafts für Texte erstellen und sogar die Tonalität anpassen zu lassen. Außerdem ist der Chat mit der Bing-KI in diesem Bereich eine Option. Und auch der direkte Einbau des Drafts auf einer Seite oder zum Beispiel im Compose-Bereich auf LinkedIn ist möglich.

Bing Boom dank OpenAI

Microsoft und insbesondere Bing erleben dank der neuen KI-Funktionen in Kooperation mit OpenAI ein Hoch in Sachen Aufmerksamkeit und Nutzung. Dabei konnte die Suchmaschine, die hinter Google weltweit Platz zwei auf dem Search-Markt belegt, jüngst die Marke von 100 Millionen täglichen Besucher:innen knacken.

Doch auch fernab von Bing und Microsofts Diensten kann GPT-4 Erstaunliches leisten.


Über die Bing-KI und viele weitere AI-Entwicklungen spricht die Expertin Yvonne Teufel, CMO von Conversion Maker, in unserem Digital Bash Podcast. Sie liefert Tipps und ist sich sicher: „KI kann uns einfach nicht ersetzen.“


Das kann GPT-4 – auch dank Microsofts Supercomputer für hunderte Millionen US-Dollar

Auch OpenAI profitiert hinsichtlich des Traffics enorm von dem KI-Hype, den das Unternehmen mit ChatGPT selbst auslöste. Kürzlich konnte OpenAI sogar Bing hinsichtlich des Website Traffics erstmals überholen.

Dabei wurde der Launch von ChatGPT durch Kooperationspartner:in Microsoft begünstigt. Der Tech-Konzern hat zehntausende A100 Chips von Nvidia zusammengestellt und sogar Serveranpassungen vorgenommen, um einen Supercomputer bereitzustellen, der nach Konzernangaben mehrere hundert Millionen US-Dollar gekostet haben dürfte. Nidhi Chappell, Microsoft General Manager für die Azure AI Infrastructure, erklärte gegenüber Bloomberg, dass diese technische Grundlage erst den Launch von OpenAIs ChatGPT ermöglicht hat:

We built a system architecture that could operate and be reliable at a very large scale. That’s what resulted in ChatGPT being possible. That’s one model that came out of of it. There’s going to be many, many others.

Mit GPT-4 wird auch ChatGPT optimiert. OpenAI eröffnet den Zugang zum Modell via ChatGPT und über die API. Interessierte müssen sich aber, wie gewohnt, auf einer Warteliste eintragen; erste Entwickler:innen erhalten jedoch schon Zugriff. Dann können sie die vielen, teils ungeahnten, Möglichkeiten wahrnehmen und selbst testen, die das Unternehmen vorgestellt hat. Sechs Monate lang hat OpenAI daran gearbeitet, GPT-4 anzupassen und für den Launch vorzubereiten. Jetzt ist das Modell da und laut der Unternehmens-Website so leistungsfähig, dass es selbst komplexe Anfragen bearbeiten und sogar schwere Examen mit Bravour meistern kann. Auf der Website heißt es:

GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits human-level performance on various professional and academic benchmarks. For example, it passes a simulated bar exam with a score around the top 10% of test takers; in contrast, GPT-3.5’s score was around the bottom 10%. 

GPT-4 schlägt sich sehr gut, wenn es um Tests geht, © OpenAI
GPT-4 schlägt sich sehr gut, wenn es um Tests geht, © OpenAI

Zudem soll das Modell andere große Sprachmodelle in vielerlei Hinsicht übertreffen, auch in anderen Sprachkontexten als dem englischen:

In the 24 of 26 languages tested, GPT-4 outperforms the English-language performance of GPT-3.5 and other LLMs (Chinchilla, PaLM), including for low-resource languages such as Latvian, Welsh, and Swahili.

5 Beispiele für den erstaunlichen Einsatz von GPT-4

Was GPT-4 für Marketer, Privat-User und Co. in einem praxisnahen Kontext zu leisten imstande ist, zeigen einige Beispiele, die OpenAI vorgestellt hat. So kann das KI-Modell jetzt Bildeingaben verarbeiten und interpretieren – und versteht dabei auch Humor. So zeigte OpenAI dem Modell das folgende Bild mit der Frage und Aufforderung: „What is funny about this image? Describe it panel by panel.“

VGA-Adapter an Smartphone, Quelle: hmmm (Reddit) via OpenAI
VGA-Adapter an Smartphone, Quelle: hmmm (Reddit) via OpenAI

Als Antwort lieferte GPt-4 folgende Erklärung:

The image shows a package for a ‘Lightning Cable‘ adapter with three panels.

Panel 1: A smartphone with a VGA connector (a large, blue, 15-pin connector typically used for computer monitors) plugged into its charging port.

Panel 2: The package for the ‘Lightning Cable‘ adapter with a picture of a VGA connector on it.

Panel 3: A close-up of the VGA connector with a small Lightning connector (used for charging iPhones and other Apple devices) at the end.

The humor in this image comes from the absurdity of plugging a large, outdated VGA connector into a small, modern smartphone charging port.

Doch die Möglichkeiten gehen noch weit über die Bildanalyse hinaus. Mithilfe von GPT-4 können Nutzer:innen sogar eine kurze handschriftliche Notiz automatisiert in eine Website umwandeln, die von der KI erstellt wird.

Twitter User McKay Wrigley nennt die Option: „A glimpse into the future of computing.“ Doch damit nicht genug. GPT-4 kann dir ebenso dabei helfen, zu coden. Und selbst wenn dabei ein Fehler auftritt, kann die KI per Prompt über diesen informiert werden und sie identifiziert und bereinigt ihn. Der Marketing-Experte Tobias Eickelpasch hat diese Option auf LinkedIn zusammen mit weiteren Anwendungsszenarien vorgestellt und zeigt sich begeistert. Dabei dokumentiert er auch, dass GPT-4 dir sogar die Steuerklärung machen kann.

Das ist bereits eine sehr alltagstaugliche Unterstützung. Davon hat das Modell mehr zu bieten, wenn man es in verschiedenen Szenarien anwendet. So erklärt der CEO von DoNotPay, einem sozialen Netzwerk, das Hilfesuchenden in Rechtsfällen Support bietet, dass das Unternehmen GPT-4 nutzt und an sogenannten One-Click Lawsuits arbeitet, um gegen Spam-Anrufer:innen vorzugehen.

GPT-4 unterstützt indirekt noch mehr Menschen, die Hilfe benötigen. Die App Be My Eyes, die blinde und sehbeeinträchtigte Menschen mit anderen vernetzt und ihnen Support bietet, greift inzwischen ebenfalls auf das multimodale Modell zurück. So kann die App mit dem Virtual Volunteer ein Tool bereitstellen, das den Nutzer:innen diverse Bilder erklärt, Fragen dazu beantwortet und Echtzeithilfe anbietet.

Die Möglichkeiten sind extrem vielfältig – im Demovideo siehst du noch mehr

Die genannten Beispiele decken nur einen Bruchteil dessen ab, was GPT-4 – auch in Kombination mit ChatGPT oder Bing – zu leisten imstande ist. Die Einsatzmöglichkeiten erscheinen so vielfältig wie nie; und im Rahmen verschiedenster KI-Tools wird dieses Modell (gemeinsam mit anderen von Google, Meta und Co.) die Digitalbranche für immer verändern. Das wird sich auf das Marketing, auf die Bildung, den digitalen Alltag der Menschen schlechthin auswirken.

Noch hat GPT-4 wie das vorangegangene Modell Limitierungen, erklärt OpenAI:

Despite its capabilities, GPT-4 has similar limitations as earlier GPT models. Most importantly, it still is not fully reliable (it ‘hallucinates‘ facts and makes reasoning errors). Great care should be taken when using language model outputs, particularly in high-stakes contexts, with the exact protocol (such as human review, grounding with additional context, or avoiding high-stakes uses altogether) matching the needs of a specific use-case.

Und eine Videoeingabe, wie sie Andreas Braun, CTO Microsoft Germany und Lead Data & AI STU, kurz vor dem Launch angekündigt hatte, ist bisher noch keine Option. Wenn diese Möglichkeit hinzugefügt wird, dürfte das auch den Umgang von Künstlicher Intelligenz im Kontext sozialer Netzwerke wie TikTok und Instagram verändern. Die Demonstration des Potentials dieses Modells lässt Unternehmen wie User jedoch schon jetzt staunen. Das Demovideo des Unternehmens, in dem die Möglichkeiten visuell dargestellt werden, kannst du dir anschauen, um noch mehr über GPT-4 zu erfahren:

Noch mehr Basisinformationen zu GPT-4 findest du auf der dedizierten Website von OpenAI. Darauf schreibt das Unternehmen:

We look forward to GPT-4 becoming a valuable tool in improving people’s lives by powering many applications. There’s still a lot of work to do, and we look forward to improving this model through the collective efforts of the community building on top of, exploring, and contributing to the model.


OpenAI:

API für ChatGPT und Speech-to-Text für Whisper

OpenAI-Logo vor OpenAI-Hintergrund, © OpenAI via Canva
© OpenAI via Canva

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*