Technologie
Meilenstein der KI-Entwicklung und neue Ära: Google stellt mächtiges KI-System Gemini vor

Meilenstein der KI-Entwicklung und neue Ära: Google stellt mächtiges KI-System Gemini vor

Niklas Lewanczik | 07.12.23

Das KI-Modell gilt als GPT-4-Konkurrenz, soll Milliarden von Menschen über diverse Produkte zugänglich gemacht werden und kann Informationen aus unterschiedlichen Quellen wie Text, Bild, Audio, Video und Programmiersprachen interpretieren. Auch der Einsatz im Kontext von neuen KI-Supercomputern ist geplant.

Google tritt in eine neue Ära ein und setzt mit dem Launch des bisher größten und leistungsfähigsten KI-Modells Gemini einen neuen Meilenstein. Googles und Alphabets CEO Sundar Pichai schreibt der KI-Entwicklung im Blog Post zum Launch eine immense Bedeutung für unser aller Leben zu:

[…] Ich glaube, dass der Wandel, den wir gerade mit KI erleben, der tiefgreifendste in unserem Leben sein wird, weitaus größer als die Umstellung auf das Mobiltelefon oder das Internet zuvor. KI hat das Potenzial, den Menschen überall auf der Welt Möglichkeiten zu eröffnen – vom Alltäglichen bis zum Außergewöhnlichen. Sie wird neue Wellen der Innovation und des wirtschaftlichen Fortschritts auslösen und Wissen, Lernen, Kreativität und Produktivität in einem Ausmaß vorantreiben, wie wir es noch nie zuvor gesehen haben […].

Nachdem wir vor kurzem noch über eine geplante Verschiebung der Gemini-Veröffentlichung berichtet haben, sehen wir uns berichtigt: Google hat Gemini 1.0 für die Größen Ultra, Pro und Nano optimiert und wird das Modell für diverse Google-Produkte und -Plattformen bereitstellen – sodass Milliarden von Menschen darauf zugreifen können. So ist beispielsweise der KI-Bot Bard jetzt mit Gemini Pro in über 170 Ländern und Regionen auf Englisch verfügbar. Im kommenden Jahr soll Bard Advanced mit Gemini Ultra noch komplexere Aufgaben lösen können.

Damit ist Bard schon jetzt leistungsfähiger als je zuvor.

Google macht Bard leistungsfähiger:

Bild-Upload, Maps-Verknüpfung und neue Funktionen auf Deutsch verfügbar

Google Bard Übersicht mit Logos von Google
© Google


Gemini, das insbesondere mit dem KI-Modell GPT-4 von OpenAI konkurrieren wird, hat auf verschiedenen Ebenen vieles zu bieten. Es soll auch 20 neue KI-Funktionen für das Pixel 8 Pro und weitere Modelle der Pixel-Familie liefern. Zudem plant Google, Gemini in den kommenden Monaten für weitere Kernprodukte und -dienste einzuführen, darunter Search, Ads, Chrome und Duet AI. Und künftig soll das Modell für die KI-Workloads der nächsten Generation eingesetzt werden: KI-Hypercomputer und TPU v5p.



Was Gemini alles kann

Demis Hassabis, CEO und Co-Founder von Google DeepMind, erklärt im Namen des Gemini Teams:

Gemini ist das Ergebnis umfangreicher gemeinsamer Arbeit von verschiedenen Teams bei Google, einschließlich unserer Kolleg:innen bei Google Research. Gemini wurde von Anfang an multimodal konzipiert, was bedeutet, dass es verschiedene Arten von Informationen – wie Text, Code, Audio, Bilder und Video – generalisieren und nahtlos verstehen, verarbeiten und kombinieren kann.

Laut Google ist Gemini Ultra das leistungsstärkste und größte Modell für hochkomplexe Aufgaben, Gemini Pro wiederum auf die Skalierung eines breiten Aufgabenspektrums zugeschnitten und Gemini Nano ist das effizienteste Modell für den Einsatz auf Endgeräten. Das Pixel 8 Pro ist das erste Smartphone, auf dem Gemini Nano läuft. 

Künstliche Intelligenz soll sich laut Hassabis wie eine helfende Instanz, eine Assistenz anfühlen. Und Google arbeitet darauf hin, dass Milliarden von Menschen diese helfende Instanz in diversen Diensten des Unternehmens einsetzen können. Auf dem Blog The Keyword Deutschland demonstriert das Unternehmen die Leistungsfähigkeit im Rahmen verschiedenster Anforderungen aus den Bereichen Mathematik, Coding, Videoverständnis, Allgemeines und dergleichen mehr.

Die Fähigkeiten von Gemini Ultra und GPT-4 in spezifischen Aufgabenkontexten, © Google, Liste mit Zahlen und Texten
Die Fähigkeiten von Gemini Ultra und GPT-4 in spezifischen Aufgabenkontexten, © Google

Das neue KI-Modell soll aber nicht nur einige Aufgaben übernehmen und Personen als Assistenz unterstützen können, wie es Bard, Duet AI und Co. schon ermöglicht haben. Vielmehr soll Gemini komplexe Sachverhalte analysieren können. Die Erklärung mathematischer Probleme, die Analyse literarischer Texte und die Generierung, Interpretation und Erklärung von Code in Programmiersprachen ist ebenfalls möglich.

Entwickler:innen und Unternehmen werden ab dem 13. Dezember über verschiedene Schnittstellen die Möglichkeit erhalten, mit Gemini zu arbeiten.

Eine Stufe weiter: Gemini ist der Startpunkt für Supercomputer, KI-Roboter und Software Agents

Im Gespräch mit Will Kent, der für WIRED über KI-Entwicklungen schreibt, erklärte Demis Hassabis, dass das multimodale Modell Googles als Grundstein für die Weiterentwicklung hochfunktionaler Software Agents dienen wird. Darüber hinaus biete es einen enormen Schritt im Bereich der Planung und des Verständnisses von Aufgaben (was Kent mit der Super-KI Q* vergleicht, an der OpenAI arbeitet) und könne für große Gameplay-Entwicklungen sowie die Integration von physischen Robotern mit Künstlicher Intelligenz genutzt werden.

Auf dem Google Blog schreibt Hassabis:

[…] Schon als Teenager habe ich KI für Computerspiele programmiert und habe später als Neurowissenschaftler versucht, die Funktionsweise des Gehirns zu verstehen – und schon damals war ich immer der Meinung, dass wir intelligentere Maschinen bauen und sie auf ganze neue Art zum Nutzen der Menschheit einsetzen können.

Google unterstützt Gemini mit den selbst entwickelten Tensor Processing Units (TPUs) v4 und v5e, die als KI-Beschleuniger bezeichnet werden. Für das Training modernster KI-Modelle kommt bald zudem ein noch leistungsstärkeres TPU-System: Cloud TPU v5p. Zusammen mit den eigenen Supercomputern wird Google die KI dann noch umfassender optimieren und einsetzen können. So kündigt Google auch das System Cloud KI-Hypercomputer an, eine Supercomputer-Architektur, die ein integriertes System aus leistungsoptimierter Hardware, offener Software, führenden ML-Frameworks und flexiblen Nutzungsmodellen verwendet. KI-Hypercomputer basiert als System auf einem Codesign auf Systemebene, um die Effizienz und Produktivität beim KI-Training, -Tuning und -Service zu steigern.

Beim Einsatz der KI möchte Google auf verschärfte Kontrolle setzen. Neben den KI-Richtlinien kommen neue Sicherheitsmaßnahmen in Abstimmung mit externen Expert:innen hinzu. Auch Sicherheitsfonds wie das Frontier Model Forum sollen den sicheren Einsatz der KI gewährleisten.

AI-Entwicklungen mit großen Auswirkungen

Der Launch von Gemini wird die AI-Szene und die Digitallandschaft nachhaltig verändern. User von Google-Diensten dürfen sich über immensen Support bei Aufgaben freuen, Entwickler:innen erhalten mehr Unterstützung und Marketer können die KI-Tools Googles in unterschiedlichsten Szenarien einsetzen.

Derweil nimmt die KI-Entwicklung auch andernorts ihren Lauf. Meta beispielsweise stellte kürzlich ein neues KI-Übersetzungsmodell sowie ein neues Foundation Research Model für die Audiogenerierung im KI-Kontext vor.

OpenAI wiederum verzückte User vor kurzem mit der Verfügbarmachung von ChatGTP Voice für alle Nutzer:innen. Und CEO Sam Altman ist jüngst vom TIME Magazine zum CEO des Jahres gekürt worden.

Der KI-Wettbewerb ist immens und wir dürfen und müssen uns auf noch mehr bahnbrechende Veränderungen einstellen. Die nächste dürfte angesichts des Wettbewerbs und der auch finanziellen Chancen für Tech-Konzerne nicht allzu lange auf sich warten lassen.


Googles Duet AI:

Das alles kann die Konkurrenz von ChatGPT und Copilot

© Google via Canva, Google Duet AI Übersicht mit App und Screen
© Google via Canva

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*