Technologie
App, Multimodalität und weniger Halluzinationen: Was sich User 2024 von Google Bard wünschen

App, Multimodalität und weniger Halluzinationen: Was sich User 2024 von Google Bard wünschen

Niklas Lewanczik | 02.01.24

Google sammelt Meinungen von Usern, um den KI-Bot Bard weiter zu verbessern und fragt aktiv nach Vorschlägen. Dabei möchten Nutzer:innen zunächst vor allem eins: eine Bard App.

Werfen wir einen Blick auf die Wunschlist für Google Bard im Jahr 2024, steht eine Option ganz oben: eine App. Google möchte die eigene KI-Assistenz zu einem zentralen Player im Digitalraum machen, hinkt der Konkurrenz von Microsoft und OpenAI aber noch etwas hinterher. Erst im Sommer 2023 kam Google Bard nach Deutschland – lange nach ChatGPT und dem Bing Chat (jetzt Copilot). Und während OpenAI die ChatGPT App mit Features wie dem DALL-E 3 Support oder Voice und Image Interactions stetig optimiert, setzt auch Microsoft auf die mobile Funktionalität der umfassenden KI-Assistenz Copilot. Jüngst wurde eine App bereitgestellt, die GPT-4 und DALL-E 3 Support und zahlreiche Möglichkeiten liefert. Auf eine Bard App müssen die User weiterhin warten, doch Google bemüht sich um die breit gefächerte Verbesserung des KI-Bots und zieht dafür das Feedback der User zurate. Vor allem das neue KI-System Gemini soll Bard im AI-Wettbewerb nach vorne bringen.


Copilot App von Microsoft ist da:

DALL-E 3 und GPT-4 Support

© Microsoft, Microsoft Copilot Titelbild, Logo und Text
© Microsoft


Von der App bis zum PDF Upload: User geben Wünsche für Bard an

Auf Reddit und X haben Team-Mitglieder von Google um Feedback für die Entwicklung von Bard gebeten und quasi eine Wunschliste für 2024 eröffnet. Von diesem Bestreben berichtet auch Abner Li auf 9to5google. Auf Reddit, der Community für Communities, fragte Produkt-Manager Chris Gorgolewski kürzlich nach Wünschen für die KI-Assistenz. Die Reddit User gaben diverse Wünsche an. So ist eine App besonders hoch im Kurs, bessere Code-Generierungsoptionen werden ebenso gefordert wie weniger Halluzinationen. Darüber hinaus wünschen sich die User eine Integration in den Google Assistant und den Support der neuen KI-Systems Gemini (Ultra). Die beiden letzteren Punkte wird Google auf jeden Fall umsetzen, wie aus den Blog Posts von Vice President Sissie Hsiao hervorgeht.

Einige der auf Reddit geäußerten Wünsche wiederholen sich auch auf X. Dort hat Googles Jack Krawczyk aus dem Bard Team vier relevante nachgefragte Features aufgelistet und nach einer weiteren Option gefragt.

Demnach wünschen sich User mehr Kontrolle über Halluzinationen vonseiten Bards und beispielsweise auch mehr multimodale Funktionen. Im Kern steht zudem der Launch einer dedizierten App. Auch ein Code Interpreter (wie ihn der Copilot und ChatGPT liefern können) wünschen sich manche User, zudem soll die Memory-Funktion optimiert werden. Die KI-Expertin Dr. Marie Haynes liefert im Thread auf X zudem noch die Optionen, PDFs bei Bard hochladen zu können, längere Kontextfenster zu erhalten und die Konversationen auf eigenen Seiten für eine etwaige Fortführung einbetten zu können.

Viele der Verbesserungen wird Google womöglich früh im Jahr 2024 versuchen umzusetzen. Vor allem eine dedizierte Bard App sollte möglichst schnell bereitgestellt werden, um insbesondere im Mobile-Kontext nicht weiter an Boden gegenüber der Konkurrenz zu verlieren. Der Assistant mit Bard Support soll indes schon bald bereitstehen.

Bard-Optimierung läuft seit Monaten: YouTube-Analyse, Code-Generierung, Chats teilen und Kombination mit anderen Google-Diensten

Seit dem Launch von Google Bard wurde der KI-Bot bereits vielfach und umfassend verbessert. Inzwischen haben User unter anderem die Möglichkeit, den Bot in Kombination mit Diensten wie Maps, YouTube, Drive und Gmail zu nutzen. Yury Pinsky, Director, Product Management Bard bei Google, erklärt:

Wenn ihr zum Beispiel eine Gruppenreise zum Grand Canyon plant (ein Projekt, das normalerweise viele Browser-Tabs in Anspruch nimmt), könnt ihr Bard jetzt bitten, die passenden Termine für alle aus Gmail herauszusuchen, Flug- und Hotelinformationen in Echtzeit abzurufen, Google Maps-Wegbeschreibungen zum Flughafen anzuzeigen und sogar YouTube-Videos mit Aktivitäten vor Ort vorzuschlagen – und das alles in einer einzigen Unterhaltung.

Google kann über Bard einen ganzen Trip planen, dank der Kombination der Dienste, © Google, GIF verschiedene Dienste, Prompting bei Bard, Bilder und Texte
Google kann über Bard einen ganzen Trip planen, dank der Kombination der Dienste, © Google

Auch das öffentliche Teilen von Chats sowie die Prüfung bestimmter Antworten (die gerade bei Halluzinationen sinnvoll ist) sind den Usern ermöglicht worden.

So sieht das neue Prüfungs-Feature für Bard-Antworten aus, © Google, Texte, markiert, farblich, in Bard-Konversation, Icons, grauer Hintergrund

So sieht das Prüfungs-Feature für Bard-Antworten aus, © Google

Über Bard können sich User inzwischen auch detailliert mit YouTube-Videos auseinandersetzen, müssen diese also nicht ansehen, um die darin enthaltenen Inhalte in Erfahrung zu bringen. Der KI-Bot versteht YouTube-Videos und User-Anfragen jetzt besser und wird insgesamt vor allem dank des mächtigen KI-Systems Gemini noch leistungsfähiger. Dieses stellte Google im Dezember 2023 vor. Bard ist jetzt mit Gemini Pro in über 170 Ländern und Regionen auf Englisch verfügbar. 2024 soll Bard Advanced mit Gemini Ultra noch komplexere Aufgaben lösen können. Demis Hassabis, CEO und Co-Founder von Google DeepMind, erklärt im Namen des Gemini Teams:

[…] Gemini wurde von Anfang an multimodal konzipiert, was bedeutet, dass es verschiedene Arten von Informationen – wie Text, Code, Audio, Bilder und Video – generalisieren und nahtlos verstehen, verarbeiten und kombinieren kann.

Im Rahmen der Gemini-Fähigkeiten können Nutzer:innen mit Bard noch viel mehr erreichen. Jack Krawczyk hat vor Kurzem bereits Beispiele wie die Spieleentwicklung, das Kreieren interaktiver Geschichten und das dedizierte Abrufen von Expert:innenwissen über bestimmte Prompts vorgestellt. Wir haben dir die Einsatzoptionen zusammengestellt.


Google Bard:

5 Einsatzmöglichkeiten des neuen KI-Modells Gemini

© Mojahid Mottakin - Unsplash, Google Bard Icon, verschwommen, schwarzer Hintergrund
© Mojahid Mottakin – Unsplash

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*