Technologie
„Die meistgeforderte Funktion überhaupt“: Gemini App unterstützt jetzt endlich Audio

„Die meistgeforderte Funktion überhaupt“: Gemini App unterstützt jetzt endlich Audio

Larissa Ceccio | 09.09.25

Mit dem neuesten Update erfüllt Google einen der größten Wünsche der Nutzer:innen: Die Gemini App kann nun Audiodateien verarbeiten. Außerdem werden neue Sprachoptionen und vielseitige Berichts-Tools eingeführt, die mehr Flexibilität für Creator und Unternehmen bieten.

Die Wünsche vieler Nutzer:innen standen schon länger im Raum. Jetzt liefert Google: Die Gemini App unterstützt endlich Audiodateien. Gleichzeitig führt die Google-Suche dank Gemini 2.5 fünf neue Sprachoptionen ein, und NotebookLM erstellt Berichte in über 80 Sprachen – auf Wunsch sogar als Blogpost, Lernkarte oder Briefing.



Google legt endlich offen:
So viele kostenlose KI-Abfragen gibt es bei Gemini

Gemini-Schriftzug, dunkler Hintergrund, bunte Symbole wie ein Stern
© Google via Canva


Audiodateien für Gemini: Von der Community lange gefordert

Josh Woodward, Vice President of Product Management bei Google Labs und verantwortlich für die Gemini App, bezeichnete die Unterstützung von Audiodateien auf X als „die meistgeforderte Funktion überhaupt“.

Nutzer:innen können nun bis zu zehn Minuten Audio im Free-Modus hochladen, während AI Pro- und AI Ultra-Abonnent:innen mit drei Stunden deutlich mehr Spielraum erhalten. Das Format ist flexibel: Bis zu zehn Dateien lassen sich gleichzeitig verarbeiten, auch ZIP-Dateien sind möglich.

Für Content Creator, Journalist:innen oder Unternehmen ist das ein spürbarer Fortschritt. Interviews, Podcasts oder lange Sprachmemos können direkt in Gemini hochgeladen und analysiert werden. Bisher war das nur über Umwege oder mit anderen Tools machbar.

NotebookLM und neue Sprachoptionen: Mehr Flexibilität für Inhalte und Suche

Das auf Gemini basierende Tool NotebookLM entwickelt sich ebenso weiter. Nutzer:innen können inzwischen hochgeladene Dokumente nun in zahlreiche Formate umwandeln – von Blog-Artikeln über Lernmaterialien bis hin zu Quizzen oder Lernkarten.

Mit dem aktuellen Update, das laut einem Post von NotebookLM bereits ausgerollt wird und bis Ende der Woche zu 100 Prozent verfügbar sein soll, lassen sich Struktur, Stil und Ton individuell anpassen. Inhalte können je nach Zielgruppe sachlich und faktenorientiert oder locker und erzählerisch aufbereitet werden. Aktuell steht die neue Funktion allerdings nur im Web zur Verfügung, wie das NotebookLM Team auf X bestätigte.

Neu ist außerdem ein Language Picker für über 80 Sprachen sowie dynamische Themenvorschläge, die auf den hochgeladenen Quellen basieren. Importieren Nutzer:innen beispielsweise wissenschaftliche Studien, schlägt NotebookLM automatisch ein White Paper vor. Laden sie Nachrichtenartikel hoch, empfiehlt das Tool kompakte Erklärformate. Zudem individualisieren Nutzer:innen die Prompts für Berichte vollständig und nutzen mit den neuen Blogpost-Vorlagen erstmals einen Standardreport, der sich besonders für Content- und Marketingteams eignet. Diese Flexibilität macht NotebookLM sowohl für Bildungseinrichtungen als auch für Unternehmen, Journalist:innen und Creator interessant, die Informationen für unterschiedliche Zielgruppen aufbereiten möchten.

Parallel hat Google mit Gemini 2.5 die Suche erweitert: Fünf neue Sprachoptionen – Hindi, Indonesisch, Japanisch, Koreanisch und brasilianisches Portugiesisch – ermöglichen es nun deutlich mehr Menschen, komplexe Fragen in ihrer eigenen Sprache zu stellen und KI-generierte Antworten zu erhalten. Vor Kurzem kamen außerdem die Videogenerierung mit Google Vids für Gemini Free User und die Integration von Veo 3 in Google Photos.



180 neue Länder:
Googles AI Mode wird umfassend ausgerollt

Gooels AI Mode, Kreis in Google-Farben, Häkchen darin, Ask anything-Schriftzug und dunkler Hintergrund
© Google via Canva


Warum Google das Innovationstempo erhöht

Google hat in kurzer Zeit mehrere größere Updates veröffentlicht. Diese Schlagzahl fällt zeitlich mit wachsendem Druck auf das Unternehmen zusammen, auch wenn die Entwicklungen nicht zwingend miteinander verbunden sind. In Europa hat die EU-Kommission eine Milliardenstrafe verhängt. In den USA muss Google laut einem Urteil zwar Chrome nicht verkaufen, aber Such- und Nutzungsdaten mit Wettbewerber:innen teilen und auf exklusive Deals verzichten.

Parallel gibt es Spekulationen, ob der AI Mode in der Google-Suche künftig automatisch aktiviert werden könnte. Bestätigt ist das bisher nicht. Robby Stein, Director of Product Management bei Google, betonte, dass man sich vorerst auf einen einfacheren Zugang zu KI-Funktionen konzentriere. Eine verpflichtende Aktivierung stehe derzeit nicht auf der Agenda.

Unabhängig von diesen regulatorischen Debatten entwickeln sich die neuen Funktionen zu einem vielseitigen Arbeitsinstrument für Content, Recherche und Kommunikation und positionieren Gemini stärker gegen OpenAI und andere Wettbewerber:innen. Für Unternehmen, Creator und Bildungseinrichtungen entstehen neue Möglichkeiten – von der schnellen Audiotranskription bis zu personalisierten Lernformaten. Vor allem aber zeigen die Updates: Google legt das Fundament für eine Zukunft, in der KI selbstverständlich Teil des Arbeitsalltags ist.

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*