Technologie
AI-Sprachrevolution: Gemini lässt dich PDFs in Podcasts verwandeln und ElevenLabs bringt legendäre Stimmen

AI-Sprachrevolution: Gemini lässt dich PDFs in Podcasts verwandeln und ElevenLabs bringt legendäre Stimmen

Caroline Immer | 13.11.25

Google und ElevenLabs haben den Launch neuer KI-basierter Voice Features angekündigt. User können Gemini Live schneller sprechen lassen und PDFs in Podcast-Form hören, während Brands auf Stimmen legendärer Personen zurückgreifen können.

Bei Gemini Live handelt es sich um eine Funktion in der Gemini App, die es Usern ermöglicht, hands-free per Voice Chat mit der KI zu kommunizieren. Seit gut einem Jahr ist Gemini Live auch auf Deutsch verfügbar. Und jetzt hat das Feature das größte Update aller Zeiten erhalten. Gemini Live soll klüger, ausdrucksstärker und flexibler werden.


Die Updates sollen dafür sorgen, dass sich die Konversationen mit Gemini Live für die User natürlicher anfühlen, erklärt Google. Konkret verfügt das Tool neuerdings über die folgenden Kapazitäten:

  • die Sprachgeschwindigkeit anpassen, um schneller oder langsamer zu sprechen
  • verschiedene Personas verkörpern (etwa eine:n Sportkommentator:in oder auch historische Persönlichkeiten wie Julius Cäsar)
  • mitten im Satz die Sprache wechseln, beispielsweise von Englisch zu Französisch
  • mit einem Akzent sprechen, zum Beispiel mit dem eines Cowboys

Das Modell-Update für Gemini Live ist ab sofort für Android und iOS verfügbar.

ElevenLabs: Ikonische Stimmen für deine Kampagnen

Auch das AI-Unternehmen ElevenLabs hat spannende Neuerungen im Bereich Audio verkündet, die insbesondere Brands interessieren dürften. Letztere können über einen neuen Marketplace jetzt auf autorisierte KI-Stimmen legendärer Persönlichkeiten, darunter Sir Michael Caine, Liza Minnelli und Dr. Maya Angelou, zugreifen. Caines Stimme wird darüber hinaus auch via ElevenReader zur Verfügung gestellt, einer App zum Anhören von Hörbüchern und Artikeln. Die AI Voice Tools von ElevenLabs können Creator und Unternehmen seit einigen Monaten auch mobil nutzen.


Keine Lust, lange PDFs zu lesen? Google schafft Abhilfe

Besonders praktisch für Arbeitnehmer:innen, Student:innen und alle Personen, die häufig PDFs lesen, sind die neuen KI-gestützten Audioübersichten in Google Drive. Mithilfe von Gemini kannst du jetzt lange – zunächst nur englischsprachige – Textdateien (beispielsweise Berichte, Verträge oder Meeting-Transkriptionen) in eine Audiozusammenfassung im Podcast-Stil umwandeln. Dabei setzt Google auf die gleiche Technologie, wie sie auch beim populären Audio Overview Feature in NotebookLM zum Einsatz kommt.

Audioübersicht erstellen mit Gemini
Audioübersicht erstellen mit Gemini, © Google

Die Funktion soll, so Google, die Effizienz steigern, für mehr Barrierefreiheit sorgen und die Nutzer:innen dabei unterstützen, sich unterwegs auf Meetings oder Präsentationen vorzubereiten. Sobald die Audioübersicht erstellt ist, erhältst du eine Benachrichtigung per Mail und kannst auf die Datei über den Audio Overviews-Ordner in Drive zugreifen – mobil oder per Desktop.

Mit dieser Neuerung bietet Google den Usern eine zeitsparende Möglichkeit, wichtige Informationen zu erfassen und macht sich auch die wachsende Popularität von Podcasts zunutze. Auch Threads will letztere jetzt stärker in den Fokus rücken und bringt Podcasts in den Feed – mit Profil-Link, Previews und bald auch neuen Insights. 



Threads macht Podcasts jetzt zum Gesprächsthema

© Threads via Canva

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*