Dein wichtigster Touchpoint zur Digitalbranche.
Dein wichtigster Touchpoint zur Digitalbranche.
Technologie
Sreensharing, Video, Voice-Interaktion: Mega-Update für ChatGPT Advanced Voice Mode
ChatGPT App: Video- und Screensharing-Optionen, © OpenAI (via Canva)

Sreensharing, Video, Voice-Interaktion: Mega-Update für ChatGPT Advanced Voice Mode

Larissa Ceccio | 13.12.24

ChatGPT bringt Video- und Screensharing auf dein Handy – entdecke, warum das die Art, wie du mit KI arbeitest, verändert.

Pünktlich zu den Feiertagen rollt OpenAI neue Funktionen in der ChatGPT App aus, die das Nutzungserlebnis revolutionieren könnten.

Was bedeutet das für Nutzer:innen? Und wie können Unternehmen und Bildungseinrichtungen davon profitieren? Wir haben die wichtigsten Neuerungen zusammengefasst.


Content-Kalender 2025:
Dein kreativer Turbo für die Digitalwelt

Sichere dir den ultimativen Planungshelfer für deine Social-Media-Strategie. Mit unserem Kalender für 2025 behältst du alle wichtigen Termine und Trends im Blick – von Feiertagen über internationale Kampagnentage bis hin zu kreativen Content-Ideen.

  • 💡 Inspiration für jeden Tag: Nie wieder Content-Flaute!
  • 🗓️ Trends & Feiertage integriert: Bleibe immer up-to-date.
  • 🚀 Ein Must-have für alle Marketer: Maximiere deine Reichweite und Engagement.

📥 Jetzt kostenlos herunterladen und einen Schritt voraus sein!

Content-Kalender 2025
Content-Kalender 2025 von OnlineMarketing.de, eigenes Design via Canva erstellt


Was sind die neuen Funktionen?

OpenAI erweitert die mobile ChatGPT App um Video- und Screensharing-Optionen. Mit der Advanced Voice-Funktion können Nutzer:innen ab sofort in Echtzeit über Video und Sprache mit ChatGPT interagieren. Das bedeutet:

  • Videoanrufe in Echtzeit: Kommuniziere mit ChatGPT auf einer neuen Ebene.
  • Screensharing für Live Feedback: Teile deinen Bildschirm und erhalte direktes Feedback zu Dokumenten, Präsentationen oder anderen Inhalten.

Diese Funktionen sind in der neuesten Version der ChatGPT App verfügbar und bieten eine intuitive Erweiterung für Nutzer:innen, die schnell und effizient mit KI zusammenarbeiten wollen.

Wer hat Zugriff?

Die neuen Features werden schrittweise ausgerollt. Hier sind die Details:

  • Jetzt verfügbar für Team-Mitglieder und die meisten Plus- und Pro-Abonnent:innen weltweit.
  • Bald verfügbar in der EU, der Schweiz, Island, Norwegen und Liechtenstein – hier ist ein separater Roll-out geplant.
  • Ab Anfang 2025 werden Enterprise- und Edu-Nutzer:innen ebenfalls Zugang erhalten.

Für Nutzer:innen im Bildungs- und Unternehmensumfeld könnten diese Funktionen insbesondere in hybriden Arbeits- und Lern-Settings bahnbrechend sein.

Ein weihnachtliches Extra: Die Santa Claus-Stimme

Ein weiteres Highlight in der App ist die neue Santa Claus-Stimme. Laut dem Social-Media-Experten Radu Oncescu sorgt diese Funktion für ein spielerisches Erlebnis – perfekt, um Kinder zu unterhalten oder die Feiertagsstimmung in den digitalen Alltag zu bringen.

Auf Threads ansehen

Warum ist das spannend für Online Marketing?

Diese Neuerungen bieten auch für Marketer spannende Möglichkeiten:

  1. Verbesserte Produktdemos: Screensharing ermöglicht es, Produkte und Dienstleistungen direkt in der App zu präsentieren.
  2. Persönlichere Kommunikation: Mit Video- und Sprachinteraktionen können Bots künftig menschlicher wirken und Kund:innen auf persönlichere Weise ansprechen.
  3. Effiziente Teamarbeit: Die neuen Funktionen können Team Meetings und Brainstormings mit KI nahtlos integrieren.

Konkurrenz im Blick: Google Gemini 2.0

Google macht OpenAI mit Gemini 2.0 Konkurrenz, da die Google-KI ebenfalls seit neuestem eine Video- und Screensharing-Funktionen bietet, die den Anwendungsbereich der KI erheblich erweitern. Mit Gemini 2.0 können Nutzer:innen den Bildschirm teilen, visuelle Inhalte zeigen und diese direkt von der KI analysieren lassen, ähnlich wie bei den neuen Funktionen im Advanced Voice-Modus von ChatGPT. Beide Modelle setzen auf multimodale Interaktionen, die Text, Sprache, und visuelle Daten kombinieren, um ein nahtloses und intuitives Nutzer:innenerlebnis zu schaffen.

Während ChatGPT den Fokus auf Echtzeitkommunikation über Videoanrufe und direkte Rückmeldungen legt, erweitert Gemini mit Googles neuem KI-Modell das Konzept durch die Möglichkeit, auch Kameraaufnahmen und komplexe visuelle Inhalte in die Analyse einzubinden. Dadurch bietet Gemini 2.0 nicht nur vergleichbare, sondern in bestimmten Szenarien auch umfassendere Optionen, was es zu einer ernstzunehmenden Alternative macht.


Gemini 2.0:
So kannst du Googles Mega-KI-Modell testen

Gemini 2.0-Schriftzug vor dunkelblauem Hintergrund
© Google via Canva


Und noch weitere KIs dürften eine Konkurrenz für ChatGPT in diesem Kontext sein: Das KI-Modell Claude 3.5 Sonnet von Anthropic bietet etwa die Funktion Computer Use, mit der die KI Aufgaben auf dem Computerbildschirm ausführen kann, wie das Bewegen des Cursors, Tippen von Text und Durchführen von Web-Suchen. Diese Funktion ermöglicht es Claude, direkt mit der Benutzer:innenoberfläche zu interagieren und Aufgaben autonom zu erledigen. Nvidia hat mit Maxine eine Plattform entwickelt, die KI-basierte Verbesserungen für Videokonferenzen bietet. Dazu gehört die Verwendung von KI-Modellen wie vid2vid cameo, die es ermöglichen, Videoinhalte in Echtzeit zu generieren und zu modifizieren, um die Qualität und Effizienz von Videokommunikation zu steigern.

Auch klassische Video-Apps wie Zoom stehen im Wettbewerb mit KI-Systemen wie GPT-4o und o1 oder Gemini 2.0, insbesondere im Unternehmenskontext. Zoom hat die eigene Plattform mit Funktionen wie Live-Transkriptionen, automatischen Meeting Highlights und der Integration von KI-Tools wie Zoom IQ erweitert, die den Arbeitsalltag erleichtern sollen. Während Zoom traditionell auf Videokonferenzen spezialisiert ist, rücken durch KI-Unterstützung Features wie Echtzeitanalysen, Empfehlungen für nächste Schritte und Content-Erstellung in den Fokus. Dennoch fehlen solchen Plattformen oft die multimodalen Fähigkeiten und die direkte Interaktivität von KI-Systemen wie GPT-4o und o1, was sie in spezifischen Szenarien weniger flexibel macht. Trotzdem bleibt Zoom für Unternehmen mit Fokus auf professionelle Kommunikation und Kollaboration eine etablierte Wahl.

Diese Entwicklungen zeigen, dass mehrere Unternehmen daran arbeiten, KI-Systeme mit erweiterten Video- und Interaktionsfunktionen bereitzustellen, die den Usern neue Möglichkeiten in der digitalen Kommunikation eröffnen.

Wie kannst du die Features nutzen?

Um die neuen Funktionen auszuprobieren, müssen Nutzer:innen lediglich die ChatGPT App aktualisieren. Die Nutzung ist intuitiv:

  • Aktiviere die Advanced Voice-Funktion im App-Menü.
  • Starte einen Videoanruf oder teile deinen Bildschirm direkt aus der App heraus.

Video- und Screensharing: Ein Gamechanger für ChatGPT?

Die Integration von Video- und Screensharing in die ChatGPT App zeigt, wie KI-Anwendungen zunehmend in den Alltag integriert werden. Besonders für Unternehmen und Bildungseinrichtungen könnten die neuen Features eine Revolution darstellen. Und mit der Santa Claus-Stimme ist sogar für ein bisschen Spaß gesorgt.

ChatGPT ist nicht nur in der mobilen App aktiv. Wusstest du schon, dass Apple User ChatGPT nahtlos über Siri und Shortcuts integrieren können? In unserem Artikel zur Apple-Integration von ChatGPT erfährst du mehr darüber, wie diese Funktion deinen Alltag erleichtern kann.


Von down zu wow:
ChatGPT beeindruckt mit Apple-Integration

Smartphone in Hand mit ChatGPT-Schriftzug, OpenAI-Grafik im Hintergrund
© Mojahid Mottakin – Unsplash

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*