Dein wichtigster Touchpoint zur Digitalbranche.
Dein wichtigster Touchpoint zur Digitalbranche.
Technologie
KI-Tool-Update: Voice-Design, Image Editor von Midjourney und CapCuts AI Voice mit Emotionen

KI-Tool-Update: Voice-Design, Image Editor von Midjourney und CapCuts AI Voice mit Emotionen

Niklas Lewanczik | 24.10.24

Midjourneys Image Editor und Image Re-Texturing faszinieren KI-User, doch auch CapCut, Google und Co. liefern nützliche neue Tools. Du kannst dir zum Beispiel eine eigene Stimme per Text-Prompt für deine Inhalte kreieren.

The age of AI is upon us!

Diese Aussage kommt von Microsoft CEO Satya Nadella und stammt bereits von Anfang 2023. Heute befinden wir uns längst in einer Zeit und einer Digitalwelt, die von generativer KI beherrscht wird. Werbelösungen wie Performance Max von Google oder Smart+ von TikTok setzen auf Gen AI, Creator müssen sich mit KI-Avataren messen, die Kommunikation wird ebenso wie das Entertainment auf diversen Plattformen von KI unterstützt und mit dem aktuellsten Claude 3.5 Sonnet-Modell von Anthropic lassen sich sogar Computer von einer generativen KI bedienen.


KI-Modell kann deinen Computer bedienen:

Anthropic bringt Claude 3.5 Haiku und Computer Use

Skizze von Person, schwarze Stiche auf Orange, weißer Pfeil
© Anthropic via Canva


Vor allem bei der Content-Generierung und kreativen Gestaltung von Kampagnen, Posts oder ersten Ideen soll die generative KI unterstützen. Allein das Brainstorming möchte das Unternehmen Adobe künftig mit dem Project Concept unterstützen, das zuletzt neben der Web-Betaversion für das Firefly Video Model und anderen AI-Neuheiten vorgestellt wurde.

Einzelne AI-Designs lassen sich einfach remixen, © Adobe, bunte Bilder von Terrasse und Fenster, nebeneinander, Maus-Icon digital
Das Project Concept erlaubt Design-Remixes im Brainstorming zu Inhalten, © Adobe

Derzeit werden wöchentlich neue Tools und Modelle vorgestellt, die Creator und Brans, aber auch Privat-User unterstützen können. Wir stellen dir einige aktuelle Neuheiten vor und werfen einen Blick auf Midjourneys jüngste Funktionen, um mithilfe von KI erstaunliche Bildkreationen zu erschaffen.

Midjourneys Image Editor und Image Re-Texturing: Visuals mit einem Klick eine neue Gestalt geben

Aktuell liefert das populäre KI-Visual-Erstellungs-Tool Midjourney zwei neue Funktionen. Nachdem zuletzt die lang ersehnte Web-Version und schon im Frühjahr ein Feature zur einheitlichen Charakterdarstellung auf Bildern eingeführt wurde, sind diese Woche die Funktionen Image Editor und Image Re-Texturing im Test angelaufen. Diese sind zunächst nur für User verfügbar, die ein Jahresabonnement haben oder seit zwölf Monaten Abonnent:in sind und für Mitglieder mit mindestens 10.000 Bildern. Das soll den Einführungsprozess der Features vereinfachen, auch für die Server und Content-Moderator:innen.

Mit dem Image Editor lassen sich auch hochgeladene Fotos ganz einfach erweitern und optimieren. So kann auch plötzlich ein Wal über der Stadt schweben. Bei all den kreativen Freiheiten, die diese Funktion bietet, schwingen allerdings auch Gedanken an mögliche Nutzungen zur Manipulation mit – wie bei vielen KI-Tools grundsätzlich.

Das Image Re-Texturing erlaubt den Usern, in Bildern beispielsweise die Farben, die Materialien, die Oberflächen oder das Licht kurzerhand zu variieren. Einige Beispiele dafür liefert das Unternehmen im X Post.

Wenn es um die Visual- (und Sound-)Generierung geht, bietet auch Meta mit Movie Gen ein ganz neues Modell. Einige ausdrucksstarke Beispiele teilte der Konzern kürzlich auf Threads.

Beitrag von @aiatmeta
Auf Threads ansehen

Musikgenerierung, Voice-Design und Emotionen in der Stimme: KI pusht Kreativität auf vielen Ebenen

Wie das Beispiel von Meta zeigt, sind längst nicht mehr nur Bild- und Videokreationen mithilfe generativer KI im Fokus der Creator. Auch Sounds lassen sich mit unterschiedlichen Tools bereits kreieren. YouTube bietet Creatorn beispielsweise mit Dream Track die Option, eigene Sound-Hintergründe für Videos zu erstellen. Eine andere Google-Tochter, Google DeepMind, bietet neuerdings mit MusicFX DJ im Google Labs-Bereich eine KI-gestützte Lösung, um in Echtzeit Musik generieren zu können. Diverse Prompts mit Details zu Instrumenten, Genres und Sound Vibes können den Output optimieren.

Parallel zu diesem Projekt fördert Google DeepMind Musiker:innen mit einer neuen Version der Music AI Sandbox und dedizierten Tools zur Musikkreation samt AI Support.

Wer sich aber eher auf den Sound von Stimmen verlegt, etwa für Videos und Podcasts oder eingesprochene Artikel, erhält ebenfalls immer mehr KI-Tools an die Hand. So bietet ElevenLabs jetzt die Möglichkeit, eine unikale Stimme allein durch einen Text-Prompt zu generieren.

Einige Beispiele, die du als Inspiration nutzen kannst, zeigt das Startup im Thread auf X.

CapCut wiederum, das vielen vor allem für die Videobearbeitungs-Features im Kontext der Reels- oder TikTok-Optimierung bekannt ist, bietet jetzt AI-Stimmen an, die sogar Emotionen beinhalten sollen. Der Social-Media-Experte Jonah Manzano entdeckte die Funktion und teilte auf Threads Insights.

Beitrag von @jonahmanzano
Auf Threads ansehen

Wenn es um die Erkennung und Verarbeitung von Emotionen in der Stimme geht, soll auch der Advanced Voice Mode von ChatGPT Abhilfe schaffen können. Dieser wird jetzt endlich auch in der EU ausgerollt und steht Plus Usern damit in Deutschland ebenso zur Verfügung.


ChatGPT:

Advanced Voice Mode mit Emotionserkennung auch in Deutschland

Smartphone Mockup mit ChatGPT Plus Advanced Voice Mode, Farbverlauf, helle Veilchenfarbe, im Hintergrunde
© OpenAI via Canva


Über noch mehr aktuelle KI-gestützte Tools und Optionen aus der Digitalwelt informieren wir dich regelmäßig auf OnlineMarketing.de und in unserem wöchentlichen Podcast Update.



Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*