Dein wichtigster Touchpoint zur Digitalbranche.
Dein wichtigster Touchpoint zur Digitalbranche.
Technologie
AI-Trends to watch 2024: Von Multimodalität bis SLMs

AI-Trends to watch 2024: Von Multimodalität bis SLMs

Niklas Lewanczik | 26.02.24

Microsoft präsentiert drei zentrale KI-Trends für dieses Jahr. Wir nehmen sie in den Fokus und liefern Kontext aus der Welt der AI-Lösungen und Features.

Googles große ChatGPT-Konkurrenz Bard heißt jetzt Gemini, Meta führt KI-Label ein, Apple plant eine große AI-Offensive und während OpenAI GPTs in den ChatGPT Chat integriert, arbeitet ByteDance an der Chatbot Building Platform Coze. Das Jahr 2024 hat schon jetzt viele Updates und Entwicklungen aus der Welt der Künstlichen Intelligenz für die User parat. Im Laufe des Jahres werden noch zahlreiche weitere Features und Systeme vorgestellt werden.

Beitrag von @dmexco
Auf Threads ansehen

Dabei werden sich diese an einigen AI-Trends orientieren. Drei dieser Trends hat Microsoft, der Tech-Konzern, der so eng mit OpenAI zusammenarbeitet und nicht zuletzt mit Copilot stark auf eine umfassende KI-Integration baut, kürzlich vorgestellt. Wir werfen einen Blick auf diese Trends und liefern weiterführende Hinweise darauf, wo sie sich in der Digitalwelt abzeichnen.

Microsofts AI-Trends to watch: SLMs, Multimodalität und KI in der Wissenschaft

Auf dem offiziellen Microsoft Blog stellt Vanessa Ho drei grundlegende Trends aus der Sicht des Tech-Konzerns vor. Dazu zählt der Aufstieg von SLMs, Small Language Models. Auch diese stützen sich noch auf einige Milliarden Parameter (allerdings deutlich weniger als bei LLMs [Large Language Models] wie etwa Googles PaLM 2). Sebastian Bubeck, der für Microsoft die Machine Learning Foundations Group leitet, erklärt den Vorteil der SLMs. Sie seien oft günstiger und zugänglicher als größere Modelle und könnten für spezifische Zwecke eingesetzt werden, bei denen sie mit viel Power relevante Ergebnisse hervorbringen könnten. In diesem Kontext hat Microsoft selbst die SLMs Phi und Orca entwickelt. Phi-2 soll ein anderes SLM, Googles Gemini Nano 2, sogar in Sachen Performance ausstechen. Dieses Modell, das der Account AI Revolution auf YouTube etwas detaillierter darstellt, ist insbesondere für Forscher:innen relevant, kann aber in bestimmten Kontexten auch für Alltagszwecke eingesetzt werden.

Andere SLMs stellen etwa Mixtral und DistilBERT dar, eine kompaktere Version von BERT. SLMs sollen im Forschungs- und Business-Kontext als effiziente und kostengünstige Lösungen integriert werden. Gemini Nano etwa soll KI-Aufgaben auf dem Smartphone, wie Googles Pixel 8 Pro, unterstützen.

Googles Gemini-System baut ebenfalls auf die Multimodalität von KI – das ist der zweite große Trend, den Vanessa Ho nennt. Die Fähigkeiten multimodaler KI zeigt Google im Video zu Gemini.

Microsoft selbst betont die multimodalen Anwendungsoptionen im Kontext des Copilot-Modells, das kürzlich eine Reihe neuer Features erhielt.

Zudem unterstützt multimodale AI auch den Microsoft Designer und hilft unter anderem dabei, natürlich klingende Stimmen bei Text-Readern zu integrieren, was hörbeeinträchtigten Menschen helfen kann. Insgesamt kann der multimodale Ansatz menschlichere Konversationen und Interaktionen ermöglichen. Das bietet nicht zuletzt OpenAI, zum Beispiel seit der Einführung der Image und Voice Conversations.

Multimodale AI Features können in den verschiedensten Kontexten Relevanz erlangen.

Auch der KI-Experte Jens Polomski erklärte mir, dass er Multimodalität als eines der größten Trendthemen im Bereich KI ansieht. Außerdem sieht er Open Source-Modelle als besonders relevant an; und diese können immerhin auch bei der Entwicklung von SLMs und multimodalen Modellen unterstützen.

Mehr wissenschaftliche Entdeckungen dank AI

Der dritte große AI-Trend von Microsoft betrifft die Wissenschaft. Laut Vanessa Ho und Chris Bishop, Director des A14Science Teams von Microsoft Research, werden KI-Lösungen die wissenschaftlichen Entdeckungen künftig revolutionieren. Das kann sich auf Wetterprognosen, Durchbrüche bei medizinischen Behandlungen oder etwa Fortschritte in der Landwirtschaft beziehen.

Dr. Keith Channon von Caristo Diagnostics erklärt beispielsweise im NVIDIA AI Podcast, wie eine KI-gestützte Lösung zur Erkennung von Koronarentzündungen in Herz-CT-Scans beitragen kann. Im vergangenen Jahr hat Google zusammen mit dem Berkeley Lab Graph Networks for Materials Exploration (GNoME) vorgestellt, eine KI-Lösung, die bei der Entdeckung von über 2,2 Millionen neuer Kristalle geholfen hat, welche für die Entwicklung neuer Technologien für Batterien, Computer etc. genutzt werden können. Die Technologie der GNoME Predictions wurde bereits für die Forschung zur Verfügung gestellt. Im Post dazu heißt es abschließend:

Our research – and that of collaborators at the Berkeley Lab, Google Research, and teams around the world — shows the potential to use AI to guide materials discovery, experimentation, and synthesis. We hope that GNoME together with other AI tools can help revolutionize materials discovery today and shape the future of the field.

Darüber hinaus berichtete die Financial Times im Herbst vergangenen Jahres über eine Optimierung der Brustkrebserkennung auf der Grundlage von KI-Lösungen.

Die Wissenschaft, das Marketing und viele andere Lebensbereiche können 2024 und darüber hinaus von der rasanten Entwicklung von KI profitieren – sofern diese KI ethisch und sicher eingesetzt wird. Wir dürfen gespannt auf neue Entwicklungen und Lösungen hoffen. Die Möglichkeiten sind scheinbar unbegrenzt. So ist und bleibt KI ein Trendthema in diversen Bereichen unserer digitalisierten Welt.



Googles Lumiere zeigt uns die Zukunft der KI-Kurzvideos

© Google AI, Google Lumiere, Bilder von Tieren im AI Compuser, Wschbären, Teddybär, Affe, Löwe
© Google AI


Dieser Beitrag erschien erstmals am 13. Februar 2024.

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*