Technologie
Gemini 3.1 Flash-Lite: Schnellstes und kosteneffizientestes KI-Modell von Google

Gemini 3.1 Flash-Lite: Schnellstes und kosteneffizientestes KI-Modell von Google

Niklas Lewanczik | 04.03.26

Google bringt mit Gemini 3.1 Flash-Lite eine neue kosteneffiziente Version des KI-Modells und zeigt, wie du sie zur Lösung echter Probleme einsetzt.

Neue Woche, neues Google-Modell: Nachdem Google vergangene Woche das KI-Modell Gemini 3.1 Pro vorgestellt hat, folgt jetzt die Modellversion Gemini 3.1 Flash-Lite. Diese ist besonders schnell – 2,5 Mal so schnell wie Gemini 2.5 Flash – und kostengünstiger. Gerade für arbeitsintensive Workflows mit hohem Tempoanspruch bietet sich das Modell an. Dazu kommen dynamische Thinking Levels, mit denen User das passende Niveau im Reasoning einstellen können. Google gibt Beispiele für Einsatzoptionen.


Gemini 3.1 Pro ist da:

Googles smartestes Modell für komplexe Aufgaben und Kreativprojekte

Gemini 3.1 Pro-Schriftzug vor dunklem Hintergrund mit leuchtenden Elementen als Punkte
© Google via Canva


Gemini 3.1 Flash-Lite in der Übersicht: Höherer Output Speed für Aufgaben wie Übersetzung, Reporting, Content-Moderation

Die neue KI-Modellversion Flash-Lite startet ab sofort als Preview für in der Gemini API im Google AI Studio und für Unternehmen via Vertex AI. Vor allem der vergleichsweise geringe Preis soll Business User überzeugen. 25 US Cent kosten eine Million Input Tokens, für eine Million Output Tokens werden 1,5 US-Dollar fällig. Das ist weniger als bei Gemini 2.5 Flash und beispielsweise Claude 4.5 Haiku.

Der andere große Vorteil ist das Tempo des Modells. Es soll deutlich schneller arbeiten als etwa Gemini 2.5 Flash und hat auch ein um 45 Prozent optimiertes Output-Tempo.

Gemini 3.1 Flash-Lite und Gemini 2.5 Flash im direkten Vergleich, © Google

Während das Modell in diversen Leaderboard-Kategorien Top-Werte erzielt – etwa 86,9 Prozent bei GPQA Diamond (einem umfassenden naturwissenschaftlichen Test) –, können User die Intelligenz des Tools künftig mithilfe eines neuen Tools an ihre Aufträge anpassen. Die sogenannten Thinking Levels ermöglichen es, festzulegen, wie viel das Modell „nachdenken“ soll, sodass die Reasoning-Tiefe angepasst wird.

Auf diese Weise sollen diverse Aufgaben noch besser und effizienter skaliert werden können. Wie das in der Praxis aussehen kann, zeigt Google indes anhand einiger Einsatzbeispiele. Im Blog Post erklärt das Gemini Team, dass die Optimierung von Tempo, die Minimierung von Kosten und die Anpassung der Thinking Levels beispielsweise bei umfassenden Übersetzungen und Content-Moderationen Anwendung finden kann. Gleichzeitig kann das Modell mit tiefgreifendem Reasoning neue Dashboards oder Modellsimulationen erstellen. Des Weiteren eignet sich Gemini 3.1 Flash-Lite laut Google etwa für die Erstellung von Agents zur Datenvisualisierung oder für CRM-Management-Prozesse. In einem weiteren Beispielprozess hat Google einen Retail Business Agent erstellt, der diverse Arbeitsschritte wie das Reporting oder die Dashboard-Automatisierung durchführen konnte.

Während Gemini 3.1 Flash-Lite nun für die ersten User bereitsteht, hat Google im eigenen KI-Kosmos viele weitere Modellversionen samt Updates zu bieten. Für die KI-Bilderstellung zum Beispiel steht jetzt Nano Banana 2 zur Verfügung, mit Geminis Weltwissen.


Nano Banana 2 ist da:

Googles schnellstes KI-Bildmodell mit Gemini-Weltwissen

Nano Banana 2-Schriftzug, einzelne KI-generierte Bilder
© Google via Canva

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*