So setzt du Gemini 3.1 Flash-Lite ein: Schneller und günstiger

Gemini 3.1 Flash-Lite: Schnellstes und kosteneffizientestes KI-Modell von Google

Niklas Lewanczik | 04.03.26

Google bringt mit Gemini 3.1 Flash-Lite eine neue kosteneffiziente Version des KI-Modells und zeigt, wie du sie zur Lösung echter Probleme einsetzt.

Neue Woche, neues Google-Modell: Nachdem Google vergangene Woche das KI-Modell Gemini 3.1 Pro vorgestellt hat, folgt jetzt die Modellversion Gemini 3.1 Flash-Lite. Diese ist besonders schnell – 2,5 Mal so schnell wie Gemini 2.5 Flash – und kostengünstiger. Gerade für arbeitsintensive Workflows mit hohem Tempoanspruch bietet sich das Modell an. Dazu kommen dynamische Thinking Levels, mit denen User das passende Niveau im Reasoning einstellen können. Google gibt Beispiele für Einsatzoptionen.

Gemini 3.1 Pro ist da:

Googles smartestes Modell für komplexe Aufgaben und Kreativprojekte

Gemini 3.1 Pro-Schriftzug vor dunklem Hintergrund mit leuchtenden Elementen als Punkte — *© Google via Canva*

Gemini 3.1 Flash-Lite in der Übersicht: Höherer Output Speed für Aufgaben wie Übersetzung, Reporting, Content-Moderation

Die neue KI-Modellversion Flash-Lite startet ab sofort als Preview für in der Gemini API im Google AI Studio und für Unternehmen via Vertex AI. Vor allem der vergleichsweise geringe Preis soll Business User überzeugen. 25 US Cent kosten eine Million Input Tokens, für eine Million Output Tokens werden 1,5 US-Dollar fällig. Das ist weniger als bei Gemini 2.5 Flash und beispielsweise Claude 4.5 Haiku.

Der andere große Vorteil ist das Tempo des Modells. Es soll deutlich schneller arbeiten als etwa Gemini 2.5 Flash und hat auch ein um 45 Prozent optimiertes Output-Tempo.

Gemini 3.1 Flash-Lite und Gemini 2.5 Flash im direkten Vergleich, © Google

Während das Modell in diversen Leaderboard-Kategorien Top-Werte erzielt – etwa 86,9 Prozent bei GPQA Diamond (einem umfassenden naturwissenschaftlichen Test) –, können User die Intelligenz des Tools künftig mithilfe eines neuen Tools an ihre Aufträge anpassen. Die sogenannten Thinking Levels ermöglichen es, festzulegen, wie viel das Modell „nachdenken“ soll, sodass die Reasoning-Tiefe angepasst wird.

Auf diese Weise sollen diverse Aufgaben noch besser und effizienter skaliert werden können. Wie das in der Praxis aussehen kann, zeigt Google indes anhand einiger Einsatzbeispiele. Im Blog Post erklärt das Gemini Team, dass die Optimierung von Tempo, die Minimierung von Kosten und die Anpassung der Thinking Levels beispielsweise bei umfassenden Übersetzungen und Content-Moderationen Anwendung finden kann. Gleichzeitig kann das Modell mit tiefgreifendem Reasoning neue Dashboards oder Modellsimulationen erstellen. Des Weiteren eignet sich Gemini 3.1 Flash-Lite laut Google etwa für die Erstellung von Agents zur Datenvisualisierung oder für CRM-Management-Prozesse. In einem weiteren Beispielprozess hat Google einen Retail Business Agent erstellt, der diverse Arbeitsschritte wie das Reporting oder die Dashboard-Automatisierung durchführen konnte.

Second, using 3.1 Flash-Lite in @GoogleAIStudio, we built a retail business agent that plans and executes multi-step tasks for you like reporting and dashboard automation – saving you time to focus on the things that matter most.

Beginning today, the model is rolling out in… pic.twitter.com/XOyQ6nGZRO
— Google AI (@GoogleAI) March 3, 2026

Während Gemini 3.1 Flash-Lite nun für die ersten User bereitsteht, hat Google im eigenen KI-Kosmos viele weitere Modellversionen samt Updates zu bieten. Für die KI-Bilderstellung zum Beispiel steht jetzt Nano Banana 2 zur Verfügung, mit Geminis Weltwissen.

Nano Banana 2 ist da:

Googles schnellstes KI-Bildmodell mit Gemini-Weltwissen

Nano Banana 2-Schriftzug, einzelne KI-generierte Bilder — *© Google via Canva*

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Kommentar

_* Hiermit willige ich in die Verarbeitung meiner angegebenen personenbezogenen Daten für das Kommentieren des Beitrags der Onlinemarketing.de GmbH ein. Mir ist bekannt, dass ich meine Einwilligung jederzeit durch eine formlose E-Mail an info@onlinemarketing.de widerrufen kann. Durch den Widerruf der Einwilligung wird die Rechtmäßigkeit der Verarbeitung, die aufgrund der Einwilligung bis zum Widerruf erfolgt ist, nicht berührt. Weitere Informationen über den Umgang mit Ihren Daten finden Sie in unserer Datenschutzerklärung.

Gemini 3.1 Flash-Lite: Schnellstes und kosteneffizientestes KI-Modell von Google

Gemini 3.1 Pro ist da:

Googles smartestes Modell für komplexe Aufgaben und Kreativprojekte

Gemini 3.1 Flash-Lite in der Übersicht: Höherer Output Speed für Aufgaben wie Übersetzung, Reporting, Content-Moderation

Nano Banana 2 ist da:

Googles schnellstes KI-Bildmodell mit Gemini-Weltwissen

Über 30.000 Subscriber können nicht irren. Melde dich jetzt zu unserem NEWSLETTER an:

Kommentare aus der Community

Über 30.000 Subscriber können nicht irren. Melde dich jetzt zu unserem NEWSLETTER an:

Beliebte Kategorien

Nützlich

OnlineMarketing.de