Gemini 2.5 Flash: Googles KI mit konfigurierbarem Denkvermögen verändert Entwicklungslandschaft

Google erweitert sein KI-Portfolio mit Gemini 2.5 Flash, einem bahnbrechenden Modell, das erstmals konfigurierbares Denken ermöglicht. Das neue Modell führt ein "Thinking Budget" ein, mit dem Entwickler präzise steuern können, wie viel Rechenleistung für komplexe Aufgaben aufgewendet wird.

Gemini 2.5 Flash basiert auf einer hybriden Reasoning-Architektur, die das effiziente Verarbeiten einfacher Anfragen mit der Fähigkeit kombiniert, bei Bedarf tiefgehende Analysen durchzuführen. Entwickler können zwischen einer schnellen Antwortgenerierung (unter 500ms) und einem intensiven Denkprozess wählen, je nach Anwendungsfall. Das Modell unterstützt einen beeindruckenden Kontextumfang von einer Million Token, was die Verarbeitung umfangreicher Dokumente wie wissenschaftlicher Artikel oder großer Codebasen ermöglicht.

Die Kontrolle über das Denkvermögen erfolgt durch einen Parameter, der zwischen 0 und 24.576 Token eingestellt werden kann. Bei 0 Token arbeitet das Modell wie sein Vorgänger Gemini 2.0 Flash, während höhere Werte mehrstufige Berechnungen und komplexe Analysen erlauben.

Die Preisstruktur des Modells reflektiert den hybriden Ansatz: Standardanfragen kosten $0,15 pro Million Eingabe-Token und $0,60 pro Million Ausgabe-Token. Für den aktivierten Denkprozess fallen zusätzlich $3,50 pro Million Token an. Dies ermöglicht Entwicklern eine präzise Kostenkontrolle durch gezielte Aktivierung des Denkvermögens nur bei komplexen Aufgaben.

In Benchmarks übertrifft Gemini 2.5 Flash konkurrierende Modelle wie Claude 3.5 Sonnet bei STEM- und Programmieraufgaben, während es gleichzeitig etwa 40% kostengünstiger ist als GPT-4 Turbo. Die multimodalen Fähigkeiten erlauben die Verarbeitung von Bildern, Audio und Video, was vielseitige Anwendungsmöglichkeiten eröffnet - von automatisierten Videoanalysen bis zu bildbasierten Dialogsystemen.

Werbung

Ebook - ChatGPT for Work and Life - The Beginners Guide to getting more done

E-Book: ChatGPT für Job & Alltag – Dein praktischer Einstieg

Unser neues E-Book bietet eine leicht verständliche und strukturierte Einführung in die Nutzung von ChatGPT – sowohl im Beruf als auch im Privatleben.

  • Mit zahlreichen Beispielen und direkt anwendbaren Prompts
  • 8 spannende Anwendungsfälle, darunter als Übersetzer, Lernassistent oder Finanzrechner
  • Kompakt auf 40 Seiten, klar und auf das Wesentliche fokussiert

Jetzt ansehen & durchstarten

from google import genai

client = genai.Client(api_key="GEMINI_API_KEY")

response = client.models.generate_content(
    model="gemini-2.5-flash-preview-04-17",
    contents="Wie hoch ist die Wahrscheinlichkeit, bei zwei Würfeln die Summe 7 zu erhalten?",
    config=genai.types.GenerateContentConfig(
        thinking_config=genai.types.ThinkingConfig(
            thinking_budget=1024
        )
    )
)
print(response.text)

Werbung

Rechtlicher Hinweis: Diese Website setzt Affiliate-Links zum Amazon-Partnerprogramm ein. Der Betreiber der Website verdient durch qualifizierte Käufe eine Provision. Dadurch finanzieren wir die Kosten dieser Website, wie z.B. für Server-Hosting und weitere Ausgaben.

Zusammenfassung:

  • Gemini 2.5 Flash führt erstmals ein steuerbares "Thinking Budget" ein, das zwischen 0 und 24.576 Token eingestellt werden kann
  • Das Modell kombiniert schnelle Reaktionszeiten (unter 500ms) mit der Fähigkeit zu tiefgehenden Analysen bei Bedarf
  • Der Kontextumfang von 1 Million Token ermöglicht die Verarbeitung umfangreicher Dokumente und Codebasen
  • Die hybride Preisstruktur erlaubt präzise Kostenkontrolle durch selektive Aktivierung des Denkvermögens
  • In Benchmarks übertrifft Gemini 2.5 Flash Konkurrenzmodelle bei STEM- und Programmieraufgaben bei gleichzeitig niedrigeren Kosten
  • Multimodale Verarbeitung von Text, Bildern, Audio und Video erweitert die Anwendungsmöglichkeiten

Quelle: Google Blog