Google erweitert sein KI-Portfolio mit Gemini 2.5 Flash, einem bahnbrechenden Modell, das erstmals konfigurierbares Denken ermöglicht. Das neue Modell führt ein "Thinking Budget" ein, mit dem Entwickler präzise steuern können, wie viel Rechenleistung für komplexe Aufgaben aufgewendet wird.
Gemini 2.5 Flash basiert auf einer hybriden Reasoning-Architektur, die das effiziente Verarbeiten einfacher Anfragen mit der Fähigkeit kombiniert, bei Bedarf tiefgehende Analysen durchzuführen. Entwickler können zwischen einer schnellen Antwortgenerierung (unter 500ms) und einem intensiven Denkprozess wählen, je nach Anwendungsfall. Das Modell unterstützt einen beeindruckenden Kontextumfang von einer Million Token, was die Verarbeitung umfangreicher Dokumente wie wissenschaftlicher Artikel oder großer Codebasen ermöglicht.
Die Kontrolle über das Denkvermögen erfolgt durch einen Parameter, der zwischen 0 und 24.576 Token eingestellt werden kann. Bei 0 Token arbeitet das Modell wie sein Vorgänger Gemini 2.0 Flash, während höhere Werte mehrstufige Berechnungen und komplexe Analysen erlauben.
Die Preisstruktur des Modells reflektiert den hybriden Ansatz: Standardanfragen kosten $0,15 pro Million Eingabe-Token und $0,60 pro Million Ausgabe-Token. Für den aktivierten Denkprozess fallen zusätzlich $3,50 pro Million Token an. Dies ermöglicht Entwicklern eine präzise Kostenkontrolle durch gezielte Aktivierung des Denkvermögens nur bei komplexen Aufgaben.
In Benchmarks übertrifft Gemini 2.5 Flash konkurrierende Modelle wie Claude 3.5 Sonnet bei STEM- und Programmieraufgaben, während es gleichzeitig etwa 40% kostengünstiger ist als GPT-4 Turbo. Die multimodalen Fähigkeiten erlauben die Verarbeitung von Bildern, Audio und Video, was vielseitige Anwendungsmöglichkeiten eröffnet - von automatisierten Videoanalysen bis zu bildbasierten Dialogsystemen.
Werbung
E-Book: ChatGPT für Job & Alltag – Dein praktischer Einstieg
Unser neues E-Book bietet eine leicht verständliche und strukturierte Einführung in die Nutzung von ChatGPT – sowohl im Beruf als auch im Privatleben.
- ✔ Mit zahlreichen Beispielen und direkt anwendbaren Prompts
- ✔ 8 spannende Anwendungsfälle, darunter als Übersetzer, Lernassistent oder Finanzrechner
- ✔ Kompakt auf 40 Seiten, klar und auf das Wesentliche fokussiert
from google import genai
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
model="gemini-2.5-flash-preview-04-17",
contents="Wie hoch ist die Wahrscheinlichkeit, bei zwei Würfeln die Summe 7 zu erhalten?",
config=genai.types.GenerateContentConfig(
thinking_config=genai.types.ThinkingConfig(
thinking_budget=1024
)
)
)
print(response.text)
Werbung
Zusammenfassung:
- Gemini 2.5 Flash führt erstmals ein steuerbares "Thinking Budget" ein, das zwischen 0 und 24.576 Token eingestellt werden kann
- Das Modell kombiniert schnelle Reaktionszeiten (unter 500ms) mit der Fähigkeit zu tiefgehenden Analysen bei Bedarf
- Der Kontextumfang von 1 Million Token ermöglicht die Verarbeitung umfangreicher Dokumente und Codebasen
- Die hybride Preisstruktur erlaubt präzise Kostenkontrolle durch selektive Aktivierung des Denkvermögens
- In Benchmarks übertrifft Gemini 2.5 Flash Konkurrenzmodelle bei STEM- und Programmieraufgaben bei gleichzeitig niedrigeren Kosten
- Multimodale Verarbeitung von Text, Bildern, Audio und Video erweitert die Anwendungsmöglichkeiten
Quelle: Google Blog

Florian Schröder ist Experte im Online-Marketing mit Schwerpunkt PPC (Pay-Per-Click) Kampagnen. Die revolutionären Möglichkeiten der KI erkennt er nicht nur, sondern hat sie bereits fest in seine tägliche Arbeit integriert, um innovative und effektive Marketingstrategien zu entwickeln.
Er ist überzeugt davon, dass die Zukunft des Marketings untrennbar mit der Weiterentwicklung und Nutzung von künstlicher Intelligenz verbunden ist und setzt sich dafür ein, stets am Puls dieser technologischen Entwicklungen zu bleiben.