Alibaba setzt mit QwQ-Max-Preview neue Maßstäbe im KI-Bereich und fordert etablierte Modelle wie Claude 3.5 und GPT-4o heraus. Das neue Modell erreicht beeindruckende 60% Erfolgsquote beim ersten Versuch für anspruchsvolle AIME 2025 Mathematikprobleme und übertrifft mit 89,4 Punkten im Arena-Hard-Benchmark sowohl DeepSeek V3 (85,5) als auch Claude 3.5 Sonnet (85,2).
Die hybride Architektur des Modells kombiniert einen effizienten Mixture-of-Experts-Ansatz mit einer Kontextverarbeitung von 32.768 Token, was spezialisierte Aufgabenverarbeitung bei gleichzeitiger Vielseitigkeit ermöglicht. Besonders hervorzuheben ist die progressive Vortrainierung auf 20 Billionen Token und die Verstärkungslern-Feinabstimmung, die Halluzinationen im Vergleich zum Vorgängermodell Qwen2.5-VL um 40% reduziert.
Technische Höchstleistungen im Detail
Die multimodalen Fähigkeiten des QwQ-Max-Preview sind beeindruckend. Das System kann Videos mit einer Länge von bis zu einer Stunde verarbeiten und SVG-Code aus visuellen Beschreibungen generieren. Dabei unterstützt es 29 verschiedene Sprachen und zeigt eine 92-prozentige Genauigkeit bei der Selbstkorrektur von Codierungsfehlern während der LiveCodeBench-Evaluierungen.
Im Wettbewerbsvergleich zeigt sich QwQ-Max-Preview auf Augenhöhe mit führenden proprietären Modellen:
Benchmark | QwQ-Max-Preview | Claude 3.5 Sonnet | DeepSeek V3 |
---|---|---|---|
Arena-Hard | 89,4 | 85,2 | 85,5 |
LiveCodeBench | 38,7 | 38,9 | 37,6 |
MMLU-Pro | 76,1 | 78,0 | 75,9 |
GPQA-Diamond | 60,1 | 65,0 | 59,1 |
Zukunftspläne und Marktpositionierung
Alibabas KI-Infrastrukturinvestition von 53 Milliarden Dollar positioniert QwQ-Max als Eckpfeiler für komplexe Agentensysteme. Das Modell demonstriert bereits eine 83-prozentige Erfolgsquote bei mehrstufigen Optimierungssimulationen für Lieferketten. Demnächst wird das Angebot durch unternehmensorientierte Tools erweitert:
Werbung
E-Book: ChatGPT für Job & Alltag – Dein praktischer Einstieg
Unser neues E-Book bietet eine leicht verständliche und strukturierte Einführung in die Nutzung von ChatGPT – sowohl im Beruf als auch im Privatleben.
- ✔ Mit zahlreichen Beispielen und direkt anwendbaren Prompts
- ✔ 8 spannende Anwendungsfälle, darunter als Übersetzer, Lernassistent oder Finanzrechner
- ✔ Kompakt auf 40 Seiten, klar und auf das Wesentliche fokussiert
- Qwen Chat App: Echtzeit-Kollaborationsfunktionen für teambasierte KI-Workflows
- QwQ-32B-Variante: Datenschutzfreundliches lokales Bereitstellungsmodell mit 58% niedrigerem VRAM-Bedarf
- Apache 2.0-Freigabe: Vollständiger Open-Source-Zugang für Q2 2025 geplant
Diese Veröffentlichung intensiviert den globalen KI-Wettbewerb und bietet eine Open-Source-Alternative zu proprietären Modellen bei gleichzeitiger Beibehaltung kommerzieller Leistungsfähigkeit.
Werbung
Zusammenfassung
- Alibabas QwQ-Max-Preview übertrifft konkurrierende Modelle mit 89,4 Punkten im Arena-Hard-Benchmark
- Das Modell basiert auf 20 Billionen Token Training und reduziert Halluzinationen um 40%
- Multimodale Verarbeitung von einstündigen Videos und 29 Sprachen wird unterstützt
- 92% Genauigkeit bei Selbstkorrektur von Programmiercode
- Open-Source-Veröffentlichung unter Apache 2.0 für Q2 2025 geplant
- Alibabas 53-Milliarden-Dollar-Investition intensiviert den globalen KI-Wettbewerb
Quelle: QwenLM

Florian Schröder ist Experte im Online-Marketing mit Schwerpunkt PPC (Pay-Per-Click) Kampagnen. Die revolutionären Möglichkeiten der KI erkennt er nicht nur, sondern hat sie bereits fest in seine tägliche Arbeit integriert, um innovative und effektive Marketingstrategien zu entwickeln.
Er ist überzeugt davon, dass die Zukunft des Marketings untrennbar mit der Weiterentwicklung und Nutzung von künstlicher Intelligenz verbunden ist und setzt sich dafür ein, stets am Puls dieser technologischen Entwicklungen zu bleiben.