QwQ-Max-Preview: Alibabas KI-Neuheit überholt Claude 3.5 und DeepSeek V3

Qwen QVQ-Max

Alibaba setzt mit QwQ-Max-Preview neue Maßstäbe im KI-Bereich und fordert etablierte Modelle wie Claude 3.5 und GPT-4o heraus. Das neue Modell erreicht beeindruckende 60% Erfolgsquote beim ersten Versuch für anspruchsvolle AIME 2025 Mathematikprobleme und übertrifft mit 89,4 Punkten im Arena-Hard-Benchmark sowohl DeepSeek V3 (85,5) als auch Claude 3.5 Sonnet (85,2).

Weiterlesen