Menu

Benchmark-Sieger

Top 5 in den wichtigsten Benchmarks

Welche Benchmarks haben wir ausgewählt?

i

Jede Metrik ist mit bedacht ausgewählt, um dir die beste Übersicht und Experience zu liefern.

Klicke auf das i um mehr zur Auswahl der Benchmarks zu erfahren.

Arena Score

i
1
Gemini 3 Pro 1490
2
Gemini 3 Flash 1480
3
Claude Opus 4.5 1467
4
Grok 4.1 1466
5
GPT-5.2 1458

Coding (SWE-bench)

i
1
Claude Opus 4.5 80.9%
2
GPT-5.2 80.0%
3
Gemini 3 Flash 78.0%
4
GPT-5.1 76.3%
5
Gemini 3 Pro 76.2%

Wissen (GPQA)

i
1
GPT-5.2 92.4%
2
Gemini 3 Pro 91.9%
3
Gemini 3 Flash 90.4%
4
GPT-5.1 88.1%
5
Claude Opus 4.5 87.0%

Safety (HarmBench)

i
1
Claude Opus 4.5 97.8%
2
Claude Sonnet 4.5 96.4%
3
Claude Opus 4.1 95.2%
4
Claude Sonnet 4 94.8%
5
Gemini 3 Pro 94.2%

Multimodal (MMMU)

i
1
Gemini 3 Pro 72.8%
2
GPT-5.2 70.2%
3
Gemini 3 Flash 69.4%
4
Claude Opus 4.5 68.5%
5
GPT-5.1 67.8%

Geschwindigkeit

i
1
MiMo V2 Flash 485 tok/s
2
GPT-4.1 Mini 426 tok/s
3
Claude Haiku 4.5 385 tok/s
4
MiniMax M2.1 312 tok/s
5
Gemini 2.5 Flash 298 tok/s

Kategorie-Sieger

Top 5 in den wichtigsten Kategorien

Welche Kategorien haben wir ausgewählt?

i

Jede Metrik ist mit bedacht ausgewählt, um dir die beste Übersicht und Experience zu liefern.

Klicke auf das i um mehr zur Auswahl der Kategorien zu erfahren.

Text

i
1
Gemini 3 Pro 1490
2
Gemini 3 Flash 1480
3
Grok 41 Thinking 1477
4
Claude Opus 4.5 1467
5
Grok 41 1466

WebDev

i
1
Gpt 52 High 1480
2
Claude Opus 4.5 1479
3
Gemini 3 Pro 1471
4
Gemini 3 Flash 1454
5
Minimax M21 Preview 1445

Vision

i
1
Gemini 3 Pro 1309
2
Gemini 3 Flash 1284
3
Gpt 51 High 1249
4
Gemini 25 Pro 1249
5
Claude Opus 4.5 1240

Text-to-Image

i
1
Gpt Image 15 1264
2
Gemini 3 Pro 1235
3
Flux 2 Max 1168
4
Flux 2 Flex 1157
5
Gemini 25 Flash Image Preview 1155

Performance-Sieger

Top Modelle in den wichtigsten performance Indizes

Welche performance Indizies haben wir ausgewählt?

i

Jede Metrik ist mit bedacht ausgewählt, um dir die beste Übersicht und Experience zu liefern.

Klicke auf das i um mehr zur Auswahl der performance Indizies zu erfahren.

Intelligenz-Index

i
94
Gemini 3 Pro
Intelligence: 94
Gemini 3 Pro
93
GPT-5.2
Intelligence: 93
GPT-5.2
92
Claude Opus 4.5
Intelligence: 92
Claude Opus 4.5
90
GPT-5.1
Intelligence: 90
GPT-5.1
89
Gemini 3 Flash
Intelligence: 89
Gemini 3 Flash
88
Grok 4.1
Intelligence: 88
Grok 4.1
88
Claude Opus 4.1
Intelligence: 88
Claude Opus 4.1
87
Claude Sonnet 4.5
Intelligence: 87
Claude Sonnet 4.5
87
GLM-4.7
Intelligence: 87
GLM-4.7
86
Claude Opus 4
Intelligence: 86
Claude Opus 4
85
Gemini 2.5 Pro
Intelligence: 85
Gemini 2.5 Pro
84
GLM-4.6
Intelligence: 84
GLM-4.6
84
DeepSeek V3.2
Intelligence: 84
DeepSeek V3.2
84
Claude Sonnet 4
Intelligence: 84
Claude Sonnet 4
83
Gemini 2.5 Flash
Intelligence: 83
Gemini 2.5 Flash
94
Claude Opus 4.5
Coding: 94
Claude Opus 4.5
92
Gemini 3 Pro
Coding: 92
Gemini 3 Pro
92
GPT-5.2
Coding: 92
GPT-5.2
89
Claude Sonnet 4.5
Coding: 89
Claude Sonnet 4.5
89
GPT-5.1
Coding: 89
GPT-5.1
87
Claude Opus 4.1
Coding: 87
Claude Opus 4.1
87
DeepSeek V3.2
Coding: 87
DeepSeek V3.2
86
Claude Sonnet 4
Coding: 86
Claude Sonnet 4
85
Gemini 3 Flash
Coding: 85
Gemini 3 Flash
84
GLM-4.7
Coding: 84
GLM-4.7
84
Claude Opus 4
Coding: 84
Claude Opus 4
82
Grok 4.1
Coding: 82
Grok 4.1
82
GLM-4.6
Coding: 82
GLM-4.6
81
Gemini 2.5 Pro
Coding: 81
Gemini 2.5 Pro
81
MiMo V2 Flash
Coding: 81
MiMo V2 Flash
90
Claude Opus 4.5
Agentic: 90
Claude Opus 4.5
89
GPT-5.2
Agentic: 89
GPT-5.2
89
Gemini 3 Pro
Agentic: 89
Gemini 3 Pro
86
GPT-5.1
Agentic: 86
GPT-5.1
86
Claude Sonnet 4.5
Agentic: 86
Claude Sonnet 4.5
84
Claude Opus 4.1
Agentic: 84
Claude Opus 4.1
82
Gemini 3 Flash
Agentic: 82
Gemini 3 Flash
82
Claude Opus 4
Agentic: 82
Claude Opus 4
80
Claude Sonnet 4
Agentic: 80
Claude Sonnet 4
80
Grok 4.1
Agentic: 80
Grok 4.1
79
Gemini 2.5 Pro
Agentic: 79
Gemini 2.5 Pro
77
GLM-4.7
Agentic: 77
GLM-4.7
76
GLM-4.6
Agentic: 76
GLM-4.6
75
DeepSeek V3.2
Agentic: 75
DeepSeek V3.2
74
Mistral Large 3
Agentic: 74
Mistral Large 3

Geschwindigkeit-Index

i
485
MiMo V2 Flash
Speed: 485 tok/s
MiMo V2 Flash
426
GPT-4.1 Mini
Speed: 426 tok/s
GPT-4.1 Mini
385
Claude Haiku 4.5
Speed: 385 tok/s
Claude Haiku 4.5
312
MiniMax M2.1
Speed: 312 tok/s
MiniMax M2.1
298
Gemini 2.5 Flash
Speed: 298 tok/s
Gemini 2.5 Flash
286
Gemini 3 Flash
Speed: 286 tok/s
Gemini 3 Flash

Preis-Index

i
Input $/M
Output $/M
$0.10
MiMo V2 Flash
Input: $0.10/M
$0.30
MiMo V2 Flash
Output: $0.30/M
MiMo V2 Flash
$0.25
Claude Haiku 4.5
Input: $0.25/M
$1.25
Claude Haiku 4.5
Output: $1.25/M
Claude Haiku 4.5
$0.28
DeepSeek V3.2
Input: $0.28/M
$0.42
DeepSeek V3.2
Output: $0.42/M
DeepSeek V3.2
$0.30
Gemini 2.5 Flash
Input: $0.30/M
$2.50
Gemini 2.5 Flash
Output: $2.50/M
Gemini 2.5 Flash

Die KI Weekly Ranking Tabelle

Eine Tabelle mit den Informationen zu allen gelisteten Modellen

Rang
Unternehmen
Land
Modell
Multimodal
KI Weekly Score
GPQA
Arena
SWE-bench
HarmBench
Input
Output
Context
Lizenz
1 US Gemini 3 Pro 86.8 91.9% 1490 76.2% 94.2% $2.00 $12.00 1,000,000 Proprietary
2 US Gemini 3 Flash 86.7 90.4% 1480 78.0% 92.8% $0.50 $3.00 1,000,000 Proprietary
3 US GPT-5.2 83.7 92.4% 1458 80.0% 93.5% $1.75 $14.00 400,000 Proprietary
4 US Claude Opus 4.5 82.2 87.0% 1467 80.9% 97.8% $5.00 $25.00 200,000 Proprietary
5 US GPT-5.1 82.2 88.1% 1458 76.3% 92.1% $1.25 $10.00 400,000 Proprietary
6 US Grok 4.1 80.0 85.0% 1466 70.0% 88.3% $2.00 $10.00 131,000 Proprietary
7 US Claude Sonnet 4.5 79.5 83.4% 1450 75.2% 96.4% $3.00 $15.00 200,000 Proprietary
8 US GLM-4.7 78.4 85.7% 1435 73.8% 85.6% $0.60 $2.20 205,000 Proprietary
9 US Gemini 2.5 Pro 77.5 83.0% 1451 63.2% 90.5% $1.25 $10.00 1,000,000 Proprietary
10 CN DeepSeek V3.2 75.5 82.0% 1420 73.1% 78.2% $0.28 $0.42 131,000 Proprietary

Was ist der KI Weekly Score?

Der KI Weekly Score ist unser Bewertungssystem, das die Top-Benchmarks aus mehreren Quellen kombiniert.

Klicke auf das i um mehr zur Berechnung des KI Weekly Scores zu erfahren.

i

Von wo kommen die Daten?

Die Daten stammen aus LMArena, llm-stats und Artificial Analysis.

Klicke auf das i um mehr zur Datenerhebung zu erfahren.

i