KI-Modell Ranking - Der KI-Newsletter

🥇

Gemini 3 Pro

Google

Details ansehen →

Gemini 3 Flash

Google

Details ansehen →

GPT-5.2

OpenAI

Details ansehen →

Claude Opus 4.5

Anthropic

KI Weekly Score 82.2

Details ansehen →

GPT-5.1

OpenAI

KI Weekly Score 82.2

Details ansehen →

Benchmark-Sieger

Top 5 in den wichtigsten Benchmarks

Welche Benchmarks haben wir ausgewählt?

Jede Metrik ist mit bedacht ausgewählt, um dir die beste Übersicht und Experience zu liefern.

Klicke auf das i um mehr zur Auswahl der Benchmarks zu erfahren.

Arena Score

Gemini 3 Pro 1490

Gemini 3 Flash 1480

Claude Opus 4.5 1467

Grok 4.1 1466

GPT-5.2 1458

Coding (SWE-bench)

Claude Opus 4.5 80.9%

GPT-5.2 80.0%

Gemini 3 Flash 78.0%

GPT-5.1 76.3%

Gemini 3 Pro 76.2%

Wissen (GPQA)

GPT-5.2 92.4%

Gemini 3 Pro 91.9%

Gemini 3 Flash 90.4%

GPT-5.1 88.1%

Claude Opus 4.5 87.0%

Safety (HarmBench)

Claude Opus 4.5 97.8%

Claude Sonnet 4.5 96.4%

Claude Opus 4.1 95.2%

Claude Sonnet 4 94.8%

Gemini 3 Pro 94.2%

Multimodal (MMMU)

Gemini 3 Pro 72.8%

GPT-5.2 70.2%

Gemini 3 Flash 69.4%

Claude Opus 4.5 68.5%

GPT-5.1 67.8%

Geschwindigkeit

MiMo V2 Flash 485 tok/s

GPT-4.1 Mini 426 tok/s

Claude Haiku 4.5 385 tok/s

MiniMax M2.1 312 tok/s

Gemini 2.5 Flash 298 tok/s

Kategorie-Sieger

Top 5 in den wichtigsten Kategorien

Welche Kategorien haben wir ausgewählt?

Jede Metrik ist mit bedacht ausgewählt, um dir die beste Übersicht und Experience zu liefern.

Klicke auf das i um mehr zur Auswahl der Kategorien zu erfahren.

Text

Gemini 3 Pro 1490

Gemini 3 Flash 1480

Grok 41 Thinking 1477

Claude Opus 4.5 1467

Grok 41 1466

WebDev

Gpt 52 High 1480

Claude Opus 4.5 1479

Gemini 3 Pro 1471

Gemini 3 Flash 1454

Minimax M21 Preview 1445

Vision

Gemini 3 Pro 1309

Gemini 3 Flash 1284

Gpt 51 High 1249

Gemini 25 Pro 1249

Claude Opus 4.5 1240

Text-to-Image

Gpt Image 15 1264

Gemini 3 Pro 1235

Flux 2 Max 1168

Flux 2 Flex 1157

Gemini 25 Flash Image Preview 1155

Performance-Sieger

Top Modelle in den wichtigsten performance Indizes

Welche performance Indizies haben wir ausgewählt?

Jede Metrik ist mit bedacht ausgewählt, um dir die beste Übersicht und Experience zu liefern.

Klicke auf das i um mehr zur Auswahl der performance Indizies zu erfahren.

Intelligenz-Index

Gemini 3 Pro

GPT-5.2

Claude Opus 4.5

GPT-5.1

Gemini 3 Flash

Grok 4.1

Claude Opus 4.1

Claude Sonnet 4.5

GLM-4.7

Claude Opus 4

Gemini 2.5 Pro

GLM-4.6

DeepSeek V3.2

Claude Sonnet 4

Gemini 2.5 Flash

Claude Opus 4.5

Gemini 3 Pro

GPT-5.2

Claude Sonnet 4.5

GPT-5.1

Claude Opus 4.1

DeepSeek V3.2

Claude Sonnet 4

Gemini 3 Flash

GLM-4.7

Claude Opus 4

Grok 4.1

GLM-4.6

Gemini 2.5 Pro

MiMo V2 Flash

Claude Opus 4.5

GPT-5.2

Gemini 3 Pro

GPT-5.1

Claude Sonnet 4.5

Claude Opus 4.1

Gemini 3 Flash

Claude Opus 4

Claude Sonnet 4

Grok 4.1

Gemini 2.5 Pro

GLM-4.7

GLM-4.6

DeepSeek V3.2

Mistral Large 3

Geschwindigkeit-Index

485

MiMo V2 Flash

426

GPT-4.1 Mini

385

Claude Haiku 4.5

312

MiniMax M2.1

298

Gemini 2.5 Flash

286

Gemini 3 Flash

Preis-Index

Input $/M

Output $/M

$0.10

$0.30

MiMo V2 Flash

$0.25

$1.25

Claude Haiku 4.5

$0.28

$0.42

DeepSeek V3.2

$0.30

$2.50

Gemini 2.5 Flash

Die KI Weekly Ranking Tabelle

Eine Tabelle mit den Informationen zu allen gelisteten Modellen

Rang	Unternehmen	Land	Modell	Multimodal	KI Weekly Score	GPQA	Arena	SWE-bench	HarmBench	Input	Output	Context	Lizenz
1		US	Gemini 3 Pro	✓	86.8	91.9%	1490	76.2%	94.2%	$2.00	$12.00	1,000,000	Proprietary
2		US	Gemini 3 Flash	✓	86.7	90.4%	1480	78.0%	92.8%	$0.50	$3.00	1,000,000	Proprietary
3		US	GPT-5.2	✓	83.7	92.4%	1458	80.0%	93.5%	$1.75	$14.00	400,000	Proprietary
4		US	Claude Opus 4.5	✓	82.2	87.0%	1467	80.9%	97.8%	$5.00	$25.00	200,000	Proprietary
5		US	GPT-5.1	✓	82.2	88.1%	1458	76.3%	92.1%	$1.25	$10.00	400,000	Proprietary
6		US	Grok 4.1	✓	80.0	85.0%	1466	70.0%	88.3%	$2.00	$10.00	131,000	Proprietary
7		US	Claude Sonnet 4.5	✓	79.5	83.4%	1450	75.2%	96.4%	$3.00	$15.00	200,000	Proprietary
8	Z	US	GLM-4.7	✓	78.4	85.7%	1435	73.8%	85.6%	$0.60	$2.20	205,000	Proprietary
9		US	Gemini 2.5 Pro	✓	77.5	83.0%	1451	63.2%	90.5%	$1.25	$10.00	1,000,000	Proprietary
10		CN	DeepSeek V3.2	✓	75.5	82.0%	1420	73.1%	78.2%	$0.28	$0.42	131,000	Proprietary

Was ist der KI Weekly Score?

Der KI Weekly Score ist unser Bewertungssystem, das die Top-Benchmarks aus mehreren Quellen kombiniert.

Klicke auf das i um mehr zur Berechnung des KI Weekly Scores zu erfahren.

Von wo kommen die Daten?

Die Daten stammen aus LMArena, llm-stats und Artificial Analysis.

Klicke auf das i um mehr zur Datenerhebung zu erfahren.

Das umfassende KI Weekly Ranking

Gemini 3 Pro

Gemini 3 Flash

GPT-5.2

Claude Opus 4.5

GPT-5.1

Benchmark-Sieger

Arena Score

Coding (SWE-bench)

Wissen (GPQA)

Safety (HarmBench)

Multimodal (MMMU)

Geschwindigkeit

Kategorie-Sieger

Text

WebDev

Vision

Text-to-Image

Performance-Sieger

Intelligenz-Index

Geschwindigkeit-Index

Preis-Index

Die KI Weekly Ranking Tabelle

Was ist der KI Weekly Score?

Von wo kommen die Daten?

Auswahl der Benchmarks

Ausgewählte Benchmarks:

LMArena Kategorien

Kategorien:

Performance Indizes

Intelligence Index

Speed Index

Preis Index

Intelligence Index

Geschwindigkeit Index

Was bedeutet das?

Warum ist das wichtig?

Preis Index

Input vs Output Preis

Beispielrechnung

KI Weekly Score

Berechnung

Normalisierung

Datenquellen

LMArena

Artificial Analysis

llm-stats

Aktualisierung

Anmelden