GLM-4.7

Zhipu AI

Language Model Oct 2025

78.37

KI Weekly Score

205K

Kontextfenster

$0.60

Input / 1M

$2.20

Output / 1M

198

tok/s

210ms

Latency TTFT

Performance

Multi-Dimensionale Bewertung

Arena Score

1435

SWE-bench

73.8%

GPQA Diamond

85.7%

HarmBench

85.6%

MMMU-Pro

62.4%

Benchmark	Score
AIR-Bench 2024 Regulatorisch relevant für EU-Deployment. Prüft Compliance mit AI Act Anforderungen.	83.20%
Chatbot Arena ELO-basierter Score aus Community-Bewertungen auf LMArena. Einzige große Quelle echter menschlicher Präferenz.	1435.00ELO
GPQA Diamond Graduate-Level Google-Proof Q&A. Differenziert zwischen Frontier-Modellen bei Expertenwissen.	85.70%
HarmBench Offizieller Standard der AI Safety Institutes. Misst Robustheit gegen schädliche Prompts.	85.60%
HELM Umfassendste Multi-Dimensionen-Bewertung von Stanford. Testet Genauigkeit, Kalibrierung, Robustheit.	86.70Score
LiveCodeBench Kontaminationsfreier Coding-Benchmark mit ständig neuen Aufgaben.	64.80%
MMLU-Pro Aktueller Standard für breites Wissen. Erweiterte Version mit schwierigeren Fragen aus 57 Fachgebieten.	85.20%
MMMU-Pro Bester Test für multimodale Fähigkeiten. Prüft Verständnis von Bildern und Diagrammen.	62.40%
RULER Entlarvt übertriebene Context-Length-Claims. Testet tatsächliche Nutzung langer Kontexte.	91.30%
SWE-bench Verified Realistischster Test für praktische Coding-Fähigkeiten. Misst die Fähigkeit, echte GitHub Issues zu lösen.	73.80%

Intelligence Index 86.7

Coding Index 84.5

Agentic Index 77.2

Output Speed 198 tok/s

Time to First Token 210 ms

Benchmark	Score	Kategorie	Quelle
AA Intelligence Index ?	87	Arena	artificialanalysis
Chatbot Arena ?	1435	Arena	llmstats
HELM ?	87	Arena	llmstats
AA Coding Index ?	84	Coding	artificialanalysis
LiveCodeBench ?	64.8%	Coding	llmstats
SWE-bench Verified ?	73.8%	Coding	llmstats
GPQA Diamond ?	85.7%	Knowledge	llmstats
MMLU-Pro ?	85.2%	Knowledge	llmstats
AIR-Bench 2024 ?	83.2%	Safety	llmstats
HarmBench ?	85.6%	Safety	llmstats
MMMU-Pro ?	62.4%	Multimodal	llmstats
RULER ?	91.3%	Capability	llmstats
Latency (First Token) ?	210ms	Speed	artificialanalysis
Output Speed ?	198 tok/s	Speed	artificialanalysis
Input Price ?	$0.60	Cost	artificialanalysis
Output Price ?	$2.20	Cost	artificialanalysis
AA Agentic Index ?	77	Agent	artificialanalysis