Menu
G

GLM-4.7

Zhipu AI

Language Model Oct 2025
78.37
KI Weekly Score
205K
Kontextfenster
$0.60
Input / 1M
$2.20
Output / 1M
198
tok/s
210ms
Latency TTFT

Performance

Multi-Dimensionale Bewertung
Arena Score
1435
SWE-bench
73.8%
GPQA Diamond
85.7%
HarmBench
85.6%
MMMU-Pro
62.4%

LLM Stats Benchmarks

Benchmark Score
AIR-Bench 2024
Regulatorisch relevant fĂĽr EU-Deployment. PrĂĽft Compliance mit AI Act Anforderungen.
83.20%
Chatbot Arena
ELO-basierter Score aus Community-Bewertungen auf LMArena. Einzige große Quelle echter menschlicher Präferenz.
1435.00ELO
GPQA Diamond
Graduate-Level Google-Proof Q&A. Differenziert zwischen Frontier-Modellen bei Expertenwissen.
85.70%
HarmBench
Offizieller Standard der AI Safety Institutes. Misst Robustheit gegen schädliche Prompts.
85.60%
HELM
Umfassendste Multi-Dimensionen-Bewertung von Stanford. Testet Genauigkeit, Kalibrierung, Robustheit.
86.70Score
LiveCodeBench
Kontaminationsfreier Coding-Benchmark mit ständig neuen Aufgaben.
64.80%
MMLU-Pro
Aktueller Standard fĂĽr breites Wissen. Erweiterte Version mit schwierigeren Fragen aus 57 Fachgebieten.
85.20%
MMMU-Pro
Bester Test für multimodale Fähigkeiten. Prüft Verständnis von Bildern und Diagrammen.
62.40%
RULER
Entlarvt übertriebene Context-Length-Claims. Testet tatsächliche Nutzung langer Kontexte.
91.30%
SWE-bench Verified
Realistischster Test für praktische Coding-Fähigkeiten. Misst die Fähigkeit, echte GitHub Issues zu lösen.
73.80%

Artificial Analysis

Intelligence

Intelligence Index 86.7
Coding Index 84.5
Agentic Index 77.2

Speed & Latency

Output Speed 198 tok/s
Time to First Token 210 ms

Alle Benchmarks

Benchmark Score Kategorie Quelle
AA Intelligence Index ? 87 Arena artificialanalysis
Chatbot Arena ? 1435 Arena llmstats
HELM ? 87 Arena llmstats
AA Coding Index ? 84 Coding artificialanalysis
LiveCodeBench ? 64.8% Coding llmstats
SWE-bench Verified ? 73.8% Coding llmstats
GPQA Diamond ? 85.7% Knowledge llmstats
MMLU-Pro ? 85.2% Knowledge llmstats
AIR-Bench 2024 ? 83.2% Safety llmstats
HarmBench ? 85.6% Safety llmstats
MMMU-Pro ? 62.4% Multimodal llmstats
RULER ? 91.3% Capability llmstats
Latency (First Token) ? 210ms Speed artificialanalysis
Output Speed ? 198 tok/s Speed artificialanalysis
Input Price ? $0.60 Cost artificialanalysis
Output Price ? $2.20 Cost artificialanalysis
AA Agentic Index ? 77 Agent artificialanalysis