Woche 12, 2026 • 9 Modelle getestet
KI-Modell-Benchmarks
Finden Sie Ihr ideales Modell in 60 Sekunden
9
Modelle getestet
40
Aufgaben
5
Kategorien
Wöchentlich
Updates
Gesamtrangliste
Top-KI-Modelle über alle Kategorien
| Rang | Modell | Punktzahl | Preis/1M | Aufgaben | |
|---|---|---|---|---|---|
| 🥇 | Claude 3.5 Sonnet | 97.8 | $15.00 | 6 | |
| 🥈 | Qwen3 235B | 97.6 | $0.60 | 7 | |
| 🥉 | Qwen3 Max | 97.0 | $1.60 | 7 | |
| 4 | GPT-4o | 96.7 | $10.00 | 7 | |
| 5 | GPT-4o Mini | 95.1 | $0.60 | 7 | |
| 6 | DeepSeek R1 | 92.9 | $2.19 | 7 | |
| 7 | Gemini 2.0 Flash | 87.7 | $0.40 | 7 | |
| 8 | Llama 3.3 70B | 84.0 | $0.40 | 7 | |
| 9 | Claude 3.5 Haiku | 78.0 | $4.00 | 7 |
Nach Kategorie
Detaillierte Leistungsvergleiche nach Aufgabentyp
💻
Programmierung
Algorithmen, Debugging, Code-Review
Ergebnisse ansehen
✍️
Schreiben
Anzeigen, E-Mails, Content
Ergebnisse ansehen
🌍
Übersetzung
Mehrsprachige Übersetzung
Ergebnisse ansehen
📊
Analyse
Datenanalyse, Zusammenfassung
#1:Qwen3 235B93.0
Ergebnisse ansehen
🧠
Logik
Rätsel, Mathematik, Planung
#1:Qwen3 235B98.3
Ergebnisse ansehen
Wöchentliche Berichte
Detaillierte Analyse im Blog lesen
Wöchentliche Berichte mit Erkenntnissen, Trends und Empfehlungen
Top-Modelle testen
Testen Sie die besten KI-Modelle
Alle Benchmark-Gewinner auf unserer Plattform. Kostenlos testen!
Kostenlose Stufe
Keine Kreditkarte