Retour aux benchmarks
📊

Analyse

Analyse, résumé

8 modèlesMises à jour hebdomadaires

Exemples de tâches

Exemples de tâches dans cette catégorie

Facile

Sentiment Classification

Classify sentiment of customer reviews.

Difficile

Compare Two Documents

Compare two product descriptions and highlight differences.

Moyen

Data Summary

Analyze data and provide insights.

Classement des modèles

Voir la méthodologie
RangModèleScorePrix/1MTâches
🥇Qwen3 235B93.0$0.601
🥈GPT-4o Mini93.0$0.601
🥉DeepSeek R193.0$2.191
4Qwen3 Max93.0$1.601
5GPT-4o90.0$10.001
6Claude 3.5 Haiku87.0$4.001
7Llama 3.3 70B87.0$0.401
8Gemini 2.0 Flash83.0$0.401