N4
Premium

Nous: Hermes 4 405B

par nousresearch

Nous: Hermes 4 405B est un modèle de raisonnement à grande échelle de pointe développé par Nous Research, exploitant la puissante architecture Meta-Llama-3.1-405B. Ce modèle introduit un mode de raisonnement hybride innovant, lui permettant de délibérer en interne avec des traces <think>...</think> ou de répondre directement, équilibrant vitesse et profondeur. Les utilisateurs peuvent contrôler précisément ce comportement à l'aide du booléen `reasoning` `enabled`. Il est réglé par instruction avec un corpus post-entraînement étendu d'environ 60 milliards de jetons, mettant spécifiquement l'accent sur les traces de raisonnement pour améliorer considérablement les performances en mathématiques, en codage, dans les domaines STEM et en raisonnement logique général, tout en conservant une large utilité en tant qu'assistant. Au-delà de ses prouesses en matière de raisonnement, Hermes 4 prend en charge une variété de sorties structurées, y compris le mode JSON, la conformité aux schémas, l'appel de fonctions et l'utilisation d'outils, ce qui le rend très polyvalent pour l'intégration dans diverses applications. Le modèle est entraîné pour une meilleure orientabilité, des taux de refus plus faibles et un alignement vers un comportement neutre et dirigé par l'utilisateur. Avec une fenêtre de contexte substantielle de 131K jetons et une sortie maximale de 4K jetons, il peut gérer des conversations étendues et générer des réponses détaillées. La tarification est compétitive à 1,00 $ par million de jetons d'entrée et 3,00 $ par million de jetons de sortie, disponible sur notre niveau d'accès PRO. Ses capacités incluent les fonctions, la génération de code, le streaming et l'intégration de la recherche.

IA de RaisonnementGénération de CodeGénération de TexteBasé sur LlamaAppel de Fonctions
80%Qualité
131KFenêtre de contexte
65%Vitesse
Catégorie
Standard
Accès API
Contexte unifié
RAG + Knowledge Base
Support 24/7
Essayer ce modèleComparer les modèles

Idéal pour

Chat
Raisonnement Complexe
Assistance au Code
Résolution de Problèmes Logiques

🚀 Capacités

Fonctions
Génération de Code
Streaming
Recherche

Limitations

Pas de génération d'images

Spécifications

Fournisseurnousresearch
Fenêtre de contexte131,072 tokens
Sortie max4,096 tokens
Forfait minimumPremium

Tarifs

Prix d'entrée$1.0000 / 1M tokens
Prix de sortie$3.0000 / 1M tokens

💡 Avec l'abonnement PRO, le coût est réduit de 20%

Prêt à essayer Nous: Hermes 4 405B ?

Obtenez 1 000 tokens gratuits à l'inscription

Commencer gratuitement