N3
Баланс

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5

от nvidia

NVIDIA: Llama 3.3 Nemotron Super 49B V1.5 — это мощная модель для рассуждений и чата с 49 миллиардами параметров, ориентированная на английский язык. Она построена на основе Meta’s Llama-3.3-70B-Instruct и имеет обширное окно контекста в 128K токенов. Эта модель тщательно дообучена для агентских рабочих процессов, включая генерацию с дополненным поиском (RAG) и надежный вызов инструментов, посредством контролируемой тонкой настройки (SFT) в различных областях, таких как математика, программирование, наука и многоходовые чаты. Дальнейшее усовершенствование достигается за счет нескольких этапов обучения с подкреплением (RL), включая оптимизацию предпочтений с учетом вознаграждения (RPO) для выравнивания, RL с проверяемыми вознаграждениями (RLVR) для пошагового рассуждения и итеративную DPO для совершенствования поведения при использовании инструментов. Модель демонстрирует впечатляющие результаты внутренних оценок, такие как MATH500 pass@1 = 97.4 и LiveCodeBench = 73.58, демонстрируя сильные способности к рассуждению и кодированию. Она разработана для практической эффективности вывода, предлагая высокую скорость токенов в секунду и уменьшенное потребление VRAM, поддерживая развертывание на одной GPU (H100/H200) через Transformers/vLLM. С окном контекста в 131K токенов и максимальным выходом в 4K токенов, она идеально подходит для создания агентов, помощников и систем извлечения с длинным контекстом, где важны сбалансированная точность-стоимость и надежное использование инструментов. Цена составляет $0.10/0.40 за 1 миллион токенов (вход/выход) в рамках уровня доступа STARTER.

ТекстАгентский ИИРассуждениеИспользование Инструментов
72%Качество
131KОкно контекста
70%Скорость
Категория
Эконом
Доступ к API
Единый контекст
RAG + Knowledge Base
Поддержка 24/7
Попробовать модельСравнить модели

Лучше всего для

Чат
Генерация Кода
Творческое Письмо
Агентские Рабочие Процессы

🚀 Возможности

Функции
Потоковая передача

Ограничения

Нет генерации изображений
Нет доступа в интернет

Характеристики

Провайдерnvidia
Окно контекста131,072 токенов
Максимальный вывод4,096 токенов
Минимальный тарифБаланс

Цены

Цена ввода$0.1000 / 1M токенов
Цена вывода$0.4000 / 1M токенов

💡 С подпиской PRO стоимость снижается на 20%

Готовы попробовать NVIDIA: Llama 3.3 Nemotron Super 49B V1.5?

Получите 1,000 токенов бесплатно при регистрации

Начать бесплатно