Qwen2.5-VL 7B Instruct от команды Qwen — это высокоразвитая мультимодальная большая языковая модель, разработанная для превосходного визуального понимания. Она достигает передовых результатов в различных визуальных тестах, включая MathVista, DocVQA, RealWorldQA и MTVQA, демонстрируя исключительное понимание изображений независимо от разрешения или соотношения сторон. Помимо статических изображений, Qwen2.5-VL 7B Instruct может понимать видео продолжительностью более 20 минут, что позволяет создавать высококачественные ответы на вопросы по видео, диалоги и контент. Его передовые возможности рассуждения и принятия решений позволяют ему функционировать как агент, управляющий мобильными устройствами или роботами на основе визуальной среды и текстовых инструкций. Модель также предлагает надежную многоязычную поддержку, понимая тексты на изображениях на многих языках, включая европейские языки, японский, корейский, арабский и вьетнамский. Она имеет контекстное окно в 32K токенов и максимальный вывод в 4K токенов, стоимость составляет $0.20/0.20 за 1M токенов (ввод/вывод). Получите бесплатный доступ к этой мощной модели зрения на Multi AI. Использование этой модели регулируется ЛИЦЕНЗИОННЫМ СОГЛАШЕНИЕМ Tongyi Qianwen.
✅ Лучше всего для
🚀 Возможности
❌ Ограничения
Характеристики
| Провайдер | qwen |
| Окно контекста | 32,768 токенов |
| Максимальный вывод | 4,096 токенов |
| Минимальный тариф | Эконом |
Цены
| Цена ввода | $0.2000 / 1M токенов |
| Цена вывода | $0.2000 / 1M токенов |
💡 С подпиской PRO стоимость снижается на 20%
Готовы попробовать Qwen: Qwen2.5-VL 7B Instruct?
Получите 1,000 токенов бесплатно при регистрации
Начать бесплатно