Balance

Qwen: Qwen3 VL 235B A22B Instruct

Name: Qwen: Qwen3 VL 235B A22B Instruct
Brand: qwen
Price: 200 USD
Rating: 3.9 (1 reviews)

Qwen3-VL-235B-A22B Instruct ist ein offenes multimodales Modell, das starke Textgenerierung mit visuellem Verständnis über Bilder und Videos hinweg vereint. Das Instruct-Modell zielt auf den allgemeinen Einsatz von Vision-Sprache ab, einschließlich Visual Question Answering (VQA), Dokumentenanalyse, Diagramm-/Tabellenextraktion und mehrsprachiger Optical Character Recognition (OCR). Die Serie legt Wert auf robuste Wahrnehmung (Erkennung verschiedener realer und synthetischer Kategorien), räumliches Verständnis (2D/3D-Grounding) und langfristiges visuelles Verständnis, mit wettbewerbsfähigen Ergebnissen bei öffentlichen multimodalen Benchmarks sowohl für Wahrnehmung als auch für Argumentation. Über die Analyse hinaus unterstützt Qwen3-VL agentische Interaktion und Werkzeugnutzung: Es kann komplexe Anweisungen über Multi-Bild-, Multi-Turn-Dialoge befolgen; Text an Video-Timelines für präzise zeitliche Abfragen anpassen; und GUI-Elemente für Automatisierungsaufgaben bedienen. Die Modelle ermöglichen auch visuelle Codierungs-Workflows – das Umwandeln von Skizzen oder Mockups in Code und die Unterstützung beim UI-Debugging – während sie eine starke reine Textleistung beibehalten, die mit den Flaggschiff-Sprachmodellen von Qwen3 vergleichbar ist. Dies macht Qwen3-VL für Produktionsszenarien geeignet, die Dokumenten-KI, mehrsprachiges OCR, Software-/UI-Unterstützung, räumliche/verkörperte Aufgaben und Forschung an Vision-Sprach-Agenten umfassen. Zu den wichtigsten Spezifikationen gehören ein Kontextfenster von 262K Tokens und eine maximale Ausgabe von 4K Tokens. Es unterstützt Vision-, Funktionen-, Code- und Streaming-Fähigkeiten. Die Preisgestaltung ist wettbewerbsfähig mit 0,20 $/1,20 $ pro 1 Million Tokens (Eingabe/Ausgabe) und ist über den PRO-Zugang verfügbar.

Vision KIMultimodalCode-GenerierungOCRAgentische KI

78%Qualität

262KKontextfenster

70%Geschwindigkeit

Kategorie

Economy

✓API-Zugang

✓Einheitlicher Kontext

✓RAG + Knowledge Base

✓24/7 Support

Dieses Modell testen Modelle vergleichen