Q3
Premium

Qwen: Qwen3 VL 235B A22B Instruct

von qwen

Qwen3-VL-235B-A22B Instruct ist ein offenes multimodales Modell, das starke Textgenerierung mit visuellem Verständnis über Bilder und Videos hinweg vereint. Das Instruct-Modell zielt auf den allgemeinen Einsatz von Vision-Sprache ab, einschließlich Visual Question Answering (VQA), Dokumentenanalyse, Diagramm-/Tabellenextraktion und mehrsprachiger Optical Character Recognition (OCR). Die Serie legt Wert auf robuste Wahrnehmung (Erkennung verschiedener realer und synthetischer Kategorien), räumliches Verständnis (2D/3D-Grounding) und langfristiges visuelles Verständnis, mit wettbewerbsfähigen Ergebnissen bei öffentlichen multimodalen Benchmarks sowohl für Wahrnehmung als auch für Argumentation. Über die Analyse hinaus unterstützt Qwen3-VL agentische Interaktion und Werkzeugnutzung: Es kann komplexe Anweisungen über Multi-Bild-, Multi-Turn-Dialoge befolgen; Text an Video-Timelines für präzise zeitliche Abfragen anpassen; und GUI-Elemente für Automatisierungsaufgaben bedienen. Die Modelle ermöglichen auch visuelle Codierungs-Workflows – das Umwandeln von Skizzen oder Mockups in Code und die Unterstützung beim UI-Debugging – während sie eine starke reine Textleistung beibehalten, die mit den Flaggschiff-Sprachmodellen von Qwen3 vergleichbar ist. Dies macht Qwen3-VL für Produktionsszenarien geeignet, die Dokumenten-KI, mehrsprachiges OCR, Software-/UI-Unterstützung, räumliche/verkörperte Aufgaben und Forschung an Vision-Sprach-Agenten umfassen. Zu den wichtigsten Spezifikationen gehören ein Kontextfenster von 262K Tokens und eine maximale Ausgabe von 4K Tokens. Es unterstützt Vision-, Funktionen-, Code- und Streaming-Fähigkeiten. Die Preisgestaltung ist wettbewerbsfähig mit 0,20 $/1,20 $ pro 1 Million Tokens (Eingabe/Ausgabe) und ist über den PRO-Zugang verfügbar.

Vision KIMultimodalCode-GenerierungOCRAgentische KI
78%Qualität
262KKontextfenster
70%Geschwindigkeit
Kategorie
Standard
API-Zugang
Einheitlicher Kontext
RAG + Knowledge Base
24/7 Support
Dieses Modell testenModelle vergleichen

Am besten für

Chat
Code-Generierung
Mathematik

🚀 Fähigkeiten

Vision
Funktionen
Code
Streaming

Einschränkungen

Keine Bildgenerierung
Kein Internetzugang

Spezifikationen

Anbieterqwen
Kontextfenster262,144 Token
Max. Ausgabe4,096 Token
MindestplanPremium

Preise

Eingabepreis$0.2000 / 1M Token
Ausgabepreis$1.2000 / 1M Token

💡 Mit PRO-Abo werden die Kosten um 20% reduziert

Bereit, Qwen: Qwen3 VL 235B A22B Instruct auszuprobieren?

Erhalten Sie 1.000 Token kostenlos bei der Anmeldung

Kostenlos starten