QWEN3 zeigt offene Modelle, die immer noch mit geschlossenen Riesen mithalten können

Alibaba freigegeben QWEN3, eine Familie von KI -Modellen, die das Unternehmen am Montag übereinstimmt und manchmal Google und OpenAs die besten Modelle übertrifft. Die Modelle haben eine Größe von 0,6 Milliarden Parametern und 235 Milliarden Parameter und können unter einer „Open“ -Lizenz von der AI Dev Platform heruntergeladen werden Umarmtes Gesicht Und Github.

Die QWEN3 -Modelle werden als „hybrid“ beschrieben, da sie sich Zeit nehmen können, um durch komplexe Probleme zu „veräußen“ oder schnellere Anfragen zu beantworten. Diese Fähigkeit zur Argumentation ermöglicht es den Modellen, sich effektiv zu überprüften, ähnlich wie das O3-Modell von OpenAI, jedoch mit höherer Latenz. Laut dem QWEN-Team haben sie „nahtlos integrierte Denken und nicht denkende Modi, was den Benutzern die Flexibilität bietet, das Denkbudget zu kontrollieren“.

Einige QWEN3 -Modelle verwenden eine Mischung aus Experten (MOE) -Architektur, die rechnerisch effizienter sein kann, um Fragen zu beantworten. Moe bricht die Aufgaben in Unteraufgaben ein und delegiert sie an kleinere, spezialisierte „Experten“ -Modelle. Die Modelle unterstützen 119 Sprachen und wurden in einem Datensatz von fast 36 Billionen Token geschult, darunter Lehrbücher, Fragestundenpaare, Code-Snippets und AI-generierte Daten.

QWEN3 zeigt offene Modelle, die immer noch mit geschlossenen Riesen mithalten können — Benchmarks von Alibaba geteilt

Alibaba behaupten, dass die Fähigkeiten von QWEN3 im Vergleich zu seinem Vorgänger QWEN2 erheblich verbessert haben. Das größte QWEN3-Modell, QWEN-3-235B-A22B, tritt bei Benchmark-Bewertungen wettbewerbsfähig und schlägt die O3-Mini von OpenAI und Googles Gemini 2.5 Pro auf Codeforces, eine Plattform für Programmierwettbewerbe. Es übertrifft auch O3-Mini in der neuesten Version von Aime, einem herausfordernden Mathematik-Benchmark, und BFCL, einem Test zur Beurteilung der Fähigkeit eines Modells, über Probleme zu argumentieren.

QWEN3 zeigt offene Modelle, die immer noch mit geschlossenen Giants_02 mithalten können — Benchmarks von Alibaba geteilt

Während QWEN-3-235B-A22B nicht öffentlich verfügbar ist, ist das größte öffentliche QWEN3-Modell QWEN3-32B immer noch wettbewerbsfähig mit mehreren proprietären und offenen KI-Modellen. QWEN3-32B übertrifft das O1-Modell von OpenAI bei mehreren Tests, einschließlich des Codierungsbenchmark-LivecodeBench. Laut Alibaba ist QWEN3 in Werkzeuganlagenfunktionen, folgenden Anweisungen und Kopieren bestimmter Datenformate ausgestattet.

Tuhin Srivastava, Mitbegründer und CEO von AI Cloud Host Baseten, stellte fest, dass QWEN3 ein weiteres Beispiel dafür ist, dass offene Modelle mit Closed-Source-Systemen wie OpenAIs Schritt halten. Er fügte hinzu, dass Modelle wie QWEN3 trotz der US -Einschränkungen für Chipverkäufe nach China wahrscheinlich im Inland verwendet werden.

QWEN3 steht zum Download und über Cloud -Anbieter zur Verfügung, einschließlich Feuerwerk AI und Hyperbolic.

Ausgewähltes Bildnachweis

Tags: Alibaba Qwen

QWEN3 zeigt offene Modelle, die immer noch mit geschlossenen Riesen mithalten können

Related Posts

Alibabas Qwen Code v0.5.0 verwandelt das Terminal in ein vollständiges Entwicklungsökosystem

Bethesda strebt für Fallout 5 ein Gameplay von 600 Stunden an

ASUS verteidigt den falsch ausgerichteten RTX 5090 HyperX-Stromanschluss als "absichtliches Design"

NVIDIA Open-Source-CUDA Tile IR auf GitHub

Der CEO von MicroStrategy sagt zu den Bitcoin-Grundlagen "könnte nicht besser sein"

ChatGPT entwickelt sich zu einer Office-Suite mit neuen Formatierungsblöcken

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

QWEN3 zeigt offene Modelle, die immer noch mit geschlossenen Riesen mithalten können

Related Posts

Alibabas Qwen Code v0.5.0 verwandelt das Terminal in ein vollständiges Entwicklungsökosystem

Bethesda strebt für Fallout 5 ein Gameplay von 600 Stunden an

ASUS verteidigt den falsch ausgerichteten RTX 5090 HyperX-Stromanschluss als "absichtliches Design"

NVIDIA Open-Source-CUDA Tile IR auf GitHub

Der CEO von MicroStrategy sagt zu den Bitcoin-Grundlagen "könnte nicht besser sein"

ChatGPT entwickelt sich zu einer Office-Suite mit neuen Formatierungsblöcken

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us