Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

QWEN3 zeigt offene Modelle, die immer noch mit geschlossenen Riesen mithalten können

byKerem Gülen
April 29, 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

Alibaba freigegeben QWEN3, eine Familie von KI -Modellen, die das Unternehmen am Montag übereinstimmt und manchmal Google und OpenAs die besten Modelle übertrifft. Die Modelle haben eine Größe von 0,6 Milliarden Parametern und 235 Milliarden Parameter und können unter einer „Open“ -Lizenz von der AI Dev Platform heruntergeladen werden Umarmtes Gesicht Und Github.

Die QWEN3 -Modelle werden als „hybrid“ beschrieben, da sie sich Zeit nehmen können, um durch komplexe Probleme zu „veräußen“ oder schnellere Anfragen zu beantworten. Diese Fähigkeit zur Argumentation ermöglicht es den Modellen, sich effektiv zu überprüften, ähnlich wie das O3-Modell von OpenAI, jedoch mit höherer Latenz. Laut dem QWEN-Team haben sie „nahtlos integrierte Denken und nicht denkende Modi, was den Benutzern die Flexibilität bietet, das Denkbudget zu kontrollieren“.

Einige QWEN3 -Modelle verwenden eine Mischung aus Experten (MOE) -Architektur, die rechnerisch effizienter sein kann, um Fragen zu beantworten. Moe bricht die Aufgaben in Unteraufgaben ein und delegiert sie an kleinere, spezialisierte „Experten“ -Modelle. Die Modelle unterstützen 119 Sprachen und wurden in einem Datensatz von fast 36 Billionen Token geschult, darunter Lehrbücher, Fragestundenpaare, Code-Snippets und AI-generierte Daten.

QWEN3 zeigt offene Modelle, die immer noch mit geschlossenen Riesen mithalten können
Benchmarks von Alibaba geteilt

Alibaba behaupten, dass die Fähigkeiten von QWEN3 im Vergleich zu seinem Vorgänger QWEN2 erheblich verbessert haben. Das größte QWEN3-Modell, QWEN-3-235B-A22B, tritt bei Benchmark-Bewertungen wettbewerbsfähig und schlägt die O3-Mini von OpenAI und Googles Gemini 2.5 Pro auf Codeforces, eine Plattform für Programmierwettbewerbe. Es übertrifft auch O3-Mini in der neuesten Version von Aime, einem herausfordernden Mathematik-Benchmark, und BFCL, einem Test zur Beurteilung der Fähigkeit eines Modells, über Probleme zu argumentieren.

QWEN3 zeigt offene Modelle, die immer noch mit geschlossenen Giants_02 mithalten können
Benchmarks von Alibaba geteilt

Während QWEN-3-235B-A22B nicht öffentlich verfügbar ist, ist das größte öffentliche QWEN3-Modell QWEN3-32B immer noch wettbewerbsfähig mit mehreren proprietären und offenen KI-Modellen. QWEN3-32B übertrifft das O1-Modell von OpenAI bei mehreren Tests, einschließlich des Codierungsbenchmark-LivecodeBench. Laut Alibaba ist QWEN3 in Werkzeuganlagenfunktionen, folgenden Anweisungen und Kopieren bestimmter Datenformate ausgestattet.

Tuhin Srivastava, Mitbegründer und CEO von AI Cloud Host Baseten, stellte fest, dass QWEN3 ein weiteres Beispiel dafür ist, dass offene Modelle mit Closed-Source-Systemen wie OpenAIs Schritt halten. Er fügte hinzu, dass Modelle wie QWEN3 trotz der US -Einschränkungen für Chipverkäufe nach China wahrscheinlich im Inland verwendet werden.

QWEN3 steht zum Download und über Cloud -Anbieter zur Verfügung, einschließlich Feuerwerk AI und Hyperbolic.


Ausgewähltes Bildnachweis

Tags: AlibabaQwen

Related Posts

Alibabas Qwen Code v0.5.0 verwandelt das Terminal in ein vollständiges Entwicklungsökosystem

Alibabas Qwen Code v0.5.0 verwandelt das Terminal in ein vollständiges Entwicklungsökosystem

Dezember 26, 2025
Bethesda strebt für Fallout 5 ein Gameplay von 600 Stunden an

Bethesda strebt für Fallout 5 ein Gameplay von 600 Stunden an

Dezember 26, 2025
ASUS verteidigt den falsch ausgerichteten RTX 5090 HyperX-Stromanschluss als "absichtliches Design"

ASUS verteidigt den falsch ausgerichteten RTX 5090 HyperX-Stromanschluss als "absichtliches Design"

Dezember 26, 2025
NVIDIA Open-Source-CUDA Tile IR auf GitHub

NVIDIA Open-Source-CUDA Tile IR auf GitHub

Dezember 26, 2025
Der CEO von MicroStrategy sagt zu den Bitcoin-Grundlagen "könnte nicht besser sein"

Der CEO von MicroStrategy sagt zu den Bitcoin-Grundlagen "könnte nicht besser sein"

Dezember 26, 2025
ChatGPT entwickelt sich zu einer Office-Suite mit neuen Formatierungsblöcken

ChatGPT entwickelt sich zu einer Office-Suite mit neuen Formatierungsblöcken

Dezember 26, 2025

Recent Posts

  • Alibabas Qwen Code v0.5.0 verwandelt das Terminal in ein vollständiges Entwicklungsökosystem
  • Bethesda strebt für Fallout 5 ein Gameplay von 600 Stunden an
  • ASUS verteidigt den falsch ausgerichteten RTX 5090 HyperX-Stromanschluss als "absichtliches Design"
  • NVIDIA Open-Source-CUDA Tile IR auf GitHub
  • Der CEO von MicroStrategy sagt zu den Bitcoin-Grundlagen "könnte nicht besser sein"

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.