Tencent hat am 5. Dezember Hunyuan 2.0 veröffentlicht, ein großes Sprachmodell mit insgesamt 406 Milliarden Parametern. Dieses Update zielt auf Fortschritte in Mathematik, Codierung und komplexem Denken durch eine Mixture-of-Experts-Architektur und verfeinerte Trainingsmethoden ab. Das Modell gibt es in zwei Varianten: Think und Instruct. Seine Architektur aktiviert bei jeder Inferenz 32 Milliarden Parameter und ermöglicht so eine effiziente Verarbeitung. Es unterstützt ein Kontextfenster von 256.000 Token und ermöglicht die Verarbeitung umfangreicher Eingaben ohne Kürzung. Tencent positioniert HY 2.0 Think als eines der „ersten Unternehmen im Inland“, wenn es um komplexe Denkaufgaben geht. Diese Version übertrifft ihren Vorgänger Hunyuan-T1-20250822 in mehreren Bewertungsbereichen. Beim IMO-AnswerBench-Mathematik-Benchmark erzielte HY 2.0 Think eine Punktzahl von 73,4, was starke Fähigkeiten zur Problemlösung in mathematischen Bereichen widerspiegelt. Bei Software-Engineering-Bewertungen verbesserte sich die Leistung gegenüber dem SWE-Bench-Verified-Benchmark deutlich und stieg von 6,0 beim Vorgängermodell auf 53,0. Diese Verbesserung zeigt eine höhere Genauigkeit beim Generieren und Debuggen von Code für reale Programmierherausforderungen. https://twitter.com/TencentHunyuan/status/1996948083377332614 Tencent führt diese Fortschritte auf Verbesserungen der Datenqualität vor dem Training und einen zweistufigen Reinforcement-Learning-Ansatz zurück. Diese Strategie integriert RLVR (Reinforcement Learning with Verifiable Rewards), das objektive Metriken für das Training verwendet, und RLHF (Reinforcement Learning from Human Feedback), das menschliche Bewertungen zur Verfeinerung der Ergebnisse einbezieht. HY 2.0 Think wendet Längenstrafenstrategien an, um übermäßige Ausführlichkeit in Antworten zu verhindern, was zu einer von Tencent als „branchenführend“ bezeichneten Recheneffizienz pro Token führt. Dieses Design optimiert die Ressourcennutzung während der Generierung und reduziert Verarbeitungszeit und -kosten. Auch die Codierungs- und Agentenfunktionen haben sich weiterentwickelt, wobei der Tau2-Bench-Score von 17,1 auf 72,4 gestiegen ist. Diese Metriken bewerten die autonome Aufgabenausführung und codebezogene Interaktionen. Die Integration erstreckt sich auf die Verbraucheranwendungen von Tencent wie Yuanbao und ima, wo das Modell die Benutzerinteraktionen verbessert. Entwickler können über die API-Plattform von Tencent Cloud für benutzerdefinierte Implementierungen darauf zugreifen. Tencent plant, verwandte Technologien und Modelle als Open-Source-Lösung für die Community-Nutzung bereitzustellen.





