Das chinesische KI-Einhorn DeepSeek hält die Branche hinsichtlich der Veröffentlichung seiner Modelle der nächsten Generation im Ungewissen. V4 und R2. Trotz heftiger Spekulationen über einen möglichen Start im kommenden Mondneujahr, Das Unternehmen lehnte es ab, sich zu bestimmten Daten zu äußern.
Stattdessen, Das Unternehmen lässt seine Forschung sprechen. In den letzten Wochen DeepSeek hat mehrere technische Dokumente veröffentlicht, in denen neuartige Methoden zur Umgehung aktueller Hardwarebeschränkungen beschrieben werden. Da US-Sanktionen Chinas Zugang zu fortschrittlichen Nvidia-GPUs einschränken, Die neueste Forschung von DeepSeek konzentriert sich auf die algorithmische Effizienz.
Am Dienstag, Das Unternehmen stellte vor:Engramm,„Eine bedingte Speichertechnik, die entwickelt wurde, um GPU-Speicherengpässe bei hoher Bandbreite zu beheben – ein kritischer Engpass bei der Skalierung von KI. Dies folgt einem von CEO Liang Wenfeng mitverfassten Artikel über „manifold-constrained hyper-connections“ (mHC), ein Rahmenwerk, das darauf abzielt, riesige Systeme kostengünstiger zu trainieren.
Analysten glauben, dass diese Innovationen strategische Schritte sind, um trotz geopolitischer Gegenwinde die Dynamik aufrechtzuerhalten. „DeepSeek möchte lediglich beweisen, dass Innovationen in der KI-Infrastruktur die Effizienz steigern würden,“ sagte Zhang Ruiwang, ein in Peking ansässiger Architekt für Informationssysteme.
Während das Erscheinungsdatum für die Nachfolger der Modelle V3 und R1 ein Rätsel bleibt, Das Unternehmen bestätigte, dass sein Kernteam intakt bleibt. In einem aktualisierten Papier zum R1-Modell wurde festgestellt, dass alle 18 ursprünglichen Kernwissenschaftler noch im Unternehmen sind. trotzt Chinas hoher Branchenfluktuation.





