Die Blackwell-GPUs von Nvidia stehen vor Überhitzungsproblemen, von denen große Technologiekunden betroffen sind. Die Prozessoren der nächsten Generation haben Schwierigkeiten, in Server-Racks mit 72 GPUs effektiv zu funktionieren, was bei Unternehmen wie Google, Meta und Microsoft Bedenken hinsichtlich einer rechtzeitigen Bereitstellung aufkommen lässt. Berichten zufolge überprüft Nvidia seine Rack-Designs aufgrund dieser Überhitzungsprobleme, die zu einer Beschädigung von Komponenten und einer Einschränkung der GPU-Leistung führen können, mehrmals. Der voraussichtliche Stromverbrauch für diese Konfigurationen beträgt bis zu 120 kW pro Rack.
Insider informiert Die Informationen dass Nvidias Blackwell-GPUs für KI und Hochleistungsrechnen (HPC) in Servern mit hoher Kapazität überhitzt sind, was sich auf die Startzeitpläne für Kunden auswirkt, die auf diese Technologien angewiesen sind. Um den Komplikationen, die sich aus diesen Überhitzungsproblemen ergeben, entgegenzuwirken, hat Nvidia seine Zulieferer aufgefordert, die Rack-Designs wiederholt zu modifizieren. Ein Sprecher von Nvidia betonte den kollaborativen Ansatz mit Cloud-Diensten und beschrieb die Designänderungen als routinemäßigen Teil des Entwicklungsprozesses.
Anpassungen im Design, um Überhitzungsproblemen entgegenzuwirken
Zuvor wurden Verzögerungen beim Blackwell-Produktionshochlauf auf einen „ertragsmindernden“ Konstruktionsfehler zurückgeführt. Der Blackwell B100- und B200-GPUs nutzen die CoWoS-L-Verpackungstechnologie von TSMC, die zwei Chiplets für verbesserte Datenübertragungsgeschwindigkeiten von bis zu 10 TB/s integriert. Allerdings führte eine Diskrepanz in den Wärmeausdehnungseigenschaften zwischen den GPU-Chiplets und anderen Komponenten zu Verformungen und Systemausfällen. Um dieses Problem zu lösen, hat Nvidia Änderungen an den Metallschichten und Bump-Strukturen des GPU-Siliziums vorgenommen.
Das Ergebnis dieser Verbesserungen ging erst Ende Oktober in die Massenproduktion, wobei die erwarteten Liefertermine auf Ende Januar verschoben wurden. Diese Verzögerung ist für Nvidias Kunden von entscheidender Bedeutung Google, MetaUnd Microsoftdie auf diese GPUs angewiesen sind, um ihre leistungsstärksten KI-Modelle zu verbessern. Nvidia hatte zuvor angepriesen, dass die Blackwell-Chips im Vergleich zu früheren Modellen 30-mal schneller für Aufgaben wie die Beantwortung von Chatbot-Anfragen seien.
Der Umsatz mit Blackwell-Chips von Nvidia soll im nächsten Quartal 6 Milliarden US-Dollar erreichen, was die hohe Nachfrage trotz der anhaltenden Lieferengpässe unterstreicht. Nvidia hat kürzlich Apple überholt und ist heute mit einer Marktkapitalisierung von 3,482 Billionen US-Dollar das wertvollste Unternehmen der Welt. Allerdings drohen die anhaltenden Rückschläge bei den Blackwell-Prozessoren die geplanten Fortschritte bei den KI-Fähigkeiten zu gefährden, die für große Technologieunternehmen unerlässlich sind.
Hervorgehobener Bildnachweis: Nvidia