Microsoft stellt den Maia 200-Chip vor, um die KI-Inferenz zu beschleunigen

Microsoft angekündigt Der Maia 200-Chip soll am Montag die KI-Inferenz skalieren und über 100 Milliarden Transistoren für schnellere Geschwindigkeiten und höhere Effizienz als der Maia 100 2023 verfügen. Der Maia 200 liefert mehr als 10 Petaflops bei 4-Bit-Präzision und etwa 5 Petaflops bei 8-Bit-Leistung. Microsoft nennt es ein Silizium-Arbeitstier, das speziell für KI-Inferenzaufgaben entwickelt wurde. Bei diesem Prozess werden trainierte KI-Modelle ausgeführt, um Ausgaben zu generieren, die sich von der Trainingsphase unterscheiden, in der diese Modelle erstellt werden. Mit der Ausweitung der KI-Operationen macht Inferenz nun einen wachsenden Anteil der gesamten Rechenkosten aus, was die Bemühungen zu einer Rationalisierung vorantreibt. Das Unternehmen positioniert den Maia 200 so, dass Betriebsstörungen und Stromverbrauch bei KI-Einsätzen reduziert werden. Ein einzelner mit dem Chip ausgestatteter Knoten verarbeitet die größten aktuellen KI-Modelle und lässt gleichzeitig Kapazität für wesentlich größere Modelle übrig. Microsoft erklärte: „In der Praxis kann ein Maia 200-Knoten mühelos die größten Modelle von heute betreiben, mit viel Spielraum für noch größere Modelle in der Zukunft.“ Diese Version steht im Einklang mit einem Muster großer Technologieunternehmen, die kundenspezifische Prozessoren entwickeln, um die Abhängigkeit von den Grafikprozessoren von Nvidia zu verringern, die die KI-Arbeitslasten dominieren. Nvidia-GPUs sind für den KI-Erfolg von zentraler Bedeutung geworden und bieten Alternativen zur Verwaltung der Hardwarekosten. Google bietet Tensor-Processing-Einheiten oder TPUs nicht als eigenständige Chips, sondern als cloudbasierte Rechenressourcen an. Amazon bietet Trainium-KI-Beschleunigerchips an, wobei Trainium 3 der dritten Generation im Dezember veröffentlicht wurde. Diese Optionen ermöglichen es Unternehmen, einige Arbeitslasten von der Nvidia-Hardware zu verlagern und so die Gesamtkosten zu senken. Microsoft behauptet, dass der Maia 200 die Konkurrenz bei wichtigen Kennzahlen übertrifft. Er erreicht die dreifache FP4-Leistung der Trainium-Chips der dritten Generation von Amazon. Seine FP8-Leistung übertrifft die der TPUs der siebten Generation von Google, wie in der Pressemitteilung des Unternehmens vom Montag erläutert. Der Chip unterstützt bereits interne KI-Bemühungen. Es basiert auf Modellen, die vom Superintelligence-Team von Microsoft entwickelt wurden. Auch der Betrieb des Copilot-Chatbots basiert auf Maia 200-Hardware. Ab Montag hat Microsoft die Einladungen an externe Benutzer ausgeweitet. Entwickler, Akademiker und KI-Forschungslabore können jetzt auf das Software-Entwicklungskit Maia 200 zugreifen und es in ihre Arbeitslasten integrieren.

Hervorgehobener Bildnachweis

No Result