OpenAI stellt den ersten benutzerdefinierten Inferenzchip namens Jalapeño vor

OpenAI enthüllte seinen ersten maßgeschneiderten Inferenzprozessor namens Jalapeño, der in Zusammenarbeit mit Broadcom entwickelt wurde. Der Prozessor geht speziell auf die besonderen Anforderungen der Inferenzsysteme von OpenAI ein, wobei das Unternehmen angibt, dass seine eigenen KI-Modelle zu seiner Entwicklung beigetragen haben.

Der Chip wird noch getestet, aber erste Ergebnisse deuten auf eine deutliche Verbesserung der Leistung pro Watt im Vergleich zu derzeit führenden Alternativen hin. Die Partnerschaft von OpenAI mit Broadcom wurde im Oktober offiziell bekannt gegeben und die Entwicklung maßgeschneiderter Chips wurde als Strategie angesehen, um die Abhängigkeit von Nvidias Grafikprozessoren zu verringern.

Google und Amazon haben vergleichbare benutzerdefinierte Chips, sogenannte „KI-Beschleuniger“, entwickelt, um maschinelle Lernaufgaben zu beschleunigen. In einem internen Podcast diskutierte OpenAI-Präsident Greg Brockman die Chip-Entwicklungsstrategie des Unternehmens nach der Ankündigung der Partnerschaft mit Broadcom. „Wir haben ein tiefes Verständnis für die Arbeitsbelastung“, sagte Brockman. „Wir haben wirklich nach bestimmten Arbeitslasten gesucht, die unterversorgt sind, [und uns gefragt], wie wir etwas aufbauen können, das das Mögliche beschleunigen kann?“

Jalapeño ist auf Inferenzaufgaben zugeschnitten, bei denen vorgefertigte KI-Modelle auf Benutzerbefehlen angewendet werden. Laut OpenAI bietet der Chip niedrige Betriebskosten bei der Verwaltung von Echtzeit-Codierungsmodellen. Für leistungsintensive Prozesse wie das Vortraining ist jedoch möglicherweise weiterhin Nvidia-Hardware erforderlich. Selbst geringfügige Reduzierungen der Inferenzkosten könnten die Rentabilität von OpenAI erheblich steigern.

Die Optimierung des Inferenzsystems ist für die zukünftige Wirtschaftlichkeit der KI von entscheidender Bedeutung, und das Unternehmen erweitert seine Fähigkeiten über den gesamten Technologie-Stack. OpenAI entwickelt gleichzeitig Produkte wie Codex und die Modelle, die sie unterstützen, und richtet gleichzeitig Rechenzentren für die Modellbereitstellung ein. Es wird erwartet, dass die Umstellung auf kundenspezifisches Silizium diese betrieblichen Effizienzen weiter steigern wird.

OpenAI erläuterte, dass seine Strategie das Design von Infrastrukturkomponenten umfasst, einschließlich Chiparchitektur, Kerneln, Speichersystemen, Netzwerk-, Planungs- und Bereitstellungssystemen. Dieser umfassende Ansatz ermöglicht eine Optimierung über alle Technologieebenen hinweg mit dem Ziel, schnellere, zuverlässigere und kostengünstigere Modelle für Benutzer bereitzustellen.

Quelle des hervorgehobenen Bildes