OpenAI hat heute mit seinem für Schlagzeilen gesorgt Bekanntmachung der allgemeinen Verfügbarkeit von GPT-4 für Entwickler über die GPT-4-API. Ab heute Nachmittag erhalten bestehende OpenAI-API-Entwickler, die für ihre „Geschichte erfolgreicher Zahlungen“ bekannt sind, Zugriff auf die hochentwickelten Funktionen von GPT-4. Die Roadmap von OpenAI sieht außerdem eine erweiterte Einführung für neue Entwickler bis Ende des Monats vor, mit anschließenden Plänen für eine breitere Verfügbarkeitssteigerung „abhängig von der Rechenverfügbarkeit“.
Das Interesse an der GPT-4-API ist seit März stark gestiegen, und „Millionen von Entwicklern haben Zugriff beantragt“. OpenAI teilte in einem Blogbeitrag das spannende Spektrum der laufenden Innovationen mit GPT-4 und hat eine Vision für eine Zukunft formuliert, in der „Chat-basierte Modelle jeden Anwendungsfall unterstützen können“.
OpenAI stellt die GPT-4-API der Öffentlichkeit zur Verfügung
Was GPT-4 von seinem Vorgänger GPT-3.5 unterscheidet, ist seine verbesserte Fähigkeit, Text einschließlich Code zu generieren und gleichzeitig Bild- und Texteingaben zu ermöglichen. Die Leistung des Modells auf „menschlicher Ebene“ bei verschiedenen beruflichen und akademischen Benchmarks unterstreicht seinen bemerkenswerten Fortschritt zusätzlich. Wie bei früheren GPT-Modellen von OpenAI verwendet GPT-4 ein Trainingsprogramm, das öffentlich zugängliche Daten, beispielsweise solche, die von öffentlichen Webseiten stammen, in Verbindung mit lizenzierten Daten umfasst.
Die Enthüllung der Bildverständnisfunktion wurde jedoch sorgfältig geplant. OpenAI hat derzeit für vorläufige Tests mit einem einzigen Partner, Be My Eyes, zusammengearbeitet. Ein Zeitplan für die Ausweitung dieser Funktion auf einen breiteren Kundenstamm ist noch nicht festgelegt.
Obwohl GPT-4 einen bedeutenden Meilenstein in generativen KI-Modellen darstellt, ist es wichtig zu betonen, dass es nicht ohne Einschränkungen ist. Das Modell „halluziniert“ gelegentlich Fakten und macht dabei Denkfehler, manchmal mit Zuversicht. Eine besondere Herausforderung besteht darin, nicht aus Erfahrungen zu lernen, was zu potenziellen Problemen wie dem Einfügen von Sicherheitslücken in den generierten Code führen kann.
Im Hinblick auf zukünftige Entwicklungen hat OpenAI seine Absicht deutlich gemacht, Entwicklern die Feinabstimmung von GPT-4 und seinem etwas schwächeren Gegenstück GPT-3.5 Turbo zu ermöglichen. Diese Anpassungen, die durch die Verwendung der eigenen Daten der Entwickler erleichtert werden, stimmen mit den Personalisierungsmöglichkeiten mehrerer anderer OpenAI-Textgenerierungsmodelle überein. Laut OpenAI sollten Entwickler mit der Einführung dieser neuen Funktion noch in diesem Jahr rechnen können.
Nach der Veröffentlichung von GPT-4 im März kam es in der Landschaft der generativen KI zu einer dramatischen Eskalation des Wettbewerbs. Anthropic, ein bemerkenswerter Konkurrent, hat kürzlich das Kontextfenster von Claude, seinem primären textgenerierenden KI-Modell, das sich noch in der Vorschau befindet, erweitert und es von 9.000 auf unglaubliche 100.000 Token erweitert. Dieses Kontextfenster bezieht sich auf das Textsegment, das das Modell berücksichtigt, bevor es weiteren Text generiert, wobei Token Rohtextblöcke darstellen. Beispielsweise würde das Wort „Computer“ in die Token „com“, „put“ und „er“ unterteilt.
Zuvor hielt GPT-4 den Rekord für das größte Kontextfenster und konnte am oberen Ende beeindruckende 32.000 Token vorweisen. Im Allgemeinen neigen Modelle mit begrenzten Kontextfenstern dazu, den Inhalt sogar aktueller Gespräche zu „vergessen“, was dazu führt, dass sie abschweifen.
In einer gleichzeitigen Ankündigung gab OpenAI die allgemeine Verfügbarkeit seiner DALL-E 2- und Whisper-APIs bekannt. Ersteres ist das bildgenerierende Modell von OpenAI, während letzteres, „Whisper“, das Speech-to-Text-Modell des Unternehmens bezeichnet. OpenAI teilte auch seine Pläne mit, ältere Modelle, die über seine API verfügbar sind, auslaufen zu lassen, um „zu optimieren“. [its] Rechenkapazität.“ Die Entscheidung ist eine Reaktion auf die jüngsten Schwierigkeiten von OpenAI, die wachsende Nachfrage nach seinen generativen Modellen zu befriedigen, ein Anstieg, der größtenteils auf die explosionsartige Beliebtheit von ChatGPT zurückzuführen ist.
Wie kann ChatGPT Windows-Schlüssel generieren: Ein Interview
Im Rahmen dieses Übergangs werden ab dem 4. Januar 2024 bestimmte ältere OpenAI-Modelle, insbesondere GPT-3 und seine Varianten, eingestellt und durch einen neuen Satz „Basis-GPT-3“-Modelle ersetzt, die vermutlich auf eine höhere Recheneffizienz ausgelegt sind. Entwickler, die auf die alten Modelle angewiesen sind, müssen ihre Integrationen bis zum 4. Januar manuell aktualisieren. Darüber hinaus müssen diejenigen, die über dieses Datum hinaus mit der Verwendung fein abgestimmter älterer Modelle fortfahren möchten, die Ersetzungen mithilfe der neuen Basis-GPT-3-Modelle optimieren .
„Wir werden Benutzer unterstützen, die zuvor Modelle verfeinert haben, um diesen Übergang so reibungslos wie möglich zu gestalten“, schrieb OpenAI. „In den kommenden Wochen werden wir uns an Entwickler wenden, die diese älteren Modelle kürzlich verwendet haben, und weitere Informationen bereitstellen, sobald die neuen Komplettierungsmodelle für frühe Tests bereit sind.“
10 Dinge, die Sie mit der GPT-4-API tun können
- Mit den umfangreichen Erzählfunktionen der GPT-4-API revolutioniert die Erstellung komplexer Romane mit verschachtelten Handlungssträngen und tiefgreifender Charakterentwicklung den Bereich des literarischen Schaffens.
- Die GPT-4-API ebnet den Weg für die Emulation verblüffend realistischer Dialoge, die die Authentizität und Präzision menschlicher Interaktionen widerspiegeln.
- Die GPT-4-API demonstriert Kompetenz in der sofortigen Sprachübersetzung und überbrückt effektiv Kommunikationslücken in einer Vielzahl von Sprachen und Kulturen.
- Die mit fortschrittlicher Datenanalyse ausgestattete GPT-4-API ermöglicht genaue Vorhersagen von Börsentrends und liefert Marktteilnehmern unschätzbare Erkenntnisse.
- Mit der Fähigkeit, äußerst realistische virtuelle Umgebungen zu erstellen, die die Dynamik der realen Welt widerspiegeln, verbessert die GPT-4-API das Eintauchen in Bereiche wie Gaming und virtuelle Realität.
- Die Fähigkeit der GPT-4-API, komplexen Computercode zu generieren, macht sie zu einem unverzichtbaren Verbündeten für Softwareentwickler.
- Die GPT-4-API kann medizinische Daten interpretieren und analysieren und so bei der genauen Diagnose und Vorhersage verschiedener Gesundheitszustände helfen.
- Die GPT-4-API nutzt ihre fortschrittlichen Fähigkeiten zur Sprachgenerierung und gewährleistet die schnelle und genaue Generierung von Rechtsdokumenten.
- Die GPT-4-API demonstriert die Fähigkeit, Verbraucherdaten zu interpretieren und maßgeschneiderte Marketinginhalte zu generieren, die bei der Zielgruppe effektiv ankommen.
- Die GPT-4-API hat das Potenzial, wissenschaftliche Innovationen voranzutreiben, indem sie riesige Mengen wissenschaftlicher Daten analysiert, um neue Erkenntnisse in so unterschiedlichen Bereichen wie Chemie, Physik und Biologie zu gewinnen.
Hervorgehobener Bildnachweis: Jonathan Kemper/Unsplash