OpenAI hat die Veröffentlichung von Sora 2, seinem Flaggschiff -Video- und Audiogenerierungsmodell, bekannt gegeben. Das neue Modell, das eine verbesserte physische Genauigkeit, eine größere Benutzerkontrolle und die Möglichkeit, reale Elemente in generierte Szenen einfügen, aufzunehmen, wird über eine neue soziale Anwendung für iOS namens „Sora“ bereitgestellt. Diese Veröffentlichung ist ein wesentlicher Schritt nach vorne aus dem im Februar 2024 auf den Markt starteten ursprünglichen Sora-Modell. OpenAI beschreibt diesen Fortschritt als potenzielle „GPT-3,5-Moment für Video“, was auf einen erheblichen Sprung in Bezug auf Fähigkeit und Leistung hinweist.
Schlüsselverbesserungen in Sora 2
Sora 2 führt mehrere wichtige Fortschritte gegenüber seinem Vorgänger ein und nähert sich dem Ziel, einen funktionalen Weltsimulator zu schaffen.
- Verbesserte körperliche Genauigkeit: Frühere Videomodelle waren oft „überoptimistisch“ und ignorierten die realistische Physik, um die Eingabeaufforderung eines Benutzers zu erfüllen. Sora 2 zeigt eine geerdete Simulation der physischen Gesetze, die Ergebnisse genau wie ein verpasster Basketball -Schuss, das sich vom Rückenbrett abholt, und nicht in den Reifen abprallt.
- Erweiterte Benutzerkontrollierbarkeit: Das Modell kann komplizierte, Multi-Shot-Anweisungen folgen und gleichzeitig den Zustand der erzeugten Welt in verschiedenen Szenen und Kamerawinkeln beibehalten und komplexere und kohärentere Videoerzählungen ermöglichen. Es zeigt auch Kenntnisse in verschiedenen ästhetischen Stilen, einschließlich realistischer, filmischer und Anime.
- Integration der realen Elemente: Benutzer können jetzt Elemente aus der realen Welt in generierte Umgebungen injizieren. Durch die Aufzeichnung eines Videos einer Person, eines Tieres oder eines Objekts kann das Modell diese Szene in jede von Sora generierte Szene einfügen und sein Aussehen und seine Stimme genau darstellen.
Die Sora Social App und Cameos Feature
OpenAI setzt das neue Modell über eine soziale iOS -App ein, die zum Erstellen und Teilen von Videoinhalten entwickelt wurde. Das zentrale Merkmal der App ist „Cameos“, die die Fähigkeit des Modells, reale Elemente einzufügen, operationalisiert. Um einen Cameo -Auftritt zu erstellen, zeichnet ein Benutzer einen kurzen Video- und Audioclip in der App auf, das ihre Ähnlichkeit und Stimme für die Verwendung in Generationen erfasst. Benutzer haben die vollständige Kontrolle über ihre persönliche Ähnlichkeit und können entscheiden, wer ihre Cameo -Aufgabe nutzen dürfte. Sie können auch Zugriff aufnehmen oder jedes Video entfernen, das jederzeit ihren Cameo -Auftritt enthält.
Konzentrieren Sie sich auf das Wohlbefinden und die Sicherheit von Benutzern
Bei der Start der App hat OpenAI Maßnahmen zur Auslegung von Bedenken wie digitaler Sucht und sozialer Isolation beschrieben.
- Futterphilosophie: Der Feed -Algorithmus der App soll „die Erstellung maximieren, nicht Konsum“ und den Priorisierung von Inhalten von Personen, die der Benutzer folgt, und Inhalt, die wahrscheinlich ihre eigene kreative Arbeit inspirieren, priorisieren. OpenAI stellt fest, dass es „nicht optimiert für die Zeit, die im Feed aufgewendet wird“.
- Teenager Sicherheit: Zu den spezifischen Sicherheitsvorkehrungen für Jugendliche gehören die täglichen Begrenzung der täglichen Grenzen der Anzahl der Generationen, die sie anzeigen können, und strengere Berechtigungen hinsichtlich der Verwendung ihrer Kameen. OpenAI startet auch elterliche Steuerelemente über ChatGPT, um Einstellungen für Teenagerkonten zu verwalten.
- Mäßigung: Neben automatisierten Sicherheitssystemen senkt das Unternehmen seine Teams menschlicher Moderatoren, um potenzielle Fälle von Mobbing zu überprüfen.
Verfügbarkeit und Zugang
Die Sora IOS -App kann jetzt in den USA und Kanada heruntergeladen werden, um in andere Länder zu expandieren. Der Zugriff wird in einem einladungsbasierten System eingeführt, um Benutzer zu ermutigen, sich ihren Freunden anzuschließen.
- Preisgestaltung: Der Service wird zunächst kostenlos sein und „großzügige Grenzen zu beginnen“. OpenAI hat erklärt, dass der einzige aktuelle Monetarisierungsplan darin besteht, den Benutzern letztendlich zusätzliche Generationen zu bezahlen, wenn die Nachfrage die verfügbaren Rechenressourcen überschreitet.
- Sora 2 Pro: Abonnenten von Chatgpt Pro haben Zugriff auf eine experimentelle, qualitativ hochwertige Version des Modells namens Sora 2 Pro, die auf der Sora.com-Website verfügbar ist.
- API -Zugang: OpenAI plant, Sora 2 über seine API für Entwickler freizugeben. Das Vorgängermodell, Sora 1 Turbo, bleibt verfügbar.
OpenAI betrachtet die schnelle Verbesserung der Videomodelle als entscheidender Schritt zur Entwicklung allgemeiner Weltsimulatoren und Roboter-Agenten und präsentiert Sora 2 als „signifikante Fortschritt in Richtung dieses Ziels“.




