DeepMind hat eingeführt Genie 2, ein fortschrittliches KI-Modell, das aus einfachen Textbeschreibungen und Bildern interaktive 3D-Welten generieren kann. Der am 4. Dezember 2024 angekündigte Nachfolger von Genie 1 erstellt vielfältige virtuelle Umgebungen, die es Benutzern ermöglichen, sich dynamisch über Tastatur- und Maussteuerung zu engagieren und Aktionen wie Springen und Schwimmen zu simulieren. Es wird anhand verschiedener Videos trainiert und kann Interaktionen, Physik und NPC-Verhalten modellieren.
DeepMind bringt Genie 2 auf den Markt, eine revolutionäre KI für 3D-Welten
Genie 2 ist in der Lage, eine Vielzahl von 3D-Szenen zu visualisieren und bietet ähnliche Funktionalitäten wie AAA-Videospiele. Durch die Verarbeitung von Eingabeaufforderungen kann das Modell konsistente Umgebungen erzeugen, einschließlich Ego- und isometrischer Perspektiven, die zwischen 10 und 20 Sekunden dauern, wobei einige bis zu einer Minute dauern. Die Behauptungen von DeepMind behaupten, dass sich das Modell Teile einer Szene merkt, die nicht unmittelbar sichtbar sind, und sie beim erneuten Erscheinen genau wiedergibt. Dies steht im Gegensatz zu bestehenden Modellen wie dem Minecraft-Simulator von Decart, die oft Probleme mit Konsistenz und Auflösung haben.
Diese durchgesickerten Battlemage-Intel-GPUs sind Gaming-Monster
Das grundlegende Element von Genie 2 besteht in der Verarbeitung eines Referenzbilds gepaart mit einer Textaufforderung, wodurch die Generierung hochgradig interaktiver Umgebungen optimiert wird. Beispielsweise ermöglicht eine Aufforderung wie „Ein süßer humanoider Roboter im Wald“ dem Modell, eine entsprechende Szene zu erstellen. Die Einbeziehung komplexer Interaktionen, wie z. B. das Platzieren von Ballons oder das Navigieren durch Umgebungen, stellt die robuste Physik-Engine des Spiels unter Beweis. Trotz dieser Fähigkeiten bestehen Bedenken hinsichtlich der Interpretation der Eingaben durch das Modell, insbesondere hinsichtlich der Frage, ob es aufgrund fehlender Details zu den Trainingsdatenquellen versehentlich urheberrechtlich geschützte Spielelemente repliziert.
Die Auswirkungen der Trainingsdaten von Genie 2 auf geistiges Eigentum werfen erhebliche Fragen auf. DeepMind profitiert vom umfassenden Zugriff von Google auf YouTube und nutzt möglicherweise Videoinhalte für das Modelltraining. Dieser Zugriff führt zu Spekulationen über die Herstellung unlizenzierter Reproduktionen der beobachteten Spiele, die Gegenstand einer rechtlichen Prüfung sein könnten. Da das KI-Modell die Grenzen der Originalität verwischt, ist die Sorge vor unbefugter Replikation von großer Bedeutung.
Erkenntnisse aus a VERDRAHTET Die Untersuchung ergab, dass große Unternehmen, darunter Activision Blizzard, KI-Technologien einsetzen, um Prozesse zu rationalisieren, was möglicherweise zum Verlust von Arbeitsplätzen führt. Die Einführung von Genie 2 könnte die Situation weiter verkomplizieren, in der KI-Tools die Entwicklung beschleunigen und gleichzeitig traditionelle Jobrollen in Frage stellen.
DeepMind betont die Rolle von Genie 2 bei der Entwicklung vielfältiger Bewertungsaufgaben für KI-Agenten. Während die Rechenanforderungen und Kommerzialisierungsaussichten des Modells noch nicht bekannt gegeben werden, deuten laufende Fortschritte auf eine sich entwickelnde Beziehung zwischen KI und Spieldesign hin. Verschiedene Berichte deuten auf einen Zustrom von Investitionen in Weltmodelltechnologien hin, was einen entscheidenden Wandel sowohl in der KI-Forschung als auch in interaktiven Spielerlebnissen bedeutet. Dieser Trend geht mit einer wachsenden Faszination für das Potenzial von KI einher, die Kreativbranche neu zu gestalten.
Die gezielten Einstellungsbemühungen von DeepMind unterstreichen das Engagement für bahnbrechende Entwicklungen. Ihre strategische Rekrutierung von Talenten von anderen führenden KI-Unternehmen bekräftigt ihre Absicht, an der Spitze generativer KI-Technologien zu bleiben.
Ausgewählte Bild- und Videonachweise: Google DeepMind