Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
Subscribe
No Result
View All Result
Dataconomy DE
No Result
View All Result

Omnihuman-1 schafft Ganzkörper-AI-Avatare aus einem einzigen Bild

byKerem Gülen
Februar 11, 2025
in Artificial Intelligence, News
Home Artificial Intelligence
Share on FacebookShare on Twitter

Bytedance, die Muttergesellschaft von Tiktok, hat kürzlich gestartet Omnihuman-1, ein hoch entwickeltes Framework der AI-Videogenerierung, das hochwertige Videos aus einem einzigen Bild erstellen kann, das mit einem Audioclip in Verbindung steht. Dieses Modell kombiniert Video-, Audio- und nahezu perfekte Lippensynchronisierungsfunktionen.

https://omnihuman-lab.github.io/video/talk3.mp4

Bytedance startet Omnihuman-1: Ein neues AI-Videogenerierungsmodell

Omnihuman-1 ist bemerkenswert, nicht nur fotorealistische Videos, sondern auch anthropomorphe Cartoons, animierte Objekte und komplexe Posen zu erstellen. Daneben führte Bytedance ein weiteres KI-Modell namens Goku ein, das eine ähnliche Text-zu-Video-Qualität mit einer kompakten Architektur von 8 Milliarden Parametern erzielt, die speziell auf den Werbemarkt abzielen.

https://omnihuman-lab.github.io/video/main3.mp4

Diese Entwicklungen positionieren Bytedance unter den Top -Spielern im KI -Feld neben chinesischen Tech -Giganten wie Alibaba und Tencent. Seine Fortschritte stören die Landschaft für Inhalte von AI-generiertem Inhalt im Vergleich zu anderen Unternehmen wie Kling AI erheblich, da die umfangreiche Video-Medienbibliothek von Bytedance potenziell die größte nach Facebook ist.

https://omnihuman-lab.github.io/video/main2.mp4

Die Demo-Videos für Omnihuman-1 zeigen beeindruckende Ergebnisse aus verschiedenen Eingangstypen mit einem hohen Detailniveau und minimalen Störungen. Im Gegensatz zu herkömmlichen DeepFake-Technologien, die sich häufig ausschließlich auf Gesichtsanimationen konzentrieren, umfasst Omnihuman-1 Ganzkörperanimationen, die Gesten und Ausdrücke genau nachahmen. Darüber hinaus passt sich das KI -Modell gut an verschiedene Bildqualitäten an und erzeugt unabhängig von der ursprünglichen Eingabe eine reibungslose Bewegung.

https://omnihuman-lab.github.io/video/main1.mp4

Technische Spezifikationen von Omnihuman-1

Omnihuman-1 nutzt ein Diffusionsübertragungsmodell, um Bewegung durch Vorhersage von Bewegungsmustern Frame-by-Rahmen zu erzeugen, was zu realistischen Übergängen und Körperdynamik führt. Das Modell wurde auf einem umfangreichen Datensatz von 18.700 Stunden menschlichem Videomaterial ausgebildet und versteht eine breite Palette von Bewegungen und Ausdrücken. Bemerkenswerterweise verbessert die Trainingsstrategie „Omni-Konditionen“, die mehrere Input-Signale wie Audio-, Text- und Pose-Referenzen integriert, die Genauigkeit von Bewegungsvorhersagen.


Ausprobiert Cogvideox, eine weitere Open-Source-Text-zu-Video-KI


Trotz der vielversprechenden Fortschritte in der AI -Videogenerierung sind die ethischen Auswirkungen von Bedeutung. Die Technologie führt Risiken wie das Potenzial für den Missbrauch von Deepfake bei der Erzeugung irreführender Medien, Identitätsdiebstahl und anderer böswilliger Anwendungen ein. Infolgedessen hat Bytedance Omnihuman-1 noch nicht für die öffentliche Verwendung veröffentlicht, wahrscheinlich aufgrund dieser Bedenken. Wenn es öffentlich verfügbar ist, werden wahrscheinlich starke Schutzmaßnahmen wie digitales Wasserzeichen und Verfolgung von Content -Authentizität erforderlich sein, um potenzielle Missbräuche zu mildern.


Ausgewähltes Bildnachweis: Claudio Schwarz/Unsplash

Tags: AiOmnihuman-1Vorgestellt

Related Posts

Spotify führt KI-gestützte Prompted Playlists ein

Spotify führt KI-gestützte Prompted Playlists ein

Januar 22, 2026
Snap führt im Family Center-Update eine detaillierte Bildschirmzeitverfolgung ein

Snap führt im Family Center-Update eine detaillierte Bildschirmzeitverfolgung ein

Januar 22, 2026
Google Fotos gestaltet das Teilen mit einem immersiven Vollbild-Karussell neu

Google Fotos gestaltet das Teilen mit einem immersiven Vollbild-Karussell neu

Januar 22, 2026
NexPhone bringt ein Triple-OS-Telefon für 549 US-Dollar auf den Markt

NexPhone bringt ein Triple-OS-Telefon für 549 US-Dollar auf den Markt

Januar 22, 2026
Anthropic überarbeitet Einstellungstests dank Claude AI

Anthropic überarbeitet Einstellungstests dank Claude AI

Januar 22, 2026
Blue Origin plant Ende Februar den Start der dritten New Glenn-Mission

Blue Origin plant Ende Februar den Start der dritten New Glenn-Mission

Januar 22, 2026

Recent Posts

  • Spotify führt KI-gestützte Prompted Playlists ein
  • Snap führt im Family Center-Update eine detaillierte Bildschirmzeitverfolgung ein
  • Google Fotos gestaltet das Teilen mit einem immersiven Vollbild-Karussell neu
  • NexPhone bringt ein Triple-OS-Telefon für 549 US-Dollar auf den Markt
  • Anthropic überarbeitet Einstellungstests dank Claude AI

Recent Comments

Es sind keine Kommentare vorhanden.
Dataconomy DE

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Home
  • Sample Page

Follow Us

  • Home
  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.