Google hat angekündigt die Einführung von zwei generativen KI-Modellen, Veo und Imagen 3, die für Unternehmen verfügbar sind, die Vertex AI, seine Cloud-Plattform für KI-Tools, nutzen. Veo ist darauf ausgelegt, hochauflösende Videos aus Bildern und Texteingaben zu generieren, während sich Imagen 3 auf die Erstellung realistischer Bilder aus einfachen Texteingaben konzentriert.
Google führt generative KI-Modelle Veo und Imagen 3 für Unternehmen ein
Veo, entwickelt von Google DeepMind, generiert Videos mit realistisch aussehenden Menschen und Tieren. Benutzer können Inhalte erstellen, indem sie ein mit einer Textaufforderung verknüpftes Bild hochladen oder nur Text eingeben. Derzeit wird Veo für ausgewählte Unternehmen über eine private Vorschau zugänglich sein. Es produziert 1080p-Videoclips mit einer Dauer von bis zu sechs Sekunden und unterstützt 24 oder 30 Bilder pro Sekunde. Laut Warren Barkley, Senior Director für Produktmanagement bei Google Cloud, war die Reaktion der Unternehmen auf generative KI überwältigend positiv. Berichten zufolge verzeichneten Unternehmen, die diese Technologien integriert haben, einen Umsatzanstieg von 86 %.
Prompt: Zeitraffer der über den arktischen Himmel tanzenden Nordlichter, funkelnder Sterne und schneebedeckter Landschaft
Video: Google
Bild 3ebenfalls neu eingeführt, wird als Googles qualitativ hochwertigstes Bildgenerierungsmodell angepriesen. Es kann fotorealistische Bilder erstellen und bietet erweiterte Bearbeitungsfunktionen wie das Hinzufügen, Entfernen oder Erweitern von Elementen innerhalb eines Bildes. Ab nächster Woche haben alle Vertex AI-Kunden Zugriff auf Imagen 3. Marken wie Cadbury, Oreo und Milka gehören zu den ersten, die diese Modelle in ihren Marketingstrategien nutzen.
Beide Modelle enthalten digitale Wasserzeichen, um Fehlinformationen und falsche Zuordnungen zu verhindern, und nutzen dabei die SynthID-Technologie von Google DeepMind. Darüber hinaus verfügen sie über integrierte Sicherheitsmaßnahmen, um Missbrauch und die Generierung schädlicher Inhalte zu verhindern. Wichtig ist, dass keines der Modelle auf Kundendaten trainiert wird.
Veos Fähigkeiten und Grenzen
Die Verfügbarkeit von Veo in einer privaten Vorschau wird es Unternehmen wie Quora und Mondelez International ermöglichen, kreative Anwendungen zu erkunden, beispielsweise die Erstellung von Videoinhalten für ihre Plattformen. Die Fähigkeit von Veo, Szenen mit spezifischen visuellen Stilen zu erstellen, ist eines seiner herausragenden Merkmale. Es kann dynamische Inhalte produzieren, darunter Landschaftsaufnahmen und Zeitraffervideos. Allerdings ist das Modell nicht ohne Mängel. Probleme wie das Verschwinden von Objekten und unrealistische Physik, wie z. B. rückwärtsfahrende Fahrzeuge, verdeutlichen die aktuellen Einschränkungen.
Prompt: Ein Schnellschuss in einer von Bäumen gesäumten Vorstadtwohnstraße. Tagsüber mit einem klaren blauen Himmel. Gesättigte Farben, hoher Kontrast
Video: Google
Veo wurde an einer Vielzahl von Filmmaterial geschult, um seine Fähigkeiten zu verbessern. Auf die Frage nach seinen Schulungsquellen erwähnte Barkley, dass es im Einklang mit den Vereinbarungen mit den Inhaltserstellern Inhalte von YouTube „einbeziehen“ könne. Er betonte, dass Google sich auf die Verwendung hochwertiger, kuratierter Daten und die Einhaltung von Sicherheitsstandards konzentriert. Wie bei anderen KI-Modellen gibt es Bedenken hinsichtlich des Urheberrechts und proprietärer Inhalte, insbesondere angesichts der Möglichkeit, dass Modelle nahezu identische Kopien vorhandener Werke ausgeben können.
Google behauptet, Filter auf Eingabeaufforderungsebene implementiert zu haben, um potenziell schädliche Ausgaben zu verwalten. Darüber hinaus plant das Unternehmen, die Ausgabe von Veo auf Vertex AI zu entschädigen, sobald diese allgemein verfügbar ist, um Unternehmen, die das Tool nutzen, einen gewissen Schutz zu bieten.
Google integriert Veo schrittweise in seine Produktpalette, wie die Einführung in Google Labs Anfang des Jahres nach ersten Ankündigungen zeigt. Im September wurde das Modell in YouTube Shorts integriert, sodass YouTuber problemlos Hintergrundszenen und kurze Videoclips erstellen können.
Hervorgehobener Bildnachweis: Google DeepMind