Google bringt Veo 3 auf den Markt, einen KI-Videogenerator mit Audio

Google kündigte am Dienstag Veo 3 an, einen KI-Videogenerator, der auch Audio erstellen und integrieren kann.
Das KI-Tool konkurriert mit dem Videogenerator Sora von OpenAI. Ein wesentlicher Unterschied ist jedoch die Fähigkeit, auch Audio in die erstellten Videos einzubinden. Veo 3 könne laut Unternehmen sowohl Dialoge zwischen Figuren als auch Tiergeräusche integrieren, so das Unternehmen.
„Veo 3 zeichnet sich durch herausragende Leistungen aus, von der Text- und Bildeingabe bis hin zur realen Physik und präziser Lippensynchronisation“, sagte Eli Collins, Produktvizepräsident von Google DeepMind, am Dienstag in einem Blog.
Das Video-Audio-KI-Tool ist ab Dienstag für US-Abonnenten des neuen Ultra-Abonnements von Google für 249,99 US-Dollar pro Monat erhältlich, das sich an eingefleischte KI-Enthusiasten richtet. Veo 3 wird auch für Nutzer der Vertex AI-Unternehmensplattform von Google verfügbar sein.
Google kündigte außerdem Imagen 4 an, sein neuestes Bildgenerierungstool, das laut Unternehmen durch Benutzerführung qualitativ hochwertigere Bilder erzeugt. Darüber hinaus präsentierte Google Flow, ein neues Filmtool, mit dem Nutzer filmische Videos erstellen können, indem sie Orte, Aufnahmen und Stilvorlieben beschreiben. Nutzer können über Gemini, Whisk, Vertex AI und Workspace auf das Tool zugreifen.
Die jüngsten Markteinführungen erfolgen, da Bilder und Videos zu beliebten Anwendungsfällen für generative KI-Eingabeaufforderungen werden. OpenAI-CEO Sam Altman sagte im März, der 40-Bildgenerator von ChatGPT sei so beliebt gewesen, dass die Rechenchips des Unternehmens dadurch „geschmolzen“ seien. Das Unternehmen erklärte, es müsse die Nutzung der Funktion vorübergehend einschränken.
Google hat eine gemischte Erfolgsbilanz bei seinen KI-Bildgeneratoren. Letztes Jahr musste das Unternehmen sein Tool Imagen 3 neu auf den Markt bringen , nachdem es in der Vergangenheit ungenaue Ergebnisse auf Nutzeranfragen angezeigt hatte, was zu breiter Kritik führte. Mitgründer Sergey Brin erklärte später, das Missgeschick sei auf mangelnde „gründliche Tests“ zurückzuführen.
Das Unternehmen aus Mountain View, Kalifornien, hat außerdem seinen Videogenerator Veo 2 aktualisiert. Nutzer können nun Objekte mit Textansagen zu Videos hinzufügen oder daraus entfernen. Darüber hinaus hat Google sein Musikgenerierungsmodell Lyria 2 für Kreative über die YouTube-Shorts-Plattform und Unternehmen, die Vertex AI nutzen, geöffnet.
CNBC