Google lancia Veo 3, un generatore video AI che incorpora l'audio

Google ha annunciato martedì Veo 3, un generatore video basato sull'intelligenza artificiale in grado anche di creare e incorporare audio.
Lo strumento di intelligenza artificiale compete con il generatore video Sora di OpenAI, ma la sua capacità di incorporare anche l'audio nei video che crea è un elemento distintivo fondamentale. L'azienda ha affermato che Veo 3 può incorporare audio che include dialoghi tra i personaggi e versi di animali.
"Veo 3 eccelle dalla richiesta di testo e immagini alla fisica del mondo reale e alla sincronizzazione labiale accurata", ha affermato martedì in un blog Eli Collins, vicepresidente del prodotto Google DeepMind.
Lo strumento di intelligenza artificiale video-audio sarà disponibile da martedì per gli abbonati statunitensi al nuovo piano Ultra di Google da 249,99 dollari al mese, pensato per gli appassionati di intelligenza artificiale più accaniti. Veo 3 sarà disponibile anche per gli utenti della piattaforma aziendale Vertex AI di Google.
Google ha anche annunciato Imagen 4, il suo ultimo strumento di generazione di immagini, che, a detta dell'azienda, produce immagini di qualità superiore tramite prompt utente. Google ha inoltre presentato Flow, un nuovo strumento per la produzione di film che consente agli utenti di creare video di qualità cinematografica descrivendo location, inquadrature e preferenze di stile. Gli utenti possono accedere allo strumento tramite Gemini, Whisk, Vertex AI e Workspace.
Gli ultimi lanci arrivano mentre immagini e video stanno diventando casi d'uso popolari per i prompt di intelligenza artificiale generativa. A marzo, il CEO di OpenAI, Sam Altman, ha dichiarato che il generatore di immagini 4o di ChatGPT era così popolare da causare la "fusione" dei chip di elaborazione dell'azienda. L'azienda ha dichiarato di aver dovuto limitare temporaneamente l'utilizzo della funzionalità.
Google ha un curriculum altalenante per quanto riguarda i suoi generatori di immagini basati sull'intelligenza artificiale. L'anno scorso, l'azienda ha dovuto rilanciare il suo strumento Imagen 3 dopo aver fornito risultati storicamente inaccurati alle richieste degli utenti, suscitando critiche diffuse. Il co-fondatore Sergey Brin ha poi affermato che l'incidente era dovuto alla mancanza di "test approfonditi".
L'azienda di Mountain View, California, ha anche aggiornato il suo generatore video Veo 2 per includere la possibilità per gli utenti di aggiungere o rimuovere oggetti dai video tramite prompt testuali. Inoltre, Google ha aperto il suo modello di generazione musicale Lyria 2 ai creator tramite la piattaforma YouTube Shorts e alle aziende che utilizzano Vertex AI.
GUARDA: Google I/O: posta in gioco altissima per la vetrina dell'intelligenza artificiale
CNBC