L’intelligenza artificiale accelera il passo, e il mondo della creazione digitale ne sperimenta le trasformazioni più dirette. Google si posiziona al centro di questa evoluzione, come dimostrano le recenti presentazioni avvenute durante il suo evento per sviluppatori, Google I/O 2025. L’azienda ha presentato soluzioni che trasformeranno i metodi creativi per video e immagini e che metteranno a disposizione di un ampio pubblico capacità d’avanguardia.
Sul fronte video, Veo 3 si distingue per la sua capacità di generare filmati completi di audio perfettamente sincronizzato. Complesse realtà urbane pervase da suoni realistici o sereni panorami naturali animati dal cinguettio degli uccelli nascono dalla capacità generativa del modello. Miglioramenti nella sincronia labiale e una simulazione fisica più fedele del mondo reale sono tra i suoi punti di forza, aspetti che ne elevano la qualità complessiva. Attualmente, l’utilizzo di Veo 3 è limitato agli iscritti a Gemini Ultra negli Stati Uniti attraverso l’app Gemini, e agli utenti business su Vertex AI, una disponibilità quindi ancora circoscritta.
Per la creazione di immagini, Imagen 4 eleva la qualità in maniera percepibile. Questo generatore produce immagini con un livello di dettaglio notevole, capace di rendere la complessità di tessuti o la morbidezza di pellicce con grande fedeltà. Può creare sia contenuti fotorealistici sia opere astratte, in diversi formati e con una risoluzione fino a 2000 pixel. Un progresso apprezzabile riguarda la gestione del testo all’interno delle immagini, un ambito che in passato presentava limiti evidenti. Imagen 4 si trova già disponibile nell’app Gemini, su Vertex AI e integrato in applicazioni Workspace quali Docs e Slides. È inoltre prevista una variante più performante, circa dieci volte più veloce del predecessore Imagen 3, che promette tempi di elaborazione ridotti.
Flow: l’assistente narrativo di Google
Tra le novità più articolate figura Flow, una piattaforma pensata per orchestrare la creazione di filmati con il supporto dell’AI. Flow amalgama le potenzialità di Veo per i video, Imagen per le immagini e le capacità conversazionali di Gemini, per offrire un vero e proprio assistente narrativo. Sostanzialmente, si propone come uno strumento per aiutare i narratori a esplorare concetti e a costruire clip e sequenze, quasi un evoluto blocco per appunti visivi. Il modello Veo 2 di Google, che rimane pienamente operativo e costituisce una solida alternativa, rappresenta una base importante per Flow, con la sua abilità nell’estendere la durata dei filmati e nel generare video con una buona approssimazione della fisica e del realismo.
I creator possono sfruttare il linguaggio naturale tramite Gemini per guidare e perfezionare i video prodotti. È possibile importare materiali propri o generarne di nuovi con Imagen attraverso semplici comandi testuali. Notevole è la capacità di fondere scene e creazioni differenti assicurando una coerenza stilistica all’intero progetto. Flow non si ferma alla generazione: include opzioni avanzate di regia, come il controllo dei movimenti di una “camera” virtuale, la scelta delle inquadrature, più funzioni di montaggio ed estensione delle clip con l’aggiunta di transizioni. Per una gestione ordinata, la piattaforma integra un sistema per l’organizzazione degli asset e dei prompt. Google ha coinvolto professionisti del cinema come Dave Clark, Henry Daubrez e Junie Lau nel processo di sviluppo per raccogliere feedback preziosi. L’accesso a Flow è per ora concesso agli abbonati AI Pro e AI Ultra, con piani di estensione ad altre aree geografiche. Il piano Pro offre tutti gli strumenti con 100 generazioni al mese, mentre l’abbonamento Ultra fornisce generazioni illimitate e accesso prioritario a Veo 3 e alla sua funzione di audio nativo.
Veo 2 e SynthID: continuità e trasparenza
L’arrivo di Veo 3 non significa l’abbandono della versione precedente. Veo 2 continua infatti il suo percorso di supporto agli utenti. Con esso, è possibile usare immagini come riferimento per costruire scene, gestire l’angolazione della videocamera, modificare lo zoom e cambiare il formato del video da verticale a orizzontale. Si possono anche inserire o rimuovere elementi dalle immagini, un’opzione preziosa per chi desidera un controllo granulare e specifico. Google ha anche introdotto il portale SynthID Detector, un servizio per tentare di risalire all’origine dei media digitali. Gli utenti caricano un file e il sistema verifica la presenza di SynthID, una filigrana digitale invisibile che Google ha sviluppato e in parte reso open source. Poiché non tutti i sistemi di generazione di immagini adottano questa specifica tecnologia, la sua efficacia nel riconoscimento non è universale per ogni contenuto, ma rappresenta un passo verso una maggiore trasparenza.