Luglio 15, 2024

TeleAlessandria

Informazioni sull'Italia. Seleziona gli argomenti di cui vuoi saperne di più

L’ultimo generatore video AI di Runway dà vita a mostri giganti di zucchero filato

L’ultimo generatore video AI di Runway dà vita a mostri giganti di zucchero filato
Ingrandire / Uno screenshot di un video Runway Gen-3 Alpha creato con il messaggio “Un essere umano gigante, fatto di soffice zucchero filato blu, calpesta il terreno, ruggendo verso il cielo, con un cielo azzurro dietro di lui.”

Domenica, Runway ha annunciato un nuovo modello di sintesi video AI chiamato Gen 3 alfa Questo è ancora in fase di sviluppo, ma sembra creare video di qualità simile a Sora Video di OpenAI, che ha debuttato all’inizio di quest’anno (e non è ancora stato rilasciato). Può creare nuovi video ad alta risoluzione da messaggi di testo che vanno da esseri umani realistici a mostri surreali che vagano per la campagna.

A differenza della passerella Miglior modello precedente A partire da giugno 2023, che può creare solo clip di 2 secondi, secondo quanto riferito, la Gen-3 Alpha può creare video di 10 secondi di persone, luoghi e cose che hanno consistenza e coerenza che superano facilmente la Gen-2. Se 10 secondi sembrano brevi rispetto al minuto intero di video di Sora, tieni presente che l’azienda opera con un budget di elaborazione ridotto rispetto a OpenAI, generosamente finanziato, e in realtà ha una storia di capacità di creazione di video per gli utenti commerciali.

Gen-3 Alpha non genera audio per accompagnare i video e le generazioni temporalmente coerenti (quelle che mantengono la coerenza della personalità nel tempo) hanno maggiori probabilità di fare affidamento su Materiali di formazione simili di alta qualità. Ma è difficile ignorare il miglioramento di Runway in termini di fedeltà visiva nell’ultimo anno.

L’intelligenza artificiale video si surriscalda

Sono state due settimane impegnative per l’installazione di video sull’intelligenza artificiale nella comunità di ricerca sull’intelligenza artificiale, compreso il lancio del modello cinese Kling, creato dalla Kuaishou Technology con sede a Pechino (a volte chiamata “Kwai”). Kling può creare due minuti di video HD 1080p a un livello di 30 fotogrammi al secondo Dettagli e coesione Si dice che corrisponda a Sora.

READ  L'arte ASCII suscita risposte dannose da 5 principali chatbot AI

Prompt Alpha Gen-3: “Riflessi nascosti di una donna nel finestrino di un treno che si muove a una velocità vertiginosa in una città giapponese.”

Poco dopo il debutto di Kling, le persone sui social media hanno iniziato a diventare creative Video surreali sull’intelligenza artificiale Utilizzando Luma AI Macchina da sogno Luma. Questi video erano nuovi e strani ma nel complesso interessanti Manca di coesione; Abbiamo testato la Dream Machine e non siamo rimasti colpiti da nulla di ciò che abbiamo visto.

Nel frattempo, Runway, con sede a New York City, fondata nel 2018, una delle principali società di text-to-video, si è recentemente trovata vittima di meme che mostravano che la sua tecnologia Gen-2 non era più popolare rispetto ai modelli di composizione video più recenti. Questa è probabilmente la motivazione dietro l’annuncio della Gen-3 Alpha.

Prompt Alpha Gen-3: “Un astronauta corre attraverso un vicolo a Rio de Janeiro.”

Creare esseri umani realistici è sempre stato difficile per i modelli di composizione video, quindi Runway mostra specificamente la capacità di Gen-3 Alpha di creare ciò che i suoi sviluppatori chiamano personaggi umani “espressivi” con una gamma di azioni, gesti ed emozioni. Tuttavia, l’azienda Esempi forniti Non è particolarmente espressivo – la maggior parte delle persone fissano e sbattono le palpebre lentamente – ma sembra realistico.

Gli esempi umani forniti includono video generati di una donna su un treno, un astronauta che corre per strada, un uomo il cui volto è illuminato dalla luce di un televisore, una donna alla guida di un’auto e una donna che corre, tra gli altri.

READ  Recensione di Surface Pro 11 e Laptop 7: il momento di Apple Silicon per Windows

Gen-3 Alpha Prompt: “Primo piano di una giovane donna alla guida di un’auto, con l’aria pensierosa, una foresta verde sfocata visibile attraverso il finestrino piovoso dell’auto.”

I video demo creati includono anche esempi di installazioni video più surreali, tra cui una creatura gigante che cammina attraverso una città fatiscente, un uomo fatto di rocce che cammina attraverso una foresta e il gigantesco mostro di zucchero filato mostrato di seguito, che è forse il miglior video mai visto sul mercato. pagina.

Gen-3 Alpha Prompt: “Un essere umano gigante, fatto di soffice zucchero filato blu, calpesta il terreno, ruggendo verso il cielo, con un cielo azzurro dietro di lui.”

La Gen-3 alimenterà diversi strumenti di editing AI di Runway (uno dei maggiori motivi di fama dell’azienda), tra cui Spazzola multiazione, Controlli avanzati della fotocameraE Modalità gestore. Può creare video da istruzioni di testo o immagini.

Runway afferma che il Gen-3 Alpha è il primo di una serie di modelli addestrati su una nuova infrastruttura progettata per l’addestramento multimodale su larga scala, facendo un passo avanti verso quello che chiama “Modelli globali generali“, che sono sistemi di intelligenza artificiale virtuale che costruiscono rappresentazioni interne di ambienti e le utilizzano per simulare eventi futuri all’interno di quegli ambienti.