Il meglio di Domus direttamente nella tua mail!

Abbiamo provato Sora, l’AI che crea video con ChatGpt

L’esperienza di un alpha artist, uno dei primi utenti della piattaforma text-to-video di OpenAi: i dubbi sono tanti, tra cui la necessità di soluzioni più accessibili e aperte.

La recente uscita di Sora, il software text-to-video sviluppato da OpenAI, promette di ridefinire l’approccio alla produzione cinematografica. Grazie ad esso è possibile generare clip a partire da semplici istruzioni testuali, avvicinandosi al sogno di “scrivere un video” con la stessa facilità con cui si crea un documento di testo. Anche se siamo ancora agli inizi, le potenzialità sono chiare: per ora lo strumento è ideale per brevi filmati artistici, spot pubblicitari o contenuti sperimentali, ma in futuro potrebbe diventare la base di produzioni più complesse.

Avendo avuto l’opportunità di sperimentare Sora in anteprima come alpha artist, l’impressione è che si tratti di una delle tecnologie text-to-video più avanzate. Ciò non significa che il software crei automaticamente capolavori: come per tutte le AI generative, ottenere risultati mediocri è facile, mentre raggiungere risultati interessanti richiede capacità creative, conoscenze tecniche e un approccio aperto all’errore.

A differenza delle altre Ai generative, Sora richiede risorse significative in termini di costi, essendo disponibile con l’abbonamento a ChatGPT pro di 200$ al mese, ed è dunque uno strumento alla portata di pochi. Il target di riferimento sembrerebbe composto per lo più da professionisti o aziende. Purtroppo un po’ tutti i software text-to-video sono costosi per via degli ingenti consumi (un piano analogo della concorrente Runaway costa 100$ al mese, ma senza ChatGPT) e questi costi sono comunque in linea con i software per professionisti disponibili sul mercato (la suite grafica Adobe ad esempio costa attorno ai 70$ al mese). Va inoltre riconosciuto che nonostante il prezzo elevato Sora rende più accessibile la produzione audiovisiva, perché i costi di produzione video sono in genere molto, molto più alti.

Sul fronte del lavoro, l’arrivo di tecnologie di text-to-video come Sora è destinato a trasformare profondamente l’industria audiovisiva.

Un altro elemento cruciale sono i guardrail, ovvero le limitazioni integrate per evitare usi impropri o eticamente discutibili del software. Non è possibile ad esempio eccedere con la violenza, il nudo, personaggi famosi, materiale protetto da copyright e altro. Alcuni filtri sono così forti che bloccano immagini o prompt del tutto innocui anche secondo queste linee guida piuttosto restrittive. A mio parere, più che protezioni utili i guardrail sono un modo in cui le aziende cercano di evitare grane legali e non scatenare ulteriormente il media panic, una dinamica ricorrente che accompagna l’introduzione di ogni nuova tecnologia. Come descritto da Amy Orben, il media panic segue un “ciclo sisifeo”: la società davanti alle nuove tecnologie vive un’impennata di timori e ansie, solo per scoprire, col tempo, che quei timori erano sproporzionati o persino infondati. Questo fenomeno si è visto con l’arrivo dei romanzi, accusati nell’Ottocento di minare la morale, ma anche con il telefono, la radio, la televisione, la musica rock e i videogiochi, per fare qualche esempio. Nonostante la storia ci mostri che queste paure si rivelano spesso esagerate, ogni volta riaffiora la convinzione che “questa volta sia diverso”.

Visualizza questo post su Instagram

Un post condiviso da Francesco D'Isa (@disa_fran)

Nel caso di Sora, i guardrail nascono in gran parte da paure legate ai deepfake, immagini o video falsi considerati una minaccia alla verità, alla democrazia e alla salute mentale dei giovani. Tuttavia, come sottolinea la sociologa Kirsten Drotner, il panico tecnologico spesso non riguarda davvero la protezione di individui o gruppi vulnerabili, ma il tentativo delle generazioni più anziane di difendere il proprio potere di fronte ai cambiamenti portati dai più giovani. L’ansia per i deepfake inoltre riflette un'idea superata secondo cui i media e le immagini sarebbero uno specchio fedele della realtà. A guidare l’opinione pubblica invece, come ho già scritto in queste pagine, è più l’impianto narrativo e la fonte da cui proviene una notizia, come dimostrano le recenti elezioni americane. I guardrail di Sora riflettono quest’ansia e finiscono per limitare l’espressione creativa più di quanto prevengano reali abusi. Ciò di cui abbiamo bisogno non sono controlli sempre più rigidi (e spesso eludibili), ma una cultura tecnologica che promuova un uso consapevole e responsabile. Il nostro motto dovrebbe essere insegnare, non vietare.

Un altro degli aspetti controversi di tecnologie come Sora riguarda il loro impatto ambientale e le conseguenze sul mercato del lavoro. È noto che l’addestramento e l’utilizzo di modelli di AI generativi richiedono un elevato consumo di energia. Tuttavia, se confrontiamo questa impronta ecologica con quella di produzioni tradizionali – set fisici, spostamenti della troupe, materiali di scena, rendering 3D – potrebbe emergere un bilancio decisamente migliore. Certo, un uso di massa di Sora è al momento non sostenibile, ma per progetti mirati l’introduzione di questa tecnologia potrebbe persino mitigare alcuni aspetti dell’impatto ambientale del settore audiovisivo.

Sul fronte del lavoro, l’arrivo di tecnologie di text-to-video come Sora è destinato a trasformare profondamente l’industria audiovisiva. Alcuni professionisti potrebbero vedere ridursi la domanda per le loro competenze, soprattutto nelle grandi produzioni, dove Sora potrebbe ottimizzare costi e tempi. Al tempo stesso, però, queste tecnologie offrono opportunità a piccoli creatori e studi indipendenti, che con risorse limitate potranno aspirare a realizzare contenuti visivi complessi, prima impensabili. Prevedere con esattezza l’influsso di queste tecnologie sul lavoro è complicato, proprio come lo era all’epoca dell’adozione di software per l’impaginazione di libri e riviste. Anche allora si temeva che molti ruoli tradizionali venissero cancellati, ma la realtà si è dimostrata più sfumata, con vecchie professionalità decadute ma anche nuove emergenti.

Il rischio è che l’adozione di queste tecnologie venga guidata esclusivamente da logiche di risparmio economico. Ridurre Sora e strumenti analoghi a mere scorciatoie per abbattere i costi sarebbe miope. Il vero potenziale delle Ai risiede nella loro capacità di espandere le frontiere creative, offrendo nuovi linguaggi e opportunità. Vivere in un sistema capitalista tuttavia significa spesso vedere l’innovazione subordinata al profitto, e i vantaggi di pochi schiacciare quelli di molti. Ancora una volta però, il problema non è la tecnologia, ma il contesto sociale in cui si inserisce e che la plasma.

Merita una nota anche il recente leak di Sora, condotto da alcuni artisti coinvolti nel programma di testing, che ha portato alla pubblicazione di materiale riservato prima dell’uscita ufficiale, accompagnato da un manifesto critico nei confronti di OpenAI. Gli autori del leak hanno denunciato l’assenza di compensi per il loro lavoro e accusato l’azienda di imporre limiti alla libertà creativa attraverso guardrail e controlli sui contenuti pubblicati. Il manifesto si conclude con un invito a usare software open source.

Per quanto pensi anch’io che le tecnologie AI generative dovrebbero essere tutte open source (e dunque aperte alla diffusione e modifica pubblica, senza restrizioni) e condivida molti punti del manifesto, c’è qualcosa che stona. Anzitutto il manifesto descrive noi alpha artist come ingenue pedine di una multinazionale, ma le condizioni offerte da OpenAI per il testing di Sora erano, a mio avviso, più che convenienti. Uso gratuito del software, nessun obbligo di fornire feedback sui bug o di promuovere l’azienda (o non avrei accettato), libertà di pubblicare i materiali creati a patto che non violassero la proprietà intellettuale altrui. Era una buona offerta, che mi ha permesso di lavorare in anticipo con uno strumento straordinario, in palese vantaggio su altri professionisti. Sono benefici di cui hanno goduto per mesi anche gli artisti “ribelli”, prima di tirarsene fuori a poche settimane dall’uscita ufficiale. Certo, i premi offerti (1500$) per il concorso interno sono bassi, ma non era obbligatorio partecipare e… io l’ho fatto. Perché al netto del compenso per me che non sono così famoso è un’ottima pubblicità essere esposto con altri bravi artisti e artiste e andare in giro per il mondo spesato (c’era anche questo) dall’azienda leader del settore AI.

Il rischio è che l’adozione di queste tecnologie venga guidata esclusivamente da logiche di risparmio economico. Ridurre Sora e strumenti analoghi a mere scorciatoie per abbattere i costi sarebbe miope.

In breve, il motivo per cui – come molti altri – non aderisco all’appello è semplice: non posso permettermelo. Come hanno ammesso anche i firmatari della lettera i software open source richiedono hardware notevoli e competenze che non tutti gli artisti possiedono o vogliono acquisire; non sono niente affatto “liberi dal gatekeeping”. Lavorare con open source offre molti vantaggi, come la privacy e l’assenza di censure, ma farlo a livelli professionali è ancora per pochi. Seguire l’invito del manifesto per me e molti altri significa banalmente smettere di usare le AI e questo contraddice il principio di apertura e inclusività che i promotori dichiarano di sostenere. Ci sono artisti che, banalmente, non possono permetterselo. Con i costi che richiede un progetto video, per chi non ha competenze informatiche e grossi hardware, un mese o due di abbonamento a Sora (2-400$) per finanziare un video è attualmente la soluzione più accessibile.

Credo che il dibattito debba concentrarsi su come rendere queste tecnologie più accessibili e trasparenti possibile, senza creare élite tecniche o economiche. Alle aziende dobbiamo chiedere più libertà e trasparenza, e realisticamente prezzi più bassi o premi e sconti per studenti e professionisti meno abbienti. Ai legislatori dobbiamo chiedere di incentivare fortemente lo sviluppo di AI pubbliche e aperte. l’AI Act europeo è stata un’occasione mancata: se avessimo liberato le open source da obblighi di copyright potevamo trasformare l’Europa nel principale hub open source del mondo.

Le AI generative come Sora si trovano in una posizione simile a quella dei computer o di altre tecnologie; strumenti bellissimi, costosi da sviluppare e produrre, relativamente disponibili al pubblico, ma sempre con un filtro economico all’ingresso. La nostra sfida deve essere eliminare (o almeno mitigare) questo filtro.

Il meglio di Domus direttamente nella tua mail!

Abbiamo provato Sora, l’AI che crea video con ChatGpt

L’esperienza di un alpha artist, uno dei primi utenti della piattaforma text-to-video di OpenAi: i dubbi sono tanti, tra cui la necessità di soluzioni più accessibili e aperte.

Ultime News

Altri articoli di Domus