Che cos’è una foto nell’era dell’AI, secondo Google

Le foto sono ancora “vere”, nell’epoca dell'intelligenza artificiale generativa? Una conversazione con Michael Specht di Google, su dove sta andando la fotografia mobile.

01 / 05

Google Pixel 9 e 9 Pro

Courtesy Google

Google Pixel 9 e 9 Pro

Courtesy Google

Google Pixel 9 e 9 Pro

Courtesy Google

Google Pixel 9 e 9 Pro

Courtesy Google

Google Pixel 9 e 9 Pro

Courtesy Google

Michael Specht è un fotografo di lunga data e un esperto imaging digitale. È anche il Product Manager Pixel Camera di Google: il lavoro ideale per qualcuno la cui passione ruota attorno alle foto e alle macchine fotografiche. Da quando Google ha introdotto la serie Pixel 9 questo agosto, il compito di Specht è diventato un po’ più complicato. Da un lato, gli ultimi telefoni di Google sono dotati di alcune delle migliori fotocamere del mercato smartphone. Dall’altro, l’azienda ha introdotto una serie di funzioni di intelligenza artificiale generativa che vanno oltre il concetto tradizionale di fotografia.

La funzione Add Me dei Pixel 9 e Pixel 9 Pro di Google, ad esempio, consente di creare foto di gruppo aggiungendo persone all’inquadratura con due scatti separati. Reimagine, un’altra funzione AI basata su Gemini di Google, consente agli utenti di aggiungere alla foto elementi che non esistono, di sostituire completamente il cielo, rimuovere parti dell’immagine e altro ancora.
Specht è l’uomo incaricato di spiegare molte di queste funzioni e la loro ratio a fotografi e giornalisti come il sottoscritto, cercando di dare un senso all’improvvisa accelerazione di Google nell’ambito dell’imaging generativo.

“L’AI è presente nella fotografia da molti anni, ma ora siamo entrati ormai del tutto nella fase dell’AI generativa”, spiega Michael Specht a Domus. “Noi di Google vogliamo fornire all’utente un dispositivo da tenere in tasca e da utilizzare per raccogliere informazioni da tutto ciò che lo circonda.

Se si considera l’obiettivo fondamentale della fotografia, è quello di scattare immagini per documentare il mondo che ci circonda. Vogliamo catturare i ricordi e le esperienze che abbiamo vissuto, e coi Pixel noi diamo la possibilità di farlo sempre nel miglior modo possibile”.

Per Google oggi “il miglior modo possibile” ha assunto però un nuovo significato. Fino all’anno scorso, i miglioramenti fotografici basati sull’AI potevano essere facilmente raggruppati sotto il nome di “fotografia computazionale”: algoritmi di apprendimento automatico, apprendimento profondo ed elaborazione delle immagini che lavoravano insieme per spingere gli obiettivi degli smartphone oltre limiti fisici un tempo considerati insormontabili.

Michael Specht, Product Manager Google Pixel Camera. Courtesy Google

L’intelligenza artificiale generativa ha cambiato completamente le carte in tavola e ora le fotocamere Pixel possono fare molto più che aiutarci a ottenere lo scatto migliore possibile: semplificano drasticamente il compito di iper-editare lo scatto a nostro piacimento. Anche quando ciò significa rimuovere soggetti con la Gomma magica o aggiungere e modificare parti dell’immagine per ottenere una rappresentazione di cose, persone e luoghi che non sono mai esistiti.

Si entra così in un territorio insidioso, però, e cioè quello della ridefinizione di ciò che può essere una fotografia. Google, ci assicura Specht, sta cercando di trovare un equilibrio tra il miglioramento della fotografia mobile e l’autenticità delle immagini. In alcuni casi, come per AddMe, il compromesso ha un esito positivo ed è facile immaginarne l’utilità.

Vogliamo catturare i ricordi e le esperienze che abbiamo vissuto, e coi Pixel noi diamo la possibilità di farlo sempre nel miglior modo possibile.

Michael Specht

“Ero in Islanda con la mia famiglia e ci trovavamo su un ghiacciaio; non c'era nessun altro. Per scattare la nostra foto ricordo avrei potuto usare l'opzione tradizionale del treppiede e del timer, con tutte le complicazioni che ne derivano”, racconta Specht. “Con il nuovo Pixel ho potuto scattarla semplicemente con Add Me. Ho inquadrato e scattato la prima foto, con solo la mia famiglia nell’inquadrature, e poi sono passato io nel frame. Mia moglie ha potuto scattare la seconda immagine con una guida sovrapposta per inquadrarla correttamente. Il risultato è stato un'immagine composita che ci ha permesso di combinare questi due momenti distinti nel tempo”.

Secondo Specht, i nuovi miglioramenti dell'intelligenza artificiale di Google sono la naturale evoluzione della roadmap fotografica che Google ha sempre seguito con i Pixel.

“L’approccio di Google all’AI e alla gen-AI è quello di allineare le nuove tecnologie alla nostra missione: raccogliere le informazioni del mondo, renderle universalmente accessibili e organizzarle. Lo facciamo anche attraverso l’imaging, sia prima di catturare l’immagine con la guida dell’IA, sia attraverso l’imaging computazionale o gli strumenti di editing post-scatto, fino all'organizzazione delle immagini all’interno di Google Foto e alla possibilità di cercare le immagini nel modo più efficiente possibile”.

Con le altre funzioni AI introdotte da Google sul nuovo Pixel 9, tuttavia, i rischi di stravolgere il modo in cui abbiamo sempre guardato le foto da una prospettiva sociale sono improvvisamente aumentati. Con strumenti come Reimagine, è più facile che mai alterare una foto e piegare la realtà percepita in un modo che potrebbe essere pericoloso. A dire il vero, questo non è solo un problema di Google, ma di tutto il settore tech. Vale anche la pena riflettere sul grado di pericolosità di un'immagine modificata e forse evitare di essere catastrofisti: da tempo chi voglia usare le immagini per scopi nefasti ha accesso a strumenti digitali di facile utilizzo per modificare le foto. Quello che Google ha scelto di fare, però, è mettere questi strumenti di facile utilizzo per alterare la realtà nelle mani di un numero maggiore di persone. L'obiettivo, spiega Specht, è quello di aiutare le persone a esprimere meglio se stesse attraverso la fotografia mobile, assicurando al contempo, grazie a watermarking e tag, che queste immagini potenziate dall'intelligenza artificiale siano facilmente identificabili.

“Dal punto di vista della fotografia, ci sono due componenti chiave. Uno è l'utilizzo dell'intelligenza artificiale per creare immagini più autentiche. Ad esempio, se si scatta una foto in condizioni di scarsa illuminazione con un soggetto in movimento, il risultato è spesso caratterizzato da rumore e sfocatura. Non è così che l'ho visto con i miei occhi. Le fotocamere hanno dei limiti, ma l'intelligenza artificiale può aiutare a ripristinare l'immagine in modo che corrisponda a ciò che ho visto: senza rumore, chiara”, afferma Specht. La seconda componente, ha proseguito, consiste nel fornire strumenti che consentano alle persone di modificare le foto per riflettere il modo in cui hanno vissuto la scena e le emozioni provate. È il caso di Magic Eraser, che consente agli utenti di cancellare e ripulire parte di una foto, eliminando, ad esempio, altre persone o elementi di disturbo dall’inquadratura. “Vogliamo che questi strumenti siano accessibili a tutti. Per esempio, se dessi Photoshop a mia madre, dovrebbe guardare un lungo tutorial per usarlo e probabilmente non sarebbe in grado di modificare la foto. Il nostro obiettivo è rendere accessibili gli strumenti avanzati tipicamente riservati ai professionisti attraverso l'IA e l'editing post-scatto”.

L’approccio di Google all’AI e alla gen-AI è quello di allineare le nuove tecnologie alla nostra missione: raccogliere le informazioni del mondo, renderle universalmente accessibili e organizzarle.

Michael Specht

Infine, quando si tratta di funzioni puramente gen-AI, Specht afferma che l’intenzione fondamentale di Google è la democratizzazione dell'espressione artistica. “Per esempio, sostituire il cielo in un'immagine non è qualcosa di modificabile dalla fotocamera al momento dello scatto, ma una decisione creativa presa in post-editing”, afferma Specht.

Sebbene il commento di Specht aiuti a dare un senso all'approccio di Google all’uso della gen AI nella fotografia mobile, il rischio che questi miglioramenti delle capacità artistiche delle persone possano trasformarsi in strumenti pericolosi non è del tutto scongiurato. Per evitare che ciò accada, conclude Specht, l'azienda ha implementato delle misure di salvaguardia che, si spera, siano sufficienti a tenerci al riparo da un diluvio di contenuti fake.

“In definitiva, il nostro obiettivo è fornire strumenti che consentano alle persone di esprimere la propria creatività, anche se in precedenza non ne avevano i mezzi”, conclude Specht.” È importante farlo in modo responsabile, contrassegnando chiaramente le immagini generative come tali e assicurando che il nostro obiettivo sia il potenziamento delle possibilità degli utenti, non la manipolazione del pubblico”.

01 / 05