La sensazione di estraneità di fronte alle immagini generate
La generazione di immagini tramite AI cerca di riprodurre fedelmente il testo inserito. Questa precisione nell’eseguire le istruzioni e la capacità di apprendere da un vastissimo database rappresentano una sorta di "abilità divina", ben oltre la portata della percezione umana. Eppure, spesso il risultato finale delle immagini generate non riesce a catturare il cuore dell’osservatore. In questo articolo esploriamo le ragioni del senso di estraneità che si avverte tra le immagini create dall’AI e la fotografia.
Dal punto di vista dello spazio vuoto
Molte immagini generate dall’AI traducono correttamente il testo in immagine. Tuttavia, spesso risultano prive di elementi superflui, ovvero mancano di quello che potremmo definire "spazio vuoto". Lo "spazio vuoto" si riferisce a quelle aree o informazioni lasciate intenzionalmente o meno, e le immagini prodotte dall’AI, ricche di dettagli, spesso ne sono prive. Sebbene trasmettano fedelmente il significato informativo, manca il contesto.
Image by sora.KagiAke
Eppure, lo "spazio vuoto" racchiude sfumature emotive e significati nascosti propri dell’essere umano. Questa comprensione contestuale, basata sulle emozioni, è una delle aree in cui l’AI, priva di corporeità, mostra la sua maggiore debolezza. L’AI eccelle nell’elaborazione letterale delle immagini, ma è ancora lontana dal riuscire a generare quello spazio vuoto che contiene profondità emotiva e significati celati.
L’umanità che si manifesta nello spazio vuoto
Le fotografie realizzate dall’uomo racchiudono un significato che va oltre la semplice registrazione dell’immagine. In esse si trovano imprevedibilità, una gamma di emozioni e, talvolta, elementi considerati "errori" non intenzionali. Tutti questi accidenti diventano parte della narrazione della fotografia, offrendo allo spettatore spazio per l’empatia e l’immaginazione.
Image by ザワ
Il processo di generazione delle immagini da parte dell’AI
Abbiamo visto che il senso di estraneità tra immagini generate dall’AI e fotografie dipende dalla presenza o meno dello "spazio vuoto". Approfondiamo la comprensione esaminando il processo di generazione delle immagini da parte dell’AI.
- Conversione del testo: l’AI trasforma le parole inserite in concetti facilmente interpretabili. Ad esempio, se si inserisce il testo "un uccello che vola nel cielo", l’AI lo interpreta come elementi da inserire nell’immagine e lo converte in istruzioni di base per rappresentare, ad esempio, un paesaggio marino o la figura di un cane.
- Generazione dell’immagine dal rumore: l’AI parte da un rumore completamente casuale (un insieme di pixel privi di caratteristiche) e, eliminando progressivamente questo rumore, forma l’immagine concreta.
- Decodifica dell’immagine: la decodifica consiste nel trasformare i dati generati dall’AI in una forma comprensibile all’occhio umano. Ad esempio, convertendo in formati visibili come JPEG o PNG, oppure intervenendo su risoluzione, cromie e ritocchi delle rappresentazioni interne.
Image by mars
La dissonanza generata dalla differenza di percezione tra AI e umano
Il processo di eliminazione del "rumore" da parte dell’AI durante la generazione delle immagini segue essenzialmente calcoli matematici e algoritmi. Rimuovere il rumore significa avvicinare l’immagine alla realtà, ma questo ha dei limiti. L’imprevedibilità, la ricchezza emotiva e l’imperfezione che emergono spontaneamente nelle fotografie umane sono elementi difficili da cogliere tramite calcolo. Già a questo livello si manifesta una divergenza di percezione del rumore tra AI e umano.
Nelle molteplici fasi di elaborazione dell’immagine, è ancora difficile per l’AI comprendere e riprodurre appieno la complessità e le sfumature dell’essere umano. L’AI eccelle nell’interpretazione letterale e nella produzione basata sui dati, ma non è ancora in grado di imitare completamente la profondità dell’esperienza e delle emozioni umane. Forse ciò di cui l’AI ha bisogno oggi per migliorare la propria precisione è proprio la capacità di avvicinarsi a quegli "spazi vuoti" apparentemente insignificanti che permeano la quotidianità umana.







