La incomodidad percibida al observar imágenes generadas
La generación de imágenes mediante IA intenta reproducir fielmente el texto introducido. Esta fidelidad y la capacidad de aprender a partir de una vasta base de datos representan una «habilidad divina» que supera el alcance cognitivo humano, algo imposible para nosotros. Sin embargo, a menudo ocurre que los resultados generados no logran cautivar el corazón humano. En este artículo, profundizamos en las razones detrás de la sensación de extrañeza que existe entre las imágenes generadas por IA y la fotografía.
Desde la perspectiva del espacio negativo
La mayoría de las imágenes generadas convierten correctamente el texto en imagen. Muchas de ellas carecen de elementos superfluos, es decir, no presentan «espacio negativo». El «espacio negativo» se refiere a los espacios o información dejados de manera intencionada o no intencionada; las imágenes creadas por IA suelen estar saturadas de detalles y carecen de este espacio. Aunque transmiten fielmente el significado como información, carecen de contexto.
Image by sora.KagiAke
No obstante, el «espacio negativo» encierra matices emocionales y significados ocultos propios del ser humano. Esta comprensión contextual basada en la emoción es precisamente el área más débil para una IA, que carece de cuerpo. Si bien la IA es experta en procesar imágenes de manera literal, aún está en desarrollo en cuanto a la creación de espacio negativo que contenga profundidad emocional o significados implícitos.
La humanidad reflejada en el espacio negativo
Las fotografías tomadas por seres humanos encierran un significado que va más allá del simple registro visual. En la fotografía pueden aparecer elementos impredecibles, una gama de emociones e incluso aspectos que a veces se consideran «errores» no intencionados. Todos estos accidentes fortuitos forman parte de la narrativa de la fotografía y ofrecen al espectador espacio para la empatía y la imaginación.
Image by ザワ
El proceso de generación de imágenes por IA
Hemos visto que la sensación de extrañeza entre imágenes generadas por IA y fotografías depende, en gran medida, de la presencia o ausencia de «espacio negativo». Comprender el proceso de generación de imágenes por IA nos permite profundizar en este fenómeno.
- Conversión de texto: La IA transforma las palabras introducidas en conceptos que puede interpretar. Por ejemplo, al ingresar el texto «un pájaro volando en el cielo», la IA lo entiende como elementos para la imagen y lo convierte en instrucciones básicas para representar, por ejemplo, un paisaje costero o la figura de un perro.
- Generación de imagen a partir de ruido: La IA parte de un ruido completamente aleatorio (un conjunto de píxeles sin características) y, eliminando gradualmente ese ruido, va formando la imagen concreta.
- Decodificación de la imagen: La decodificación consiste en transformar los datos de imagen generados por la IA en un formato comprensible para el ojo humano. Por ejemplo, convertirlos en formatos como JPEG o PNG, ajustar la resolución, el color o realizar retoques internos.
Image by mars
La disonancia generada por las diferencias de percepción entre IA y humanos
El proceso de eliminación de «ruido» durante la generación de imágenes por IA se basa fundamentalmente en cálculos matemáticos y algoritmos. Eliminar el ruido significa acercar la imagen a la realidad, pero esto tiene sus límites. La aleatoriedad, la riqueza emocional y la imperfección inherentes a la fotografía humana son elementos difíciles de captar mediante cálculos. Ya en este punto surge una diferencia de percepción respecto al ruido entre la IA y el ser humano.
En los múltiples procesos involucrados en la generación de imágenes, resulta complejo para la IA comprender y reproducir plenamente la complejidad y los matices sutiles del ser humano con la tecnología actual. La IA sobresale en interpretaciones literales y en la producción basada en datos, pero aún no logra imitar completamente la profundidad de la experiencia y la emoción humanas. Quizá lo que la IA necesita ahora para alcanzar mayor precisión es acercarse a esos «espacios negativos» aparentemente insignificantes de la vida cotidiana humana.







