观看生成图像时产生的违和感
AI的图像生成尝试忠实再现输入的文本。其执行的严谨性,以及基于庞大数据库的学习能力,堪称超越人类认知范围的“神技”,是我们人类难以企及的。然而,即便如此,AI生成的图像成品却常常无法真正打动人心。本文将探讨AI生成图像与摄影之间存在的那种违和感的根源。
从“留白”视角切入
大多数AI生成的图像能够准确地将文本转化为视觉形象。这些图像往往没有多余之处,换句话说,缺乏“留白”。“留白”指的是有意或无意间保留的空间或信息,而AI生成的图像则常常充满细节,缺乏这种留白。虽然它们能够忠实传递信息,但却缺少语境的承载。
Image by sora.KagiAke
然而,“留白”蕴含着人类情感的细腻与隐喻。基于情感的语境理解,正是没有身体的AI最为薄弱的领域。AI擅长对图像进行字面处理,但在创造包含情感深度或隐含意义的留白方面,仍处于发展阶段。
留白中展现的人性
人类拍摄的摄影作品,承载着超越图像记录本身的意义。摄影中包含着不可预测性、情感的多样性,有时还会有被视为“失误”的元素。这些偶然性共同构成了摄影所传递的叙事,为观者提供共鸣与想象的空间。
Image by ザワ
AI生成图像的流程
我们已经看到,AI生成图像与摄影之间的违和感,很大程度上取决于两者是否存在“留白”。进一步了解AI的图像生成流程,有助于深化理解。
- 文本转换:AI将输入的语言转化为易于理解的概念。例如,输入“飞翔的鸟”,AI会将其作为图像元素理解,并转化为描绘海边风景或动物形象的基本指令。
- 从噪声中生成图像:AI最初从完全随机的噪声(无特征的像素集合)出发,逐步去除噪声,逐渐形成具体的图像。
- 图像解码:图像解码是将AI生成的图像数据转化为人眼易于识别的过程。例如转换为JPEG、PNG等常见格式,或调整分辨率、色彩、内部表现的润饰等。
Image by mars
AI与人类观念差异带来的不和谐
AI在生成图像时消除“噪声”的过程,本质上遵循数学计算与算法。去除噪声意味着让图像更接近现实,但这也有其局限。人类摄影中自然而然存在的偶发性、情感丰富性与不完美,是计算难以捕捉的部分。此时,AI与人类在对“噪声”的理解上已然出现分歧。
在图像生成的诸多细节处理中,AI要完全理解并再现人类的复杂性与微妙情感,目前的技术尚难以实现。AI在字面理解和基于数据的输出方面表现优异,但尚未能完全模拟人类经验与情感的深度。或许,AI未来提升精度的关键,在于贴近人类日常生活中那些看似无意义的“留白”。







