觀看生成圖像時的違和感
AI的圖像生成,致力於忠實再現輸入的文本內容。這種執行指令的精確性,以及基於龐大資料庫的學習能力,堪稱超越人類認知範疇的「神技」,是我們人類難以企及的。然而,儘管如此,AI生成的圖像成品卻常常無法真正打動人心。本次專題將深入探討AI生成圖像與攝影之間所存在的違和感成因。
從「留白」的視角切入
多數AI生成圖像能夠正確地將文本轉化為視覺形象。這些圖像往往毫無多餘之處,換言之,缺乏「留白」。所謂「留白」,指的是有意或無意間保留的空間或資訊,而AI生成的圖像則常常充滿細節,缺乏這種留白。雖然能夠精確傳達資訊,但其中卻不包含任何脈絡。
Image by sora.KagiAke
然而,「留白」蘊含著人類情感的細膩與隱喻。這種基於情感的脈絡理解,正是沒有身體的AI最為薄弱的領域。AI雖然擅長以字面方式處理圖像,但在營造情感深度或隱含意義的留白方面,仍處於發展階段。
留白中展現的人性
人類拍攝的攝影作品,蘊含著超越影像紀錄的意義。攝影中包含了不可預測性、情感光譜,甚至有時會出現被視為「失誤」的元素。這些偶然的產物,成為影像敘事的一部分,賦予觀者共鳴與想像的空間。
Image by ザワ
AI圖像生成的流程
我們已經看到,AI生成圖像與攝影之間的違和感,往往取決於兩者是否存在「留白」。進一步了解AI圖像生成的流程,有助於深化對此議題的認識。
- 文本轉換:AI會將輸入的語句轉換為易於理解的概念。例如輸入「在天空飛翔的鳥」,AI會將其理解為圖像元素,並轉化為繪製海邊風景或動物形象的基本指令。
- 從雜訊生成圖像:AI最初從完全隨機的雜訊(即無特徵、隨機像素的集合)開始,逐步消除這些雜訊,最終形成具體的圖像。
- 圖像解碼:圖像解碼是將AI生成的圖像數據轉換為人眼可辨識的形式。例如轉換為JPEG、PNG等常見格式,並進行解析度、色彩或內部表現的調整。
Image by mars
AI與人類觀點差異所產生的不協和
AI在生成圖像時,消除「雜訊」的過程基本上是依據數學運算與演算法進行。雜訊的去除雖然讓圖像更貼近現實,但也存在極限。人類攝影中自然存在的偶發性、情感豐富性與不完美,這些元素難以透過計算方式捕捉。此時,AI與人類對於雜訊的觀點已經產生分歧。
在圖像生成過程中的各種細節處理,AI要完全理解並再現人類的複雜性與微妙情感,現階段技術尚難達成。AI雖然擅長字面解讀與資料導向的輸出,但要徹底模仿人類經驗與情感深度,仍有一段距離。或許,為了提升精確度,AI現在最需要的是學會貼近人類日常生活中那些看似無意義的「留白」。







