結合AI與攝影的視覺技術,再次帶來嶄新革新。能夠捕捉日常所見場景並將其語言化的語音攝影應用〈Seeing AI〉,現已推出Android版本。
該應用自2019年起已於「iOS」與「iPadOS」平台提供服務,隨著此次更新,現亦可於「Google Play」商店下載。目前支援18種語言,預計於2024年擴展至36種語言。
邁向視覺障礙者支援的未來
〈Seeing AI〉透過智慧型手機鏡頭辨識周遭環境,並以語音提供資訊。這使視覺障礙者能夠聆聽電子郵件內容、辨識商品,或以語音獲取照片說明。
應用結合〈Microsoft〉的Cognitive Services,能即時顯示辨識結果。藉此,視覺障礙者可透過智慧型手機即時接觸世界。
© Microsoft
〈Seeing AI〉運用AI技術的認知能力,將視覺資訊轉換為語音,具備辨識文字、文件、條碼、人像、風景、貨幣、顏色、光線等功能,特別是「短文」、「人物」、「顏色」、「光線」等資訊辨識功能可於離線狀態下使用。此外,應用亦導入〈OpenAI〉的〈ChatGPT〉新功能,可利用〈ChatGPT〉分析文件的文字辨識結果。
作為認知裝置的攝影
這一發展突破了傳統將攝影僅視為記錄工具的框架。〈Seeing AI〉聚焦於攝影本質的轉變,關注透過攝影進行資訊認知的機制。作為將視覺資訊轉換為聽覺資訊的認知裝置,有望解決視覺障礙者在資訊無障礙上的困境。
長期致力於無障礙推動
〈Microsoft〉三十多年來持續提供無障礙相關服務,〈Seeing AI〉亦是其中一環。該應用介面簡潔,即使視力不便者熟悉操作後也能準確使用,眾多功能集於一身。
這類無障礙應用協助視覺障礙者於日常生活中進行多元活動,並因其便利性帶來嶄新的社會參與機會。AI技術驅動的無障礙支援隨時代演進愈發重要,〈Microsoft〉的持續投入正於此領域引領風潮。展望視覺障礙者支援的未來,〈Seeing AI〉正開啟無障礙科技的新紀元。





