語音導覽AI攝影應用〈Seeing AI〉 | Release #44 | 新聞

結合AI與攝影的視覺技術，再次帶來嶄新革新。能夠捕捉日常所見場景並將其語言化的語音攝影應用〈Seeing AI〉，現已推出Android版本。

該應用自2019年起已於「iOS」與「iPadOS」平台提供服務，隨著此次更新，現亦可於「Google Play」商店下載。目前支援18種語言，預計於2024年擴展至36種語言。

邁向視覺障礙者支援的未來

〈Seeing AI〉透過智慧型手機鏡頭辨識周遭環境，並以語音提供資訊。這使視覺障礙者能夠聆聽電子郵件內容、辨識商品，或以語音獲取照片說明。

應用結合〈Microsoft〉的Cognitive Services，能即時顯示辨識結果。藉此，視覺障礙者可透過智慧型手機即時接觸世界。

〈Seeing AI〉運用AI技術的認知能力，將視覺資訊轉換為語音，具備辨識文字、文件、條碼、人像、風景、貨幣、顏色、光線等功能，特別是「短文」、「人物」、「顏色」、「光線」等資訊辨識功能可於離線狀態下使用。此外，應用亦導入〈OpenAI〉的〈ChatGPT〉新功能，可利用〈ChatGPT〉分析文件的文字辨識結果。

作為認知裝置的攝影

這一發展突破了傳統將攝影僅視為記錄工具的框架。〈Seeing AI〉聚焦於攝影本質的轉變，關注透過攝影進行資訊認知的機制。作為將視覺資訊轉換為聽覺資訊的認知裝置，有望解決視覺障礙者在資訊無障礙上的困境。

長期致力於無障礙推動

〈Microsoft〉三十多年來持續提供無障礙相關服務，〈Seeing AI〉亦是其中一環。該應用介面簡潔，即使視力不便者熟悉操作後也能準確使用，眾多功能集於一身。

這類無障礙應用協助視覺障礙者於日常生活中進行多元活動，並因其便利性帶來嶄新的社會參與機會。AI技術驅動的無障礙支援隨時代演進愈發重要，〈Microsoft〉的持續投入正於此領域引領風潮。展望視覺障礙者支援的未來，〈Seeing AI〉正開啟無障礙科技的新紀元。

SHARE ON

編輯推薦

magazine·2023年11月30日

搭載AI的影像編輯軟體「Luminar Neo」｜Release #39

邁向視覺障礙者支援的未來

長期致力於無障礙推動

邁向視覺障礙者支援的未來

作為認知裝置的攝影

長期致力於無障礙推動

編輯推薦

美味相機登場？薑餅相機 | Release #42

復古熱潮的引領者——用〈寫樂得〉捕捉時光 | Release #41

披頭四最終樂章《Now and Then》與AI技術的融合 | Release #40

搭載AI的影像編輯軟體「Luminar Neo」｜Release #39

邁向視覺障礙者支援的未來

作為認知裝置的攝影

長期致力於無障礙推動

編輯推薦

美味相機登場？薑餅相機 | Release #42

復古熱潮的引領者——用〈寫樂得〉捕捉時光 | Release #41

披頭四最終樂章《Now and Then》與AI技術的融合 | Release #40

搭載AI的影像編輯軟體「Luminar Neo」｜Release #39