เทคโนโลยีการมองเห็นที่ผสาน AI และกล้องกำลังสร้างนวัตกรรมใหม่อีกครั้ง แอปกล้อง AI อ่านออกเสียง〈Seeing AI〉ที่สามารถจับภาพช่วงเวลาหนึ่งของโลกที่เรามองข้ามและแปลงเป็นภาษา ได้เปิดตัวเวอร์ชัน Android แล้ว
แอปนี้ให้บริการบน “iOS” และ “iPadOS” ตั้งแต่ปี 2019 และจากการเปิดตัวครั้งนี้ ผู้ใช้สามารถดาวน์โหลดได้จาก “Google Play” เช่นกัน ปัจจุบันรองรับ 18 ภาษา และมีแผนจะขยายเป็น 36 ภาษาในปี 2024
สู่อนาคตของการสนับสนุนผู้พิการทางสายตา
〈Seeing AI〉ใช้กล้องสมาร์ทโฟนในการรับรู้สภาพแวดล้อมรอบตัวและให้ข้อมูลผ่านเสียง ช่วยให้ผู้พิการทางสายตาสามารถอ่านอีเมล รับรู้สินค้า หรือฟังคำอธิบายภาพถ่ายได้
แอปนี้ใช้ Cognitive Services ของ〈Microsoft〉เพื่อแสดงผลลัพธ์แบบเรียลไทม์ ทำให้ผู้พิการทางสายตาสามารถเข้าถึงโลกได้ทันทีผ่านสมาร์ทโฟน
© Microsoft
〈Seeing AI〉เปลี่ยนข้อมูลภาพเป็นเสียงโดยใช้ความสามารถในการรับรู้ของ AI สามารถตรวจจับตัวอักษร ข้อความ บาร์โค้ด บุคคล ทิวทัศน์ สกุลเงิน สี และแสง โดยฟีเจอร์อย่าง “ข้อความสั้น” “บุคคล” “สี” และ “แสง” สามารถใช้งานแบบออฟไลน์ได้ นอกจากนี้ยังมีฟีเจอร์ใหม่ที่ใช้〈ChatGPT〉จาก〈OpenAI〉เพื่อวิเคราะห์ผลการรู้จำตัวอักษรในเอกสาร
ภาพถ่ายในฐานะเครื่องมือรับรู้
สิ่งนี้ได้ก้าวข้ามกรอบเดิมที่มองว่าภาพถ่ายเป็นเพียงเครื่องมือบันทึกข้อมูล 〈Seeing AI〉ชี้ให้เห็นถึงการเปลี่ยนแปลงของธรรมชาติของภาพถ่าย และเน้นกลไกการรับรู้ข้อมูลผ่านภาพถ่าย ในฐานะเครื่องมือที่แปลงข้อมูลจากการมองเห็นเป็นการได้ยิน จึงคาดหวังว่าจะช่วยแก้ปัญหาการเข้าถึงข้อมูลสำหรับผู้พิการทางสายตา
ความมุ่งมั่นด้าน Accessibility อย่างต่อเนื่อง
〈Microsoft〉ให้บริการด้าน Accessibility มานานกว่า 30 ปี และ〈Seeing AI〉ก็เป็นส่วนหนึ่งของความมุ่งมั่นนี้ แอป〈Seeing AI〉ออกแบบอย่างเรียบง่าย แม้ผู้ที่มองไม่เห็นก็สามารถใช้งานได้อย่างคล่องแคล่วเมื่อคุ้นเคย และรวมฟังก์ชันหลากหลายไว้ในแอปเดียว
แอปที่รองรับ Accessibility เช่นนี้ช่วยสนับสนุนกิจกรรมในชีวิตประจำวันของผู้พิการทางสายตา และด้วยความสะดวกสบายจึงเปิดโอกาสใหม่ในการมีส่วนร่วมทางสังคม การพัฒนา Accessibility ด้วย AI มีความสำคัญมากขึ้นตามยุคสมัย และความพยายามของ〈Microsoft〉ถือเป็นแรงผลักดันสำคัญ 〈Seeing AI〉กำลังเปิดประตูสู่ยุคใหม่ของ Accessibility ด้วยวิสัยทัศน์สู่อนาคตของการสนับสนุนผู้พิการทางสายตา





