AI와 카메라를 활용한 시각 기술이 다시 한 번 새로운 혁신을 이끌고 있습니다. 우리가 일상적으로 바라보는 세계의 한 장면을 포착해 언어로 전달하는 토킹 카메라 앱 〈Seeing AI〉의 안드로이드 버전이 출시되었습니다.
이 앱은 2019년부터 ‘iOS’, ‘iPadOS’용으로 서비스되어 왔으나, 이번 출시를 통해 ‘Google Play’ 스토어에서도 이용할 수 있게 되었습니다. 현재 18개 언어를 지원하며, 2024년에는 36개 언어로 확대될 예정입니다.
시각장애인 지원의 미래를 향하여
〈Seeing AI〉는 스마트폰 카메라를 통해 주변 풍경을 인식하고, 음성으로 정보를 제공합니다. 이를 통해 시각장애인이 이메일을 읽거나, 상품을 인식하거나, 사진 설명을 음성으로 들을 수 있도록 지원합니다.
〈Microsoft〉의 Cognitive Services를 활용하여 실시간으로 대상을 즉시 인식할 수 있습니다. 이로써 시각장애인들은 스마트폰을 통해 실시간으로 세계에 접근할 수 있게 됩니다.
© Microsoft
AI 기술을 기반으로 시각 정보를 음성으로 변환하는 〈Seeing AI〉는 문자, 문장, 바코드, 인물, 풍경, 화폐, 색상, 조명 등을 인식하는 기능을 갖추고 있으며, 특히 ‘짧은 텍스트’, ‘인물’, ‘색상’, ‘조명’ 등 정보 인식 기능은 오프라인에서도 사용할 수 있습니다. 또한 이 앱에는 〈OpenAI〉의 〈ChatGPT〉를 활용한 신규 기능도 탑재되어, 문서의 문자 인식 결과를 〈ChatGPT〉로 분석할 수 있습니다.
인지 장치로서의 사진
이는 기존에 사진이 주로 기록 장치로 인식되던 틀을 넘어서는 변화입니다. 〈Seeing AI〉는 사진의 본질적 변화를 주목하며, 사진을 통해 정보를 인지하는 메커니즘에 집중합니다. 시각 정보를 청각 정보로 전환하는 인지 장치로서, 시각장애인이 겪던 정보 접근성의 문제를 해결할 수 있을 것으로 기대됩니다.
접근성을 위한 오랜 노력
〈Microsoft〉는 30년 이상 접근성 관련 서비스를 제공해왔으며, 이번 〈Seeing AI〉 역시 그 일환으로 개발되었습니다. 〈Seeing AI〉 앱은 단순하게 설계되어 시력이 없어도 익숙해지면 오류 없이 사용할 수 있고, 다양한 기능이 하나의 앱에 집약되어 있습니다.
이러한 접근성 대응 앱은 시각장애인의 일상생활을 다방면에서 지원하며, 그 편의성으로 새로운 사회 참여의 기회를 제공합니다. AI 기술을 활용한 접근성 강화는 시대의 흐름에 따라 점점 더 중요해지고 있으며, 〈Microsoft〉의 노력은 그 흐름에 중요한 역할을 하고 있습니다. 시각장애인 지원의 미래를 내다보며, 〈Seeing AI〉는 접근성의 새로운 시대를 열고 있습니다.





