Công nghệ thị giác ứng dụng AI và camera tiếp tục mang đến những đổi mới đột phá. Ứng dụng camera nói chuyện〈Seeing AI〉, giúp ghi lại và chuyển đổi các khoảnh khắc trong thế giới mà chúng ta thường vô thức quan sát thành ngôn ngữ, nay đã có phiên bản Android.
Ứng dụng này đã được cung cấp cho “iOS” và “iPadOS” từ năm 2019, và với lần phát hành này, người dùng cũng có thể tải về từ cửa hàng “Google Play”. Hiện tại, ứng dụng hỗ trợ 18 ngôn ngữ và dự kiến sẽ mở rộng lên 36 ngôn ngữ vào năm 2024.
Hướng tới tương lai hỗ trợ người khiếm thị
〈Seeing AI〉 nhận diện cảnh vật xung quanh thông qua camera điện thoại thông minh và cung cấp thông tin bằng giọng nói. Nhờ đó, người khiếm thị có thể nghe đọc email, nhận diện sản phẩm, hoặc nghe mô tả ảnh bằng âm thanh.
Ứng dụng tận dụng Cognitive Services của〈Microsoft〉, cho phép hiển thị kết quả nhận diện đối tượng trong thời gian thực. Điều này giúp người khiếm thị tiếp cận thế giới xung quanh thông qua điện thoại thông minh một cách tức thì.
© Microsoft
〈Seeing AI〉 chuyển đổi thông tin thị giác thành âm thanh dựa trên năng lực nhận thức ứng dụng AI, với các chức năng nhận diện chữ viết, văn bản, mã vạch, khuôn mặt, cảnh vật, tiền tệ, màu sắc, ánh sáng... Đặc biệt, các tính năng nhận diện như “văn bản ngắn”, “con người”, “màu sắc”, “ánh sáng” có thể sử dụng ngay cả khi ngoại tuyến. Ngoài ra, ứng dụng còn tích hợp tính năng mới sử dụng〈ChatGPT〉của〈OpenAI〉, cho phép phân tích kết quả nhận diện văn bản tài liệu bằng〈ChatGPT〉.
Nhiếp ảnh như một thiết bị nhận thức
Điều này đã vượt ra khỏi khuôn khổ truyền thống khi nhiếp ảnh chủ yếu được xem là công cụ lưu trữ. 〈Seeing AI〉 tập trung vào sự biến đổi bản chất của nhiếp ảnh, nhấn mạnh cơ chế nhận thức thông tin qua hình ảnh. Với vai trò là thiết bị chuyển đổi thông tin thị giác thành thính giác, ứng dụng hứa hẹn giải quyết các vấn đề về khả năng tiếp cận thông tin mà người khiếm thị thường gặp phải.
Nỗ lực lâu dài vì khả năng tiếp cận
〈Microsoft〉 đã cung cấp các dịch vụ liên quan đến khả năng tiếp cận trong hơn 30 năm, và〈Seeing AI〉là một phần trong những nỗ lực đó. Ứng dụng được thiết kế tối giản, giúp người khiếm thị có thể sử dụng thành thạo mà không gặp lỗi, đồng thời tích hợp nhiều chức năng trong một ứng dụng duy nhất.
Những ứng dụng hỗ trợ khả năng tiếp cận như vậy giúp người khiếm thị tham gia vào nhiều hoạt động trong đời sống hàng ngày, đồng thời mở ra cơ hội mới cho sự hòa nhập xã hội nhờ tính tiện lợi. Việc ứng dụng AI vào hỗ trợ khả năng tiếp cận ngày càng trở nên quan trọng trong bối cảnh phát triển của thời đại, và những nỗ lực của〈Microsoft〉đã góp phần thúc đẩy xu hướng này. Hướng tới tương lai hỗ trợ người khiếm thị,〈Seeing AI〉đang mở ra một kỷ nguyên mới về khả năng tiếp cận.





