La aplicación ‘Seeing AI’ de Microsoft, que facilita el reconocimiento y la descripción del entorno a personas ciegas, ya está disponible para Android. El objetivo de esta iniciativa es facilitar el día a día a más personas.
La aplicación, que hasta ahora solo estaba disponible en iOS, incorpora nuevas capacidades, como los avances más recientes en Inteligencia Artificial (IA) y estará disponible en 18 idiomas, incluyendo el español, a fin de llegar a 36 el próximo año.
Entre las nuevas funciones resaltan la posibilidad de escuchar una descripción más detallada del entorno y la capacidad de IA generativa de poder plantear preguntas concretas sobre el documento escaneado.
Microsoft ha anunciado el lanzamiento para todos los dispositivos Android de Seeing AI, la app gratuita basada en tecnologías de Inteligencia Artificial (IA) y servicios cognitivos, que describe el mundo a las personas ciegas o con baja visión directamente desde el dispositivo móvil. Seeing AI les ayuda en tareas diarias como describir su entorno, leer el correo o escuchar las características de objetos, fotos o personas, facilitándoles su día a día y mejorando su autonomía.
Esta versión de Seeing AI, que ya está disponible en Android desde la Play Store, cuenta con nuevas funcionalidades: las últimas capacidades de la IA generativa de Microsoft, que se han lanzado recientemente, como unas descripciones más detalladas de las fotos y la posibilidad de chatear o hacer preguntas concretas sobre los documentos escaneados.
Solo necesitas apuntar con la cámara o hacer una foto para escuchar la descripción. La aplicación permite también cambiar de canal de audio para escuchar información específica:
• Texto corto: Lee el texto en cuanto aparece delante de la cámara.
• Documentos: Proporciona una guía de audio para capturar una página impresa y lee el contenido en voz alta, junto con su formato original. Posibilita chatear con Seeing AI para encontrar información rápidamente.
• Productos: Escanea códigos de barras, utilizando pitidos de audio como guía y facilita la localización de los códigos de barras y su posterior escaneo para identificar los productos, así como información sobre fechas de caducidad y recomendaciones de elaboración, si están disponibles.
• Entorno: Describe el entorno y al tocar «más información» genera una descripción completa. Además, el usuario puede explorar la imagen moviendo el dedo por la pantalla para escuchar la descripción y ubicación de los distintos objetos.
• Divisas: Reconoce los billetes y divisas, así como su valor
• Colores: Identifica y describe el color percibido.
• Escritura a mano: Lee texto manuscrito.
• Luz: Genera un tono audible correspondiente a la luminosidad del entorno.