Android ha anunciado el lanzamiento de un nuevo motor de Texto a Voz (TTS, por sus siglas en inglés) que promete ser eficiente y confiable. Esta tecnología convierte texto en habla natural en más de 50 idiomas, potenciado por la tecnología de aprendizaje automático (ML) de Google. El nuevo motor de texto a voz en Wear OS utiliza modelos de machine learning de prosodia disminuida para ofrecer una síntesis más rápida en dispositivos Wear OS.
Los casos de uso para la función de texto a voz en Wear OS pueden variar desde servicios de accesibilidad, indicaciones para aplicaciones de ejercicio como sucede en los Samsung Galaxy Watch, indicaciones de navegación y lectura en voz alta de alertas entrantes a través del altavoz del reloj o auriculares Bluetooth conectados. El motor de este nuevo TTS está diseñado para interacciones breves, por lo que no debe usarse para leer en voz alta un artículo largo o un resumen extenso de un podcast.
Disponible en Wear OS 4.
La función de texto a voz ha estado presente durante mucho tiempo en Android. El nuevo TTS de Wear OS ha sido optimizado para ser eficiente y confiable en dispositivos con poca memoria. Esto está disponible en dispositivos que ejecutan Wear OS 4 o superior.
Cuando el usuario interactúa con el TTS de Wear OS por primera vez después de arrancar el dispositivo, el motor de síntesis está listo en aproximadamente 10 segundos. Para casos especiales en los que los desarrolladores deseen que el reloj hable inmediatamente después de abrir una aplicación o lanzar una experiencia, se puede precalentar el motor TTS antes de que lleguen solicitudes de síntesis.
Idiomas disponibles.
Por defecto, el TTS de Wear OS incluye 7 idiomas preinstalados en la imagen del sistema: inglés, español, francés, italiano, alemán, japonés y chino mandarín. Los fabricantes pueden optar por precargar un conjunto diferente de idiomas. Durante la configuración del reloj, si el usuario selecciona un idioma de sistema que no sea un archivo de voz preinstalado, el reloj descarga automáticamente el archivo de voz correspondiente la primera vez que el usuario se conecta a Wi-Fi mientras carga su reloj.
Hay casos limitados en los que la salida de voz puede diferir del idioma del sistema del usuario. Por ejemplo, en un escenario donde una aplicación de seguridad utiliza TTS para llamar a los servicios de emergencia, los desarrolladores podrían querer sintetizar el habla en el idioma de la ubicación en la que se encuentra el usuario, no en el idioma que el usuario tiene configurado en su reloj.