Google consigue hacer que el reconocimiento de voz en Android funcione on-line y off-line

Google consigue hacer que el reconocimiento de voz en Android funcione on-line y off-line

2016-03-12T17:24:27+00:00

AndroidTR dispone de un sistema de lectura de entradas automático, pulsa "Reproducir" y alguien leerá por ti. Si no funciona o tienes alguna duda, pulsa aquí.

Share on FacebookShare on Google+Tweet about this on TwitterShare on RedditEmail this to someone

En la actualidad para realizar el reconocimiento de voz, Google hace una grabación y la envía a sus servidores para que estos la procesen y puedan obtener el texto escrito, ya que normalmente este proceso es muy complicado y demasiado pesado como para que lo haga el propio dispositivo.

El nuevo sistema que están confeccionando, no requiere trabajar en un centro de datos remoto, lo que podría salvar el obstáculo de la necesidad de una conexión a internet fiable para realizar el reconocimiento de voz en un teléfono inteligente, un SmartWatch o cualquier otro dispositivo con memoria limitada.

Por limitado, se refieran a una aplicación que solo necesita 20.3MB de RAM y que cuando se probó en un Nexus 5 con una CPU de 2,26 GHz y 2 GB de RAM, logró una tasa de error de 13,5%.

Por supuesto, aún le queda gran trabajo de investigación a Google, ya que el sistema se basa en técnicas de aprendizaje automático y redes neuronales. Pero según los investigadores, el sistema de reconocimiento de voz off-line que están preparando, ya puede procesar un comando como “Enviar un correo electrónico a mamá: ¿Quedamos mañana?”

maxresdefault

Sin embargo, la transcripción exacta requiere la integración de la información personal, como la lista de contactos (en este caso para saber quién es mamá). En la actualidad ese tipo de tareas también se realizan on-line, por lo que habría que almacenar los contactos y todas sus relaciones en el dispositivo también.

Para crear el modelo, los investigadores extrajeron tres millones de palabras, que ascienden a 2.000 horas, de las búsquedas por voz en Google Now y para mejorarlo aún más también recogieron muestras de ruido de los vídeos de YouTube. En total, todo el modelo acústico desarrollado pesa solamente 80 MB.

Esta innovación puede cambiar la forma de interactuar con nuestros dispositivos, y desde aquí creemos que cada vez esta más cerca poder usar nuestros dispositivos sin manos como en las películas de ciencia ficción. ¿vosotros que opináis?

Si continúas utilizando este sitio, aceptas el uso de las cookies. Más información

ACEPTAR