DeepMind gana de nuevo. La inteligencia artificial ya sabe leer los labios mejor que los humanos

La inteligencia artificial, podría ser la respuesta para ayudar a millones de personas en todo el mundo, y Google lo sabe. Semana tras semana, estamos conociendo los avances que hacen en este sector, aplicándolo a diferentes campos de la inteligencia.

Hoy, nos toca hablar de un sistema que promete ayudar a personas con problemas de audición leyendo los labios de la gente. Una técnica casi reservada a los más expertos y a la ciencia ficción.

Pruebas en la vida real

Para probarla, unos trabajadores de la Universidad de Oxford junto con el equipo de Google DeepMind, han puesto a prueba a la inteligencia artificial junto a un reputado lector de labios.

El lector de labios humano, usado para el test, ha otorgado sus servicios al tribunal supremo en repetidas ocasiones, por lo que se puede decir que es uno de los mejores en su campo. Para comprobar su destreza, le mostraron muestras aleatorias de 200 vídeos de la BBC y únicamente fue capaz de descifrar correctamente un cuarto de las palabras habladas. Mientras que el sistema de IA fue capaz de descifrar la mitad, dentro del mismo conjunto.

Si bien ninguna de las dos cifras es para tirar cohetes, conseguir extraer la mitad del texto directamente de los vídeos de la televisión sin estar preparados es una gran hazaña

 

Posibilidades de esta tecnología

Este sistema, puede parecer poco útil para personas sin problemas de audición, pero sin ir más lejos, podría ayudarnos en nuestros móviles, podría ser un gran avance en la forma de hablarle a los asistentes de voz como Google Assistant o Siri, o para mejorar los sistemas de reconocimiento de voz generales basados en audio, sobre todo en ambientes ruidosos.

 

Al igual que la mayoría de tecnologías basadas en aprendizaje máquina y redes neuronales, hace falta una base de datos masiva, para entrenar a estos sistemas. Por lo que para hacer funcionar esta prueba se han adiestrado con cerca de 5.000 horas de programas de la BBC. Lo que les otorgó cerca de 118.000 frases y 15.500 palabras únicas.

 

No es la primera vez que hablamos de la inteligencia artificial ni de las redes neuronales en esta página, y es que se están convirtiendo en una de las tecnologías más importantes del siglo XXI ya que aportan información prácticamente imposible de obtener con los algoritmos clásicos. Por esto, no queremos perder de vista a esta tecnología para traérosla e informaros de todo lo que pueda salir de aquí.