Lo último en software de Google parece sacado de una película

Lo último en software de Google parece sacado de una película

2018-04-12T21:26:07+00:00

AndroidTR dispone de un sistema de lectura de entradas automático, pulsa "Reproducir" y alguien leerá por ti. Si no funciona o tienes alguna duda, pulsa aquí.

Tenemos un nuevo ejemplo de lo que se puede hacer con las herramientas que Google ha creado
Share on FacebookShare on Google+Tweet about this on TwitterShare on RedditEmail this to someone

Hasta ahora hemos visto en muchas ocasiones como Google intentaba añadir toda su tecnología a problemas cotidianos. Usar el aprendizaje máquina para, por ejemplo, detectar células cancerosas y hacer más fácil y rápido el trabajo de los médicos. En esta ocasión, Google nos enseña algo de película que podría estar en un episodio de la serie CSI.

Cuando estamos en un ambiente donde más de una persona está hablando nos concentramos para escuchar solo lo que nos interesa. Portar esta capacidad a una máquina es mucho más difícil de lo que las series de televisión nos han hecho creer. No solo es seleccionar en qué sonidos focalizar la atención o, al menos, esto no era así hasta ahora.

 

YouTube y mucho trabajo.

Con las herramientas de aprendizaje profundo de Google junto con una cantidad ingente de vídeos de YouTube donde aparecía solo una persona hablando cada vez, Google ha conseguido entrenar a su algoritmo para lograr los resultados que podéis ver en los vídeos que os dejamos en el artículo.

Esta nueva herramienta no usa solo los datos de sonido, también las imágenes del vídeo para saber cuantos individuos participan a la vez. De esta forma y con lo que parece que ha sido mucho trabajo han conseguido entrenar un sistema que separa las distintas voces o elementos.

 

Los resultados.

 

 

Los resultados parecen muy prometedores y podrían formar parte ya de un episodio de Black Mirror. Lo que se obtiene es, por ejemplo, la capacidad de silenciar a una determinada persona en un vídeo. Esta función en debates de cualquier índole podría servir para separar a dos personas hablando simultáneamente.

 

 

En este segundo ejemplo tenemos otro caso donde esta tecnología puede ser aplicada. Mientras realizamos una videollamada en un lugar público para que la otra persona solo nos escuche a nosotros y no el ruido de fondo. Separando a la persona que habla en primer plano del resto de las voces podemos conseguir una función muy interesante. Veremos si Google la incorpora pronto en sus servicios.

 

Vía – Google Research.