Google

Lo último en software de Google parece sacado de una película

Cristian Do Carmo Rodríguez
12 de abr. de 2018
1 min de lectura
AppleYouTube

Hasta ahora hemos visto en muchas ocasiones como Google intentaba añadir toda su tecnología a problemas cotidianos. Usar el aprendizaje máquina para, por ejemplo, detectar células cancerosas y hacer más fácil y rápido el trabajo de los médicos. En esta ocasión, Google nos enseña algo de película que podría estar en un episodio de la serie CSI.

Cuando estamos en un ambiente donde más de una persona está hablando nos concentramos para escuchar solo lo que nos interesa. Portar esta capacidad a una máquina es mucho más difícil de lo que las series de televisión nos han hecho creer. No solo es seleccionar en qué sonidos focalizar la atención o, al menos, esto no era así hasta ahora.

 

YouTube y mucho trabajo.

Con las herramientas de aprendizaje profundo de Google junto con una cantidad ingente de vídeos de YouTube donde aparecía solo una persona hablando cada vez, Google ha conseguido entrenar a su algoritmo para lograr los resultados que podéis ver en los vídeos que os dejamos en el artículo.

Esta nueva herramienta no usa solo los datos de sonido, también las imágenes del vídeo para saber cuantos individuos participan a la vez. De esta forma y con lo que parece que ha sido mucho trabajo han conseguido entrenar un sistema que separa las distintas voces o elementos.

 

Los resultados.

 

 

Los resultados parecen muy prometedores y podrían formar parte ya de un episodio de Black Mirror. Lo que se obtiene es, por ejemplo, la capacidad de silenciar a una determinada persona en un vídeo. Esta función en debates de cualquier índole podría servir para separar a dos personas hablando simultáneamente.

 

 

En este segundo ejemplo tenemos otro caso donde esta tecnología puede ser aplicada. Mientras realizamos una videollamada en un lugar público para que la otra persona solo nos escuche a nosotros y no el ruido de fondo. Separando a la persona que habla en primer plano del resto de las voces podemos conseguir una función muy interesante. Veremos si Google la incorpora pronto en sus servicios.

 

Vía – Google Research.