Google

Así puedes ayudar a Google a entrenar su red neuronal dibujando

Nada de lo que hace Google es casual. Desde el sistema recaptcha al que ayudamos a seleccionar las imágenes correctas hasta nuestros dibujos sirven para entrenar los sistemas de la compañía.

Cristian Do Carmo Rodríguez
11 de ene. de 2023
2 min de lectura
Software
Persona pintando manchada de pintura

Aunque no seamos conscientes, usando algunos de los productos y servicios de Google, por ejemplo reCAPTCHA, estamos ayudando a la compañía a mejorar sus algoritmos. Normalmente este proceso tiene lugar en segundo plano y pasa desapercibido para el usuario, no obstante, también existen casos donde la empresa nos solicita ayuda. Esto sucede por ejemplo si usamos el reconocimiento facial en Google Fotos, donde directamente en caso de duda nos preguntará si dos imágenes pertenecen a la misma persona, pero también si queremos pintar nuestra propia “Mona Lisa”.

Hace meses Google presentó “Corre, dibuja” o “Quick draw” en inglés. Se trata de una web en la que se nos irá indicando un objeto, por ejemplo “Tostadora” y tendremos 20 segundos para dibujarla. El encargado de acertar qué estamos dibujando no es ni más ni menos que una red neuronal entrenada por Google, que irá diciéndonos qué es lo que piensa que dibujamos hasta acertar.

Se trata de una red neuronal “Sencilla” dado a que el número de objetos a adivinar está acotado. La red no está entrenada para detectar todos los objetos que existen, solo unos pocos con los que ha sido pre-entrenada. Si no es capaz de adivinarlo, bien porque no entienda nuestro dibujo o bien porque seamos pésimos dibujantes, al final comparará los dibujos fallidos con otros elementos con los que ha “confundido” nuestro dibujo. Esto nos dará una prueba de lo cerca o lejos que ha estado con su predicción.

Fragmento del set de datos de imágenes sobre La Mona Lisa de Quick Draw
Fragmento del set de datos de imágenes sobre La Mona Lisa de Quick Draw

Pues bien, además de reconocer nuestros dibujos, Google también usa de manera activa lo que dibujemos para perfeccionar su algoritmo, de forma que cada vez el conjunto de datos con los que entrenar la red sea mayor, y no solo eso, también ofrece dicha colección a otras personas interesadas.

Para hacernos una idea de la magnitud de estos datos, si buscamos dibujos de La Mona Lisa, la colección de imágenes diferentes asciende a las 111.579 a la hora de escribir este artículo, y La Mona Lisa es solo uno de los dibujos que nos pueden aparecer en el juego y que conforma el dataset de 50 millones de dibujos.

Si estás interesado o interesada en estudiar este conjunto de datos y usarlo para entrenar tu propia red neuronal, está disponible bajo licencia CC By 4.0 en Github.