Nota del editor: Una de las tecnologías centrales de la inteligencia artificial son las redes neuronales. En esta entrevista, Tam Nguyen, profesor de ciencias de la computación en la Universidad de Dayton, explica cómo funcionan las redes neuronales, programas en los que una serie de algoritmos tratan de simular el cerebro humano.
¿Cuáles son algunos ejemplos de redes neuronales que resultan familiares a la mayoría de la gente?
Hay muchas aplicaciones de las redes neuronales. Un ejemplo común es la capacidad de la cámara de tu smartphone para reconocer caras.
Los coches sin conductor están equipados con múltiples cámaras que tratan de reconocer otros vehículos, señales de tráfico y peatones mediante el uso de redes neuronales, y giran o ajustan su velocidad en consecuencia.
Las redes neuronales también están detrás de las sugerencias de texto que se ven al escribir textos o correos electrónicos, e incluso en las herramientas de traducción disponibles en línea.
¿La red necesita tener un conocimiento previo de algo para poder clasificarlo o reconocerlo?
Sí, por eso es necesario utilizar big data en el entrenamiento de las redes neuronales. Funcionan porque se entrenan con grandes cantidades de datos para luego reconocer, clasificar y predecir cosas.
En el ejemplo de los coches sin conductor, necesitaría ver millones de imágenes y vídeos de todas las cosas que hay en la calle y que le dijeran qué es cada una de esas cosas. Cuando se hace clic en las imágenes de los pasos de peatones para demostrar que no se es un robot mientras se navega por Internet, también se puede utilizar para ayudar a entrenar una red neuronal. Solo después de ver millones de pasos de peatones, desde todos los ángulos y condiciones de iluminación diferentes, un coche de autoconducción sería capaz de reconocerlos cuando circule por la vida real.
Las redes neuronales más complicadas son realmente capaces de enseñarse a sí mismas. En el vídeo enlazado a continuación, se le da a la red la tarea de ir del punto A al punto B, y se puede ver cómo prueba todo tipo de cosas para intentar que el modelo llegue al final del recorrido, hasta que encuentra una que hace el mejor trabajo.
Algunas redes neuronales pueden trabajar juntas para crear algo nuevo. En este ejemplo, las redes crean caras virtuales que no pertenecen a personas reales cuando se refresca la pantalla. Una red hace un intento de crear una cara y la otra trata de juzgar si es real o falsa. Van de un lado a otro hasta que la segunda no puede decir que la cara creada por la primera es falsa.
Los humanos también aprovechan el big data. Una persona percibe unos 30 fotogramas o imágenes por segundo, lo que supone 1.800 imágenes por minuto, y más de 600 millones de imágenes al año. Por eso deberíamos dar a las redes neuronales una oportunidad similar de disponer de los big data para su entrenamiento.
¿Cómo funciona una red neuronal básica?
Una red neuronal es una red de neuronas artificiales programadas en software. Intenta simular el cerebro humano, por lo que tiene muchas capas de «neuronas» al igual que las neuronas de nuestro cerebro. La primera capa de neuronas recibe datos de entrada como imágenes, vídeo, sonido, texto, etc. Estos datos de entrada pasan por todas las capas, ya que la salida de una capa se introduce en la siguiente.
Tomemos el ejemplo de una red neuronal entrenada para reconocer perros y gatos. La primera capa de neuronas dividirá esta imagen en áreas de luz y oscuridad. Estos datos se introducirán en la siguiente capa para reconocer los bordes. La siguiente capa trataría de reconocer las formas formadas por la combinación de bordes. Los datos pasarían por varias capas de forma similar para finalmente reconocer si la imagen que le has mostrado es un perro o un gato según los datos con los que ha sido entrenada.
Estas redes pueden ser increíblemente complejas y constan de millones de parámetros para clasificar y reconocer la entrada que recibe.
¿Por qué vemos ahora tantas aplicaciones de las redes neuronales?
En realidad, las redes neuronales se inventaron hace mucho tiempo, en 1943, cuando Warren McCulloch y Walter Pitts crearon un modelo computacional de redes neuronales basado en algoritmos. Luego, la idea pasó por una larga hibernación porque aún no existían los inmensos recursos computacionales necesarios para construir redes neuronales.
Recientemente, la idea ha regresado a lo grande, gracias a recursos computacionales avanzados como las unidades de procesamiento gráfico (GPU). Son chips que se han utilizado para el procesamiento de gráficos en los videojuegos, pero resulta que también son excelentes para crujir los datos necesarios para ejecutar redes neuronales. Por eso vemos ahora la proliferación de las redes neuronales.