¿Qué es el aprendizaje reforzado?
- Tomas Jerez Fuica
- 8 abr
- 3 Min. de lectura

Los más veteranos recordarán que nos decían en colegios y universidades “El futuro ya está aquí”. Pues sí, parece que ese futuro es ya nuestro presente, y la robótica tiene mucho que decir en ello.
La Inteligencia artificial se ha convertido en una verdadera revolución que ya forma parte de nuestro día a día, con aplicaciones que van desde la informática hasta la medicina, el transporte o la construcción. De hecho, puede que ahora estés leyendo estas líneas desde un smartphone con algún sistema de reconocimiento facial, de texto o de voz, inteligencia artificial instalada en nuestras vidas.
Lo cierto es que la tendencia es que los ordenadores acaben actuando como humanos a base de ir mejorando su algoritmo de adiestramiento hasta poder aprender por sí solos. Y ahí es donde aparece el concepto del que hablamos en este artículo, el aprendizaje reforzado, un conjunto de algoritmos que permite a los robots hacer que su comportamiento sea cada vez más autónomo.
Sistemas de Machine Learning cada vez menos supervisados
¿Cómo aprenden las máquinas? La base está en el Aprendizaje supervisado, un tipo de aprendizaje máquina o Machine Learning en donde la máquina cuenta con un conjunto de ejemplos de los cuáles conoce de antemano la respuesta, es decir, intenta hacer predicciones a futuro basadas en comportamientos que ya ha visto y que tiene almacenados en su histórico de datos.
El increíble aumento en la capacidad de cálculo de los ordenadores ha permitido que este aprendizaje sea cada vez más preciso, y es donde nos encontramos con un concepto de ‘adiestramiento’ de inteligencia artificial mucho más avanzado: el Aprendizaje profundo que, a diferencia del anterior, implica menos supervisión humana directa.
El Aprendizaje profundo usa una gran red neuronal simulada y es capaz de reconocer patrones de comportamiento en esos datos almacenados. Los ejemplos de Aprendizaje profundo en acción más conocidos son los sistemas de reconocimiento de voz Google Now, Siri de Apple, o Cortana de Microsoft.
Aprendizaje reforzado aplicado a la conducción
Es el sueño de los que nos pasamos horas al volante, que nuestro coche aprenda a circular por sí solo. El Aprendizaje reforzado inspirado en la psicología conductual es la clave para que la conducción autónoma sea una realidad: que un coche sea capaz de entrar por sí solo en una rotonda por el sitio correcto, incorporarse a una autovía de forma segura, o saber moverse en un monumental atasco.
Llevamos varios años leyendo noticias sobre la conducción autónoma y parece que su implantación en la vida está a la vuelta de la esquina, pero aún los vehículos sin conductor a veces titubean ante situaciones complejas en las que intervienen otros conductores humanos, como incorporaciones a otras vías. Si no queremos riesgos innecesarios ni atascos, tendrán que adquirir capacidades de conducción más precisas, como ubicarse entre una multitud de coches.
Mobileye, una empresa israelí que realiza sistemas de seguridad para diversas empresas del motor, trabaja ahora mismo en una plataforma que permitirá a los fabricantes compartir los datos recopilados por sus coches autónomos, y de esta manera seguir aprendiendo de todo el entorno, ya sea de los humanos o de los vehículos que se conducen solos. Un software que acelera los procesos y resulta mucho más eficiente que si los programadores tuviesen que codificar todas estas decisiones.
Comments