Entrenamiento eficiente dirigido por humanos para robots domésticos


Un método innovador permite a los usuarios no técnicos comprender las razones detrás de las fallas de un robot y ajustarlo sin esfuerzo para realizar tareas de manera óptima.

:Imagen: Jose-Luis Olivares/MIT con imágenes de iStock y The Coop
Jose-Luis Olivares/MIT con imágenes de iStock y The Coop

Imagina que compras un robot doméstico para una variedad de tareas. Está hecho y entrenado en fábrica sin que usted conozca los artículos de su hogar. Entonces, si se le pide que tome una taza de la mesa de la cocina, es posible que el programa no reconozca su taza, lo que generará un error. El entrenamiento actual de robots necesita mejorar su comprensión.

Investigadores del MIT, la Universidad de Nueva York y la Universidad de California en Berkeley han desarrollado un marco que permite a los humanos instruir de manera eficiente a los robots para que completen tareas con el mínimo esfuerzo. Cuando un robot falla, un algoritmo genera explicaciones contrafácticas. El sistema muestra esto a la persona que proporciona comentarios sobre el error. Usando esta retroalimentación y las explicaciones, el sistema empareja el robot con nuevos datos. El ajuste fino acelera el aprendizaje del robot para diferentes tareas.

Índice del contenido

En el trabajo de formación

Durante el entrenamiento, los robots fallan debido a cambios de distribución y encuentros con nuevos objetos y espacios. El aprendizaje por imitación vuelve a entrenar a un robot a través de la demostración del usuario. Sin embargo, si el usuario muestra un vaso blanco, el robot puede asumir erróneamente que todos los vasos son blancos. Puede que se necesiten miles de demostraciones para enseñarle al robot a reconocer tazas de cualquier color. El marco consta de tres fases principales. Primero, se presenta la tarea que provocó la falla del robot. En segundo lugar, recopila demostraciones de los usuarios de las acciones previstas y genera escenarios contrafácticos mediante el examen de diferentes funciones para determinar los cambios necesarios para que el robot tenga éxito. Finalmente, presenta estos contrahechos al usuario, recopila comentarios y genera numerosas demostraciones avanzadas que facilitan el ajuste fino del rendimiento del robot.

Del pensamiento humano al pensamiento robótico

Los investigadores tenían como objetivo involucrar a los humanos en el entrenamiento, por lo que evaluaron su técnica con usuarios humanos. Aplicaron el marco a tres simulaciones que involucran tareas robóticas: navegación, desbloqueo de objetos y colocación de objetos. Su método permitió un aprendizaje de robot más rápido con menos demostraciones de usuarios. Planean validar aún más el marco en robots reales y reducir el tiempo de creación de datos utilizando modelos generativos de aprendizaje automático.

El objetivo de los investigadores es que los robots realicen tareas similares a las de los humanos de una manera semánticamente significativa. Su objetivo es permitir que los robots aprendan de manera efectiva representaciones abstractas similares a las humanas.

Si quieres conocer otros artículos parecidos a Entrenamiento eficiente dirigido por humanos para robots domésticos puedes visitar la categoría Electrónica.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir