Las claves para entender el hito del robot que resolvió el cubo de Rubik

20 de Octubre, 2019 13:35

Hace más de un año, el laboratorio de investigación de inteligencia artificial (IA) OpenAI, anunció que había entrenado una mano robótica para manipular un cubo de juguete con una destreza sorprendente.
Puede que no parezca un gran avance.
Pero en el mundo de la IA, resultó impresionante por dos razones.
Primero, la mano se había enseñado a sí misma a jugar con el cubo mediante un algoritmo de aprendizaje reforzado, una técnica basada en la forma en la que aprenden los animales.
En segundo lugar, todo el entrenamiento se había realizado en simulación, es decir, en un entorno virtual, pero se logró llevar con éxito al mundo real.
En ambos sentidos, fue un paso importante hacia los robots más ágiles para aplicaciones industriales y de consumo.
La experta en robótica y profesora del MIT (EE.
UU.
) Leslie Kaelbling recuerda: “Me sorprendió un poco.
No es algo que hubiera imaginado que se podría haber hecho funcionar”.
En un nuevo artículo publicado hace unos días, OpenAI relata sus últimos resultados con su mano robótica, Dactyl.
Esta vez, la mano ha aprendido a resolver un cubo de Rubik con una mano, de nuevo mediante aprendizaje reforzado en un entorno virtual.
Se trata de un avance extraordinario, pero no tanto por la capacidad del robot para descifrar este viejo rompecabezas sino porque ese logro mostró un nuevo nivel de destreza.
“Se trata de un problema realmente difícil.
El tipo de manipulación requerida para rotar las partes del cubo de Rubik es en realidad mucho más difícil que rotar el propio cubo”, destaca el experto en robótica de la Universidad de Michigan (EE.
UU.
) y especialista en la manipulación de máquinas Dmitry Berenson.
Del mundo virtual al físico Tradicionalmente, los robots solo han sido capaces de manipular objetos con formas muy simples.
Si bien los algoritmos de aprendizaje reforzado han tenido un gran éxito en llevar a cabo tareas complejas de software, como vencer al mejor jugador humano en el antiguo juego de Go, usarlos para entrenar una máquina física es algo totalmente diferente.
Esto se debe a que los algoritmos mejoran mediante prueba y error, en muchos casos, requieren millones de rondas.
Probablemente , que un robot físico haga esto en el mundo real requeriría demasiado tiempo y le provocaría un gran desgaste.
Incluso podría volverse peligroso si el robot empezara a recopilar datos de forma desenfrenada.
Para evitar esto, los especialistas en robótica han empezado a usar simulaciones.
Construyen un modelo virtual de su robot y lo entrenan virtualmente para llevar a cabo la tarea en cuestión.
El algoritmo aprende las cuestiones de seguridad en el espacio digital que luego son transferidas a un robot físico.
Pero ese proceso tiene sus propios desafíos.
Es casi imposible construir un modelo virtual que reproduzca exactamente las leyes de la física, las propiedades de los materiales y los comportamientos de manipulación que se ven en el mundo real, y mucho menos en circunstancias inesperadas.
Por lo tanto, cuanto más complejo es el robot y la tarea, más difícil resulta aplicar un algoritmo entrenado virtualmente en la realidad física.
Esto es lo que más impresionó a Kaelbling del proyecto de OpenAI del año pasado.
La clave de su éxito residía en que el laboratorio codificó las condiciones simuladas en cada ronda de entrenamiento para hacer que el algoritmo se adaptara a las diferentes posibilidades.
El experto señala: “Ajustaron su simulador con todo tipo de locuras.
No solo cambiaron el nivel de gravedad, también modificaron en qué dirección iba la gravedad.
Entonces, al tratar de crear una estrategia que funcionara de manera fiable con todas estas permutaciones locas, el algoritmo realmente terminó funcionando en un robot real”.
En este último proyecto, OpenAI ha llevado el enfoque un paso más allá.
Antes, los investigadores debían aleatorizar los parámetros de un entorno seleccionando manualmente las permutaciones que creían que darían lugar al mejor algoritmo.
Ahora el sistema de entrenamiento lo hace por sí mismo.
Cada vez que el robot alcanza un cierto nivel de dominio en el entorno existente, el simulador cambia sus propios parámetros para dificultar aún más las condiciones de entrenamiento.
El resultado es un algoritmo aún más robusto capaz de moverse con la precisión requerida para rotar un cubo de Rubik en el mundo real.
A través de las pruebas, los investigadores descubrieron que Dactyl también resolvió con éxito el cubo en varias condiciones para las que no había sido entrenado.
Por ejemplo, pudo completar la tarea llevando un guante de goma, mientras tenía unos dedos unidos y mientras sufría los empujones de una jirafa de peluche.
Robots para todo OpenAI cree que sus últimos resultados proporcionan una fuerte evidencia de que su enfoque facilitará un uso más generalizado de robots capaces de adaptarse en entornos abiertos como la cocina de un hogar.
El experto de OpenAI Marcin Andrychowicz señala: “El cubo de Rubik es uno de los objetos rígidos más complicados.
Creo que cualquier otro objeto no resultará mucho más difícil “.
Aunque hay tareas más complejas que involucran un mayor número de objetos u objetos deformables, confía en que el método de este laboratorio permita entrenar robots para todos estos desafíos.
El experto señala: “Creo que este enfoque es el que logrará la adopción generalizada de la robótica”.
Sin embargo, Berenson y Kaelbling siguen siendo escépticos.
El primero afirma: “Puede parecer que hay una teoría o sistema unificado, y OpenAI solo está aplicando su enfoque a una u otra tarea concreta.
Se trata de tareas aisladas.
Hay componentes comunes, pero también hay una gran cantidad de ingeniería para que cada nueva tarea funcione.
Por eso me siento un poco incómodo con las afirmaciones de que esto logrará un uso generalizado de los robots.
Me parece un enfoque muy específico para una aplicación específica”.
Cree que parte del problema reside en el aprendizaje reforzado en sí.
Por naturaleza, esta técnica está diseñada para lograr un objetivo concreto, con cierta flexibilidad para manejar algunas variaciones.
Pero en el mundo real, el número de posibles variaciones se extiende más allá de lo que cualquiera sería capaz de simular.
En una tarea de limpieza, por ejemplo, podríamos tener diferentes tipos de fregonas, diferentes tipos de manchas y diferentes tipos de suelos.
El aprendizaje reforzado también está diseñado para aprender nuevas capacidades desde cero.
Eso no es eficiente en robótica ni representa el proceso de aprendizaje humano.
Kaelbling apunta: “Si usted ya es una persona razonablemente competente y yo intento enseñarle una habilidad motriz en la cocina, como por ejemplo batir algo, no es como si usted tuviera que aprender todo el control motriz de nuevo”.
Para superar estas limitaciones Berenson cree que harán falta otras técnicas robóticas más tradicionales.
El experto concluye: “Al final, habrá algunos procesos de aprendizaje, probablemente aprendizaje reforzado.
Pero creo que esos procesos se deberían aplicar mucho más adelante”.
Con información de technologyreview En ambos sentidos, fue un paso importante hacia los robots más ágiles RedacciónNormal

Compartir en:

Jelou: 90% de las conversaciones con chatbots son abandonadas. 09:55

Uno de los problemas de los chatbots es que carecen de compresión, por lo que las personas buscan una interacción más humanizada.

Infochannel

Balean a hombre en riña afuera de bar de Isla Mujeres.09:53

Agencia SIM / GRUPO CANTÓN ISLA MUJERES.- Un hombre, de oficio pescador, resultó herido de dos impactos de bala, durante una riña que se suscitó la noche de ayer afuera del bar “Be” de Isla Mujeres. De acuerdo con datos extraoficiales, a consecuencia de este hecho las autoridades detuvieron a un sujeto, cerca del muelle […]T

Quintana Roo Hoy

NBA Playoffs en vivo: Dónde ver Denver Nuggets vs. Los Angeles Lakers en TV y streaming. 09:53

Los Angeles Lakers llegaron a estar ganando por 22 puntos el segundo compromiso de la primera serie de playoffs ante los Denver Nuggets, pero igual sumaron su segunda derrota del emparejamiento, tras una gran remontada del equipo liderado por Nikola Jokic

12up.com

Planes de alojamiento: guía para elegir la mejor opción.

Cuando planificas tus vacaciones o un viaje de negocios, uno de los primeros aspectos a considerar es el alojamiento. Elegir entre los diferentes planes de alojamiento puede marcar la diferencia en tu experiencia de viaje.

Lado.mx

Tecnología aplicada a las casas de apuestas.

El aumento del interés por las nuevas fórmulas de ocio online para adultos, como el casino o las casas de apuestas, ha propiciado un aumento desmesurado de las plataformas dedicadas a ofrecer este servicio.

Lado.mx

Descubriendo los beneficios de Ganabet Bono en México.

Consigue el equipo para mejorar tu placer de jugar con Ganabet bono. En este texto, podemos examinar en detalle las ventajas y beneficios de crear los bonos máximos que ofrece Ganabet.

Lado.mx

Crean una computadora capaz de realizar 20 cuatrillones de operaciones por segundo.08:50

Este avance inspirado en el cerebro humano se caracteriza por contar con 1.150 millones de neuronas. Intel promete revolucionar la computación con inteligencia artificial

Infobae

El ABC del Draft 2024 de la NFL: todo lo que debes saber. 09:14

A lo largo de siete rondas, repartidas en tres días, los 32 equipos de la liga reclutarán a 257 jugadores para reforzar sus plantillas..

ESPNdeportes.com

Canciller de Venezuela recordó Revolución de los Claveles. 08:10

Caracas, 25 abr (Prensa Latina) El ministro para Relaciones Exteriores de Venezuela, Yván Gil, recordó la Revolución de los Claveles, cuando se cumplen hoy 50 años del levantamiento militar que puso fin a la dictadura en Portugal.The post Canciller de Venezuela recordó Revolución de los Claveles first appeared on Noticias Prensa Latina.

Prensa Latina

FULMINADO: Trabajador de la CFE muere electrocutado al ganarse la vida.Ayer, 11:54

Un trabajador de la Comisión Federal de Electricidad murió luego de recibir una fuerte descarga eléctrica cuando realizaba labores en Ecatepec. Los hechos ocurrieron cuando el empleado trabajaba en un poste y tocó cables de alta tensión, por lo que salió proyectado contra la marquesina aledaña en la colonia Jardines de Morelos. Ahí, la tard

A Fondo Estado de México

Si paras El templo maldito en el minuto 1:48:50 verás que Indiana Jones es invulnerable, pero en realidad, es un error garrafal. 07:35

Por muchos golpes, puñetazos y revolcones que sufra Indiana Jones, uno de los encantos del personajes es que todos sabemos que no le va a pasar nada, más allá de sumar más años en cada entrega. Indy parece invulnerable y que no hay nada que pueda acabar con él, ni siquiera un fle

3d Juegos

$¿Cuáles son los escenarios para que PSV y \'Chucky\' se coronen en la Eredivisie?$

¿Cuáles son los escenarios para que PSV y \'Chucky\' se coronen en la Eredivisie?. Ayer, 13:34

El mexicano 'Chucky' Lozano está muy cerca de ser campeón otra vez en el futbol europeo.

ESPNdeportes.com

Fútbol Club Barcelona

Xavi seguirá como entrenador del FC Barcelona. Ayer, 15:34

Después de haber anunciado a finales de enero que dejaría su puesto al término de la temporada, el entrenador del FC Barcelona, Xavi Hernández, seguirá en el banquillo de su club de siempre, confirmó el Barça a la AFP este miércoles. Como afirmaban en las últimas horas varios medios españoles, el técnico catalán, que había […]La

Versus.com.py

Xavi seguirá como entrenador del Barcelona, Rafa Márquez no convence. Ayer, 20:44

REDACCIÓN / Grupo Cantón ESPAÑA.- Tras haber anunciado a finales de enero que dejaría su puesto al término de la temporada, y luego de una muy mala temporada, el entrenador del Barcelona, Xavi Hernández, seguirá el próximo curso en el banquillo de coach, confirmó el club a la agencia AFP. En las últimas horas, diversos […]The post X

Quintana Roo Hoy

Visita italiana en Monterrey y Pachuca. 05:11

En busca de ganar mayor presencia internacional, como lo lograron el verano pasado América y Tigres con sus partidos ante Real Madrid y Barcelona, los clubes de Rayadas del Monterrey y Pachuca Femenil confirmaron la visita del AC Milán

24 Horas

PSV Eindhoven

$¿Cuáles son los escenarios para que PSV y \'Chucky\' se coronen en la Eredivisie?$

¿Cuáles son los escenarios para que PSV y \'Chucky\' se coronen en la Eredivisie?. Ayer, 13:34

El mexicano 'Chucky' Lozano está muy cerca de ser campeón otra vez en el futbol europeo.

ESPNdeportes.com

Las mejores ofertas de Nintendo Switch en la eShop de esta semana (25/04/2024). 01:23

Repasamos algunas de las ofertas más interesantes para Nintendo Switch que han comenzado a estar disponibles desde el jueves 25 de abril de 2024 en la eShop digital de Nintendo.Una semana más, la tienda digital de Nintendo, la Nintendo eShop, vuelve a ofrecernos numerosas ofertas de videojuegos. Como ya sabemos, por norma general el grueso de act

Vandal

Chucky y PSV buscan ganar para ser campeones. 10:34

El mexicano Hirving Lozano y sus compañeros solo necesitan ganar en partio ajeno para consumar su coronación en el futbol de los Países Bajos.

ESPNdeportes.com

Lesión

Carambola resulta en un bebé y un adulto lesionados en Gómez Palacio . 10:41

Un adulto y un bebé resultaron lesionados en un accidente múltiple que se registró la mañana de este jueves en la ciudad de Gómez Palacio, participaron cuatro vehículos.Los hechos ocurrieron cerca de las 8:45 horas sobre los carriles laterales del bulevar Ejército Mexicano, a un costado del puente Hamburgo, con dirección de Torreón a Lerdo

El Siglo de Torreón

Ana Campa acepta apoyo del León por lesión en ojo. 11:00

La jugadora no podrá regresar a las canchas, debido a la debilidad visual que sufrió tras el balonazo en un entrenamiento.

ESPNdeportes.com

Por homicidio en Coxcatlán, FGESLP detiene a Osvaldo “N” en Jalisco. 11:10

La Policía de Investigación (PDI) cumplimentó una orden de aprehensión contra Osvaldo “N” por el delito de homicidio calificado, en agravio de una persona en el municipio de Coxcatlán de la Huasteca potosina. La Fiscalía General del Estado de San Luis Potosí (FGESLP) informó que el 31 de diciembre de 2021, dicho sujeto habría lesionado

Frontal

Últimas noticias

El streamer mejor pagado del mundo afirma que Twitch "le obligó a ir a terapia" para seguir haciendo directos

Pronostican ambiente caluroso en la mayor parte de Oaxaca

Socializan en Oaxaca política en materia de transporte público

María Isabel Grañén Porrúa recibe la medalla Donají, máximo reconocimiento de Oaxaca de Juárez

LOS REYES DE LA COMEDIA!

CORRUPCIÓN: Policías de tránsito venden ‘notitas’ selladas para dejar circular

INE y Gobierno Federal deberán impedir intromisión de la delincuencia en elecciones

Clausura capital Centro de Rehabilitación AA en Lomas de Casablanca

¡Cuidado con los fraudes en línea!

Se abre enorme socavón en Poza Rica (+Fotos)

¡Cuidado con los fraudes en línea!

Pareja abandona a perro amarrado a poste y causa indignación en redes sociales

SLP con un nivel bajo de riesgo de violencia: Integralia

Chris Christie afirma que Joe Biden es “estúpido” al no llamarlo para solicitarle su apoyo

Se registra como moderada la calidad del aire en Puebla

Las claves para entender el hito del robot que resolvió el cubo de Rubik SoySD.mx

Jelou: 90% de las conversaciones con chatbots son abandonadas. 09:55

Balean a hombre en riña afuera de bar de Isla Mujeres.09:53

NBA Playoffs en vivo: Dónde ver Denver Nuggets vs. Los Angeles Lakers en TV y streaming. 09:53

Planes de alojamiento: guía para elegir la mejor opción.

Tecnología aplicada a las casas de apuestas.

Descubriendo los beneficios de Ganabet Bono en México.

Crean una computadora capaz de realizar 20 cuatrillones de operaciones por segundo.08:50

El ABC del Draft 2024 de la NFL: todo lo que debes saber. 09:14

Canciller de Venezuela recordó Revolución de los Claveles. 08:10

FULMINADO: Trabajador de la CFE muere electrocutado al ganarse la vida.Ayer, 11:54

Si paras El templo maldito en el minuto 1:48:50 verás que Indiana Jones es invulnerable, pero en realidad, es un error garrafal. 07:35

¿Cuáles son los escenarios para que PSV y \'Chucky\' se coronen en la Eredivisie?. Ayer, 13:34

Fútbol Club Barcelona

Xavi seguirá como entrenador del FC Barcelona. Ayer, 15:34

Xavi seguirá como entrenador del Barcelona, Rafa Márquez no convence. Ayer, 20:44

Visita italiana en Monterrey y Pachuca. 05:11

PSV Eindhoven

¿Cuáles son los escenarios para que PSV y \'Chucky\' se coronen en la Eredivisie?. Ayer, 13:34

Las mejores ofertas de Nintendo Switch en la eShop de esta semana (25/04/2024). 01:23

Chucky y PSV buscan ganar para ser campeones. 10:34

Lesión

Carambola resulta en un bebé y un adulto lesionados en Gómez Palacio . 10:41

Ana Campa acepta apoyo del León por lesión en ojo. 11:00

Por homicidio en Coxcatlán, FGESLP detiene a Osvaldo “N” en Jalisco. 11:10