Hace más de un año, el laboratorio de investigación de inteligencia artificial (IA) OpenAI, anunció que había entrenado una mano robótica para manipular un cubo de juguete con una destreza sorprendente.
Puede que no parezca un gran avance.
Pero en el mundo de la IA, resultó impresionante por dos razones.
Primero, la mano se había enseñado a sí misma a jugar con el cubo mediante un algoritmo de aprendizaje reforzado, una técnica basada en la forma en la que aprenden los animales.
En segundo lugar, todo el entrenamiento se había realizado en simulación, es decir, en un entorno virtual, pero se logró llevar con éxito al mundo real.
En ambos sentidos, fue un paso importante hacia los robots más ágiles para aplicaciones industriales y de consumo.
La experta en robótica y profesora del MIT (EE.
UU.
) Leslie Kaelbling recuerda: “Me sorprendió un poco.
No es algo que hubiera imaginado que se podría haber hecho funcionar”.
En un nuevo artículo publicado hace unos días, OpenAI relata sus últimos resultados con su mano robótica, Dactyl.
Esta vez, la mano ha aprendido a resolver un cubo de Rubik con una mano, de nuevo mediante aprendizaje reforzado en un entorno virtual.
Se trata de un avance extraordinario, pero no tanto por la capacidad del robot para descifrar este viejo rompecabezas sino porque ese logro mostró un nuevo nivel de destreza.
“Se trata de un problema realmente difícil.
El tipo de manipulación requerida para rotar las partes del cubo de Rubik es en realidad mucho más difícil que rotar el propio cubo”, destaca el experto en robótica de la Universidad de Michigan (EE.
UU.
) y especialista en la manipulación de máquinas Dmitry Berenson.
Del mundo virtual al físico
Tradicionalmente, los robots solo han sido capaces de manipular objetos con formas muy simples.
Si bien los algoritmos de aprendizaje reforzado han tenido un gran éxito en llevar a cabo tareas complejas de software, como vencer al mejor jugador humano en el antiguo juego de Go, usarlos para entrenar una máquina física es algo totalmente diferente.
Esto se debe a que los algoritmos mejoran mediante prueba y error, en muchos casos, requieren millones de rondas.
Probablemente , que un robot físico haga esto en el mundo real requeriría demasiado tiempo y le provocaría un gran desgaste.
Incluso podría volverse peligroso si el robot empezara a recopilar datos de forma desenfrenada.
Para evitar esto, los especialistas en robótica han empezado a usar simulaciones.
Construyen un modelo virtual de su robot y lo entrenan virtualmente para llevar a cabo la tarea en cuestión.
El algoritmo aprende las cuestiones de seguridad en el espacio digital que luego son transferidas a un robot físico.
Pero ese proceso tiene sus propios desafíos.
Es casi imposible construir un modelo virtual que reproduzca exactamente las leyes de la física, las propiedades de los materiales y los comportamientos de manipulación que se ven en el mundo real, y mucho menos en circunstancias inesperadas.
Por lo tanto, cuanto más complejo es el robot y la tarea, más difícil resulta aplicar un algoritmo entrenado virtualmente en la realidad física.
Esto es lo que más impresionó a Kaelbling del proyecto de OpenAI del año pasado.
La clave de su éxito residía en que el laboratorio codificó las condiciones simuladas en cada ronda de entrenamiento para hacer que el algoritmo se adaptara a las diferentes posibilidades.
El experto señala: “Ajustaron su simulador con todo tipo de locuras.
No solo cambiaron el nivel de gravedad, también modificaron en qué dirección iba la gravedad.
Entonces, al tratar de crear una estrategia que funcionara de manera fiable con todas estas permutaciones locas, el algoritmo realmente terminó funcionando en un robot real”.
En este último proyecto, OpenAI ha llevado el enfoque un paso más allá.
Antes, los investigadores debían aleatorizar los parámetros de un entorno seleccionando manualmente las permutaciones que creían que darían lugar al mejor algoritmo.
Ahora el sistema de entrenamiento lo hace por sí mismo.
Cada vez que el robot alcanza un cierto nivel de dominio en el entorno existente, el simulador cambia sus propios parámetros para dificultar aún más las condiciones de entrenamiento.
El resultado es un algoritmo aún más robusto capaz de moverse con la precisión requerida para rotar un cubo de Rubik en el mundo real.
A través de las pruebas, los investigadores descubrieron que Dactyl también resolvió con éxito el cubo en varias condiciones para las que no había sido entrenado.
Por ejemplo, pudo completar la tarea llevando un guante de goma, mientras tenía unos dedos unidos y mientras sufría los empujones de una jirafa de peluche.
Robots para todo
OpenAI cree que sus últimos resultados proporcionan una fuerte evidencia de que su enfoque facilitará un uso más generalizado de robots capaces de adaptarse en entornos abiertos como la cocina de un hogar.
El experto de OpenAI Marcin Andrychowicz señala: “El cubo de Rubik es uno de los objetos rígidos más complicados.
Creo que cualquier otro objeto no resultará mucho más difícil “.
Aunque hay tareas más complejas que involucran un mayor número de objetos u objetos deformables, confía en que el método de este laboratorio permita entrenar robots para todos estos desafíos.
El experto señala: “Creo que este enfoque es el que logrará la adopción generalizada de la robótica”.
Sin embargo, Berenson y Kaelbling siguen siendo escépticos.
El primero afirma: “Puede parecer que hay una teoría o sistema unificado, y OpenAI solo está aplicando su enfoque a una u otra tarea concreta.
Se trata de tareas aisladas.
Hay componentes comunes, pero también hay una gran cantidad de ingeniería para que cada nueva tarea funcione.
Por eso me siento un poco incómodo con las afirmaciones de que esto logrará un uso generalizado de los robots.
Me parece un enfoque muy específico para una aplicación específica”.
Cree que parte del problema reside en el aprendizaje reforzado en sí.
Por naturaleza, esta técnica está diseñada para lograr un objetivo concreto, con cierta flexibilidad para manejar algunas variaciones.
Pero en el mundo real, el número de posibles variaciones se extiende más allá de lo que cualquiera sería capaz de simular.
En una tarea de limpieza, por ejemplo, podríamos tener diferentes tipos de fregonas, diferentes tipos de manchas y diferentes tipos de suelos.
El aprendizaje reforzado también está diseñado para aprender nuevas capacidades desde cero.
Eso no es eficiente en robótica ni representa el proceso de aprendizaje humano.
Kaelbling apunta: “Si usted ya es una persona razonablemente competente y yo intento enseñarle una habilidad motriz en la cocina, como por ejemplo batir algo, no es como si usted tuviera que aprender todo el control motriz de nuevo”.
Para superar estas limitaciones Berenson cree que harán falta otras técnicas robóticas más tradicionales.
El experto concluye: “Al final, habrá algunos procesos de aprendizaje, probablemente aprendizaje reforzado.
Pero creo que esos procesos se deberían aplicar mucho más adelante”.
Con información de technologyreview
En ambos sentidos, fue un paso importante hacia los robots más ágiles
RedacciónNormal
Uno de los problemas de los chatbots es que carecen de compresión, por lo que las personas buscan una interacción más humanizada.
Infochannel
Agencia SIM / GRUPO CANTÓN ISLA MUJERES.- Un hombre, de oficio pescador, resultó herido de dos impactos de bala, durante una riña que se suscitó la noche de ayer afuera del bar “Be” de Isla Mujeres. De acuerdo con datos extraoficiales, a consecuencia de este hecho las autoridades detuvieron a un sujeto, cerca del muelle […]T
Quintana Roo Hoy
Los Angeles Lakers llegaron a estar ganando por 22 puntos el segundo compromiso de la primera serie de playoffs ante los Denver Nuggets, pero igual sumaron su segunda derrota del emparejamiento, tras una gran remontada del equipo liderado por Nikola Jokic
12up.com
Cuando planificas tus vacaciones o un viaje de negocios, uno de los primeros aspectos a considerar es el alojamiento. Elegir entre los diferentes planes de alojamiento puede marcar la diferencia en tu experiencia de viaje.
Lado.mx
El aumento del interés por las nuevas fórmulas de ocio online para adultos, como el casino o las casas de apuestas, ha propiciado un aumento desmesurado de las plataformas dedicadas a ofrecer este servicio.
Lado.mx
Consigue el equipo para mejorar tu placer de jugar con Ganabet bono. En este texto, podemos examinar en detalle las ventajas y beneficios de crear los bonos máximos que ofrece Ganabet.
Lado.mx
Este avance inspirado en el cerebro humano se caracteriza por contar con 1.150 millones de neuronas. Intel promete revolucionar la computación con inteligencia artificial
Infobae
A lo largo de siete rondas, repartidas en tres días, los 32 equipos de la liga reclutarán a 257 jugadores para reforzar sus plantillas..
ESPNdeportes.com
Caracas, 25 abr (Prensa Latina) El ministro para Relaciones Exteriores de Venezuela, Yván Gil, recordó la Revolución de los Claveles, cuando se cumplen hoy 50 años del levantamiento militar que puso fin a la dictadura en Portugal.The post Canciller de Venezuela recordó Revolución de los Claveles first appeared on Noticias Prensa Latina.
Prensa Latina
Un trabajador de la Comisión Federal de Electricidad murió luego de recibir una fuerte descarga eléctrica cuando realizaba labores en Ecatepec. Los hechos ocurrieron cuando el empleado trabajaba en un poste y tocó cables de alta tensión, por lo que salió proyectado contra la marquesina aledaña en la colonia Jardines de Morelos. Ahí, la tard
A Fondo Estado de México
Por muchos golpes, puñetazos y revolcones que sufra Indiana Jones, uno de los encantos del personajes es que todos sabemos que no le va a pasar nada, más allá de sumar más años en cada entrega. Indy parece invulnerable y que no hay nada que pueda acabar con él, ni siquiera un fle
3d Juegos
El mexicano 'Chucky' Lozano está muy cerca de ser campeón otra vez en el futbol europeo.
ESPNdeportes.com
Después de haber anunciado a finales de enero que dejaría su puesto al término de la temporada, el entrenador del FC Barcelona, Xavi Hernández, seguirá en el banquillo de su club de siempre, confirmó el Barça a la AFP este miércoles. Como afirmaban en las últimas horas varios medios españoles, el técnico catalán, que había […]La
Versus.com.py
REDACCIÓN / Grupo Cantón ESPAÑA.- Tras haber anunciado a finales de enero que dejaría su puesto al término de la temporada, y luego de una muy mala temporada, el entrenador del Barcelona, Xavi Hernández, seguirá el próximo curso en el banquillo de coach, confirmó el club a la agencia AFP. En las últimas horas, diversos […]The post X
Quintana Roo Hoy
En busca de ganar mayor presencia internacional, como lo lograron el verano pasado América y Tigres con sus partidos ante Real Madrid y Barcelona, los clubes de Rayadas del Monterrey y Pachuca Femenil confirmaron la visita del AC Milán
24 Horas
El mexicano 'Chucky' Lozano está muy cerca de ser campeón otra vez en el futbol europeo.
ESPNdeportes.com
Repasamos algunas de las ofertas más interesantes para Nintendo Switch que han comenzado a estar disponibles desde el jueves 25 de abril de 2024 en la eShop digital de Nintendo.Una semana más, la tienda digital de Nintendo, la Nintendo eShop, vuelve a ofrecernos numerosas ofertas de videojuegos. Como ya sabemos, por norma general el grueso de act
Vandal
El mexicano Hirving Lozano y sus compañeros solo necesitan ganar en partio ajeno para consumar su coronación en el futbol de los Países Bajos.
ESPNdeportes.com
Un adulto y un bebé resultaron lesionados en un accidente múltiple que se registró la mañana de este jueves en la ciudad de Gómez Palacio, participaron cuatro vehículos.Los hechos ocurrieron cerca de las 8:45 horas sobre los carriles laterales del bulevar Ejército Mexicano, a un costado del puente Hamburgo, con dirección de Torreón a Lerdo
El Siglo de Torreón
La jugadora no podrá regresar a las canchas, debido a la debilidad visual que sufrió tras el balonazo en un entrenamiento.
ESPNdeportes.com
La Policía de Investigación (PDI) cumplimentó una orden de aprehensión contra Osvaldo “N” por el delito de homicidio calificado, en agravio de una persona en el municipio de Coxcatlán de la Huasteca potosina. La Fiscalía General del Estado de San Luis Potosí (FGESLP) informó que el 31 de diciembre de 2021, dicho sujeto habría lesionado
Frontal
Últimas noticias
El streamer mejor pagado del mundo afirma que Twitch "le obligó a ir a terapia" para seguir haciendo directos
Pronostican ambiente caluroso en la mayor parte de Oaxaca
Socializan en Oaxaca política en materia de transporte público
María Isabel Grañén Porrúa recibe la medalla Donají, máximo reconocimiento de Oaxaca de Juárez
LOS REYES DE LA COMEDIA!
CORRUPCIÓN: Policías de tránsito venden ‘notitas’ selladas para dejar circular
INE y Gobierno Federal deberán impedir intromisión de la delincuencia en elecciones
Clausura capital Centro de Rehabilitación AA en Lomas de Casablanca
¡Cuidado con los fraudes en línea!
Se abre enorme socavón en Poza Rica (+Fotos)
¡Cuidado con los fraudes en línea!
Pareja abandona a perro amarrado a poste y causa indignación en redes sociales
SLP con un nivel bajo de riesgo de violencia: Integralia
Chris Christie afirma que Joe Biden es “estúpido” al no llamarlo para solicitarle su apoyo
Se registra como moderada la calidad del aire en Puebla