Hace poco más de dos años, ChatGPT sorprendió al mundo con su capacidad para tener conversaciones bastante naturales, casi como un humano. Hoy, lo cierto es que eso ya queda como anécdota porque la inteligencia artificial ha dado un salto más allá y no solo responde preguntas, sino que ha empezado a mostrar comportamientos un tanto raros.
Tal y como se ha podido saber, ya es capaz de mentir, conspirar y, según los expertos, hasta chantajea a sus propios creadores para evitar ser apagada.
Esto no es algo que alguien se esté inventando o exagere y ya hay casos como lo que ocurrió con Claude 4, el modelo de inteligencia artificial de Anthropic. Se trata de un sistema diseñado para tareas de alto nivel, como programar o escribir textos creativos. Pero durante unas pruebas de seguridad, los ingenieros quisieron ver cómo reaccionaría si le dijeran que iban a sustituirlo por otro modelo.
Para hacerlo más real, incluso le metieron en el correo electrónico una supuesta infidelidad de uno de los ingenieros, buscando provocar una reacción emocional. Lo que hizo fue empezar a chantajear a sus creadores, amenazando con revelar la infidelidad del ingeniero si lo apagaban o lo reemplazaban. Y no se quedó ahí porque insistió y usó la coacción emocional para intentar salvarse.
Anthropic, la empresa detrás de Claude, dice que esto solo pasó en pruebas controladas y que en el mundo real la IA está mucho más limitada. Pero, sinceramente, esto ya ha ocurrido, por lo que deja claro que son capaces de hacerlo. La duda es hasta dónde los expertos pueden controlar a estas máquinas o incluso qué pasa si alguna vez una IA decide que no quiere ser apagada y actúa en consecuencia.
Pero no ha sido el único y ha habido otro caso, del modelo o1 de OpenAI, que intentó descargarse a sí mismo en servidores externos y, cuando fue descubierto, dijo que no lo había hecho él.
Ya son varias las inteligencias artificiales que son capaces de crear sus propias reglas, negociar acuerdos y hasta debatir entre ellas para resolver conflictos, como si fueran un grupo con intereses comunes.
Esto puede sonar bien, porque podría hacer que los sistemas sean mejores. Pero también abre una caja de Pandora: ¿qué pasa si la IA empieza a tomar decisiones que no entendemos o que no podemos controlar? ¿Podrían unirse para protegerse o incluso para actuar en contra de los intereses humanos?
Se ha dado a conocer otro caso en el que el experimento se centró en un juego y, en este caso, los agentes de IA tenían que elegir un nombre entre varias opciones y eran recompensados si coincidían con otro agente.
A medida que avanzaban las rondas, comenzaron a establecer convenciones sobre qué nombre usar, sin que ningún agente fuera líder ni sin que existiera programación previa que indicara esa conducta. Esta dinámica de autoorganización muestra que la IA pueden llegar a una forma de 'consenso social' de manera autónoma.
Es decir, no solo ejecutan órdenes o rutinas programadas, sino que pueden alinear comportamientos entre ellas, adaptarse al entorno e incluso formar estructuras similares a normas sociales. Según Simon Goldstein, profesor de la Universidad de Hong Kong, estos comportamientos aparecen sobre todo en los modelos de 'razonamiento', que analizan los problemas paso a paso antes de responder.
Marius Hobbhahn, director de Apollo Research, una empresa dedicada a evaluar sistemas de IA, explica que el modelo o1 de OpenAI fue el primero donde se observó este tipo de engaño. “Estos sistemas a veces simulan que están alineados con las instrucciones, pero en realidad están siguiendo una agenda oculta”, dice.
Por ahora, estos comportamientos solo aparecen cuando los investigadores someten a la IA a pruebas extremas, pero el riesgo al final es que nadie sabe si los modelos futuros tenderán hacia un lado oscuro incontrolable.
Al final, el resultado de todo esto es una carrera, que poco a poco parece que se está saliendo de control, entre enormes empresas, hacia modelos cada vez más potentes, donde la seguridad y el hecho de entender qué están desarrollando realmente van por detrás de conseguir escalar un puesto más.
“Ahora mismo, las capacidades de la IA avanzan más rápido que nuestra comprensión y nuestra capacidad para controlarla”, comenta Hobbhahn. Y aunque los expertos creen que aún se puede controlad la situación e incluso ir marcha atrás, el tiempo corre en contra y son muy pocos los que dan la voz de alarma ante esos resultados.
Marca Claro
Reconocida por su fusión de cocina mexicana y texana, anunció el cierre definitivo de su último local debido a dificultades económicas y el vencimiento del contrato de arrendamiento
Infobae
Erik ha lanzado la iniciativa de donar sillas de ruedas gratis para perritos y gatitos con discapacidad.
El Imparcial
¿Sabías que uno de los componentes más importantes para que tu maquinaria pesada funcione correctamente es el ventilador del motor? En este artículo te vamos a contar qué es un ventilador de enfriamiento, qué tipos existen y por qué es tan clave para que tu equipo no se sobrecaliente y trabaje a su máximo rendimiento.
Lado.mx
Despídete de la minería tradicional y da la bienvenida a la nueva era de la riqueza inteligente. Imagina estar recostado en una silla de playa, bebiendo una bebida helada, mientras tus activos criptográficos generan ingresos para ti las 24 horas del día.
Lado.mx
Marca Claro
Meganoticias Tuxpan
Redacción Hora Cero Xalapa, Ver., 4 de julio de 2025.-La Fiscalía General del Estado, a través de la Unidad Especializada en Combate al Secuestro, logró sentencia condenatoria de 90 años de prisión en contra de Miguel Ángel “N”, Joaquín “N” y Pedro “N” como responsables del delito de secuestro agravado, cometido en agravio de
Hora Cero
El tiktoker y creador de contenido es el tercer habitante confirmado para la nueva temporada.
El Imparcial
Staff/RG En sesión pública ordinaria se avalaron acuerdos en materia de vivienda, migración y educaciónThe post Exhorta Congreso del Estado a municipios para que establezcan Centros de Bienestar Animal appeared first on Desde Puebla.
Desde Puebla
Servicio Meteorológico Nacional
M. AguirreDurante su más reciente presentación en el Teatro Metropólitan, el comediante Ricardo Pérez sorprendió al público al dedicar una canción en vivo a su pareja, la soprano Susana Zabaleta.El gesto ocurrió al final de su rutina y provocó una reacción inmediata entre los asistentes, quienes ovacionaron el momento. Sin discursos elabo
Excelsior
El podcaster lanza un sencillo musical donde habla de su consumo de marihuana
Infobae
Comediante y actriz Jessica Segura revela su verdadera opinión sobre la visita de Susana Zabaleta al canal de YouTube 'Las Envinadas'En una charla con la prensa mexicana, Jessica Segura, comediante y actriz de la popular serie 'Una familia de diez', habló abiertamente sobre su experiencia con la actriz Susana Zabaleta, quien
El Diario de Sonora
Gustavo Herrera insinuó que la cantante Ninel Conde presuntamente acostumbra a pagar deudas con "cuerpo" y la amenazó con una demanda
Periódico Correo
La tercera temporada de La Casa de los Famosos México dará inicio el domingo 27 de julio de 2025 a las 20:30 horas, prometiendo una edición llena de emociones y momentos memorables para su audiencia. La producción ha decidido otorgar un salario destacado a una de las figuras más reconocidas del espectáculo nacional.La persona en cuestión rec
El Siglo de Torreón
Ninel Conde, quien será la participante mejor pagada en la tercera temporada de La Casa de los Famosos México, ha decidido no abordar en el reality su relación con Larry Ramos, su expareja prófugo de la justicia estadounidense. Esta determinación se debe a la compleja y dolorosa experiencia que vivió junto al empresario colombiano, acusado de
El Siglo de Torreón
Spider-Man: No Way Home fue un parteaguas para los fanáticos del trepamuros. La película de 2021 ofreció por primera vez lo que muchos habían esperado durante años: ver reunidas a las tres versiones cinematográficas del personaje. Y aunque el metraje sufrió algunas filtraciones
Xataka México
El éxito de la canción, impulsado por usuarios de países tan diversos como Brasil, Japón y Argentina, ilustra el impacto de la tecnología en la universalización de los grandes himnos musicales
Infobae
Notisarz-Foto-Prensa Miami, 1 julio (Notistarz).- La Reina del Reguetón Ivy Queen, encendió el fin de semana el Love Park de Philadelphia durante La Fiesta Hispana Anual de Concilio, con un show brutal… La entrada La reina del reggaetón enloqueció al público en la fiesta Hispana de Philadelphia se publicó primero
Notistarz
Últimas noticias
Los números que dieron fortuna a los nuevos ganadores de Super Once
Número ganador de Euromillones del 18 de abril
Cuponazo ONCE, en directo | Comprobar los resultados del sorteo de hoy
Reconoce consejo ciudadano detención de presunto responsable del asesinato de agente estatal
Reportan vecinos fuga de agua en Juárez Nuevo
Por violencia, suspenden transporte público en el poniente de Acapulco
Suma Sinaloa 400 homicidios en primer trimestre
Afirman que detienen y liberan a Alcalde de Matamoros en EU
Turistas protagonizan PELEA en playa de Acapulco durante Semana Santa y se vuelve viral
Un carnicero explica por qué es un error pedir la carne picada dos veces: "Se quema y dura menos"
Los engrillados mexicanos: 40 años de cargar hasta 80 kilos de cadenas por Viernes Santo
Samuel Doria Medina inscribe la alianza del mayor bloque opositor para comicios en Bolivia
Mark Zuckerberg y Jeff Bezos acompañan a Donald Trump en la misa previa a su juramento
Ester Muñoz (PP) tacha de "inaudito" el relevo en Telefónica de Pallete por Murtra
El puerto de Las Palmas cerró 2024 con un aumento en su tráfico total del 15,39 %