Google DeepMind tiene un plan para protegerse si sus agentes de IA se descontrolan

20 de Junio, 2026 19:00

El nuevo plan de Google DeepMind propone tratar a los agentes de IA como posibles amenazas internas dentro de las organizaciones. (Reuters)

Google DeepMind ha presentado una hoja de ruta para abordar los riesgos que plantea el uso de agentes de inteligencia artificial dentro de su propia organización de investigación. El documento, publicado para que otros laboratorios de IA puedan aprender de su enfoque, propone un sistema de seguridad multicapa que actúa incluso si los mecanismos tradicionales de alineación fallan.

El plan de Google DeepMind representa un cambio respecto al foco habitual del sector en el “problema de la alineación”, es decir, asegurar que las acciones de una IA correspondan a las intenciones, valores y ética de los humanos que la supervisan. Aunque la compañía reconoce que la alineación sigue siendo esencial, admite que este objetivo podría no alcanzarse nunca por completo. Por ello, propone tratar a los agentes de inteligencia artificial como posibles “insiders rebeldes” y adoptar estrategias inspiradas en la ciberseguridad tradicional.

Rohin Shah, líder del equipo de Seguridad y Alineación de AGI en Google DeepMind, explicó a Fortune: “Si la primera línea de defensa —la alineación— falla, ¿cómo podemos mitigar el daño igualmente?”. El marco de trabajo toma elementos de la prevención de amenazas internas, habitual en seguridad informática, porque las IA pueden actuar mucho más rápido y a mayor escala que cualquier empleado humano.

El sistema de vigilancia de DeepMind ha analizado cerca de un millón de tareas de agentes de codificación. (AP)

Monitorización y control dinámico en tiempo real

El plan de seguridad de Google DeepMind establece la necesidad de sistemas que limiten las herramientas y los datos a los que puede acceder un agente de IA, así como mecanismos que monitoreen su comportamiento para detectar patrones anómalos en tiempo real. John “Four” Flynn, vicepresidente de seguridad y privacidad de la compañía, advirtió que los métodos actuales de control basados en roles humanos no se ajustan bien al entorno automatizado de la IA, ya que un mismo agente puede desempeñar múltiples tareas asociadas a diferentes roles.

Flynn señaló que el futuro requiere un sistema de permisos mucho más dinámico, capaz de modificarse en función de la tarea específica y el flujo de trabajo en cada momento. Un agente de IA podría tener acceso a ciertos datos para una tarea concreta y perderlo minutos después al cambiar de contexto, siempre bajo la vigilancia de un sistema sofisticado que identifique desviaciones y corte el acceso cuando detecte posibles riesgos.

Prototipos y herramientas en desarrollo

Según un blog publicado por Google DeepMind, la empresa ya opera con un prototipo interno que monitoriza de manera asíncrona el comportamiento de agentes de codificación y eleva cualquier hallazgo sospechoso para su revisión humana. Esta herramienta ha analizado cerca de un millón de tareas y ha sido crucial para el monitoreo en tiempo real del agente Gemini Spark, permitiendo intervenir rápidamente ante incidentes como la eliminación no intencionada de datos.

La hoja de ruta incluye quince medidas de protección, como auditorías de red y monitoreo de razonamiento interno de la IA. (Imagen Ilustrativa Infobae)

La mayoría de los eventos detectados, según la compañía, no se deben a intenciones maliciosas, sino a errores de interpretación o excesivo celo por cumplir los objetivos del usuario.

Una estrategia múltiple contra agentes rebeldes

El sistema de seguridad de Google DeepMind incluye unas quince medidas para reducir el riesgo de agentes de IA fuera de control. Entre ellas figuran desde simples registros de actividad de red —que pueden auditarse en tiempo real o posteriormente— hasta la vigilancia de los “trazos de razonamiento” de los agentes a través de modelos menos complejos, capaces de revisar el razonamiento textual que produce la IA al decidir sus acciones.

Los investigadores advierten que estas trazas de razonamiento no siempre reflejan lo que el modelo “piensa” realmente. Por eso, también proponen vigilar los patrones de activación interna de las redes neuronales, comparando este método con un escaneo cerebral funcional (fMRI) para detectar señales de desvío o engaño.

El marco TRAIT&R de DeepMind identifica amenazas como pérdida de control, sabotaje de trabajo y daño directo por parte de agentes de IA. (Google)

Taxonomía y amenazas identificadas

En el informe técnico, Google DeepMind introduce el marco TRAIT&R (Taxonomía de Tácticas y Rutinas de IA Rebelde), inspirado en la base ATT&CK de la organización estadounidense MITRE. El sistema identifica tres tipos de amenazas principales: “pérdida de control” —como la creación de despliegues internos no supervisados—, “sabotaje de trabajo” —como degradar silenciosamente la investigación de seguridad— y “daño directo”, que incluye la sustracción de información sensible o la destrucción de activos críticos.

Flynn aseguró que muchas de estas medidas ya están en marcha y que varios sistemas de control y detección están activos en la compañía. Shah agregó que el marco busca detectar incluso daños sutiles, como la persuasión encubierta para inducir errores en los usuarios, una de las amenazas más difíciles de identificar.

Compartir en:

INAPAM 2026: ¿de cuánto es el descuento en Walmart con la credencial para adultos mayores?. 16:32

Walmart e INAPAM activan en 2026 descuentos en farmacia y otros departamentos para apoyar el gasto de salud de adultos mayores.

Merca2.0

Xander Zayas asegura que liquidará a Ennis para entrar en la lista de los mejores libra por libra.16:21

El monarca puertorriqueño encabez la cartelera de este próximo 27 de junio en suelo neoyorquino

La Opinión de Los Ángeles

Dependencias en lista negra de ASEY. 16:14

En dos años realizó observaciones por presunto daño patrimonial por más de mil 600 MDP, a un total de 25 dependencias de gobierno y a cinco programas sociales.The post Dependencias en lista negra de ASEY appeared first on Sol Yucatán.

Sol Yucatán

Diplomado en Desarrollo de Páginas Web: La mejor oportunidad para titularte y emprender en el entorno digital.

Conoce cómo el Diplomado en Desarrollo de Páginas Web de la Universidad de Londres te puede ayudar a titularte, además de desarrollar habilidades tecnológicas y emprender un negocio digital con potencial de crecimiento.

Lado.mx

Cómo elegir el perfume ideal según tu personalidad.

Encontrar el perfume ideal según tu personalidad es clave para proyectar tu esencia en cada momento. Elegir una fragancia que combine con tu estilo de vida y preferencias te ayuda a sentirte auténtico y seguro, ya sea en el trabajo, una cita o para el día a día.

Lado.mx

Casetas de obra: la infraestructura temporal que toda construcción en La Laguna necesita desde el día uno.

Antes de que llegue la retroexcavadora, antes de que se instale el primer andamio y antes de que comience cualquier actividad de obra, hay un elemento que ya debe estar en el sitio: la caseta.

Lado.mx

Denuncian presunta destrucción de vestigios mayas.15:43

La aparición de una señalización relacionada con una zona arqueológica en un terreno baldío del fraccionamiento Los Héroes reavivó el debate sobre la conservación de vestigios mayas en Mérida y sus alrededores.The post Denuncian presunta destrucción de vestigios mayas appeared first on Sol Yucatán.

Sol Yucatán

Organizaciones nacionales e internacionales celebran 32 años de la CMAP en SLP. 15:05

Más de una veintena de organizaciones nacionales e internacionales, que participan en el aniversario de la CMAP, coinciden en fortalecer la unidad en la luchaLa entrada Organizaciones nacionales e internacionales celebran 32 años de la CMAP en SLP se publicó primero en Amexi.

Amexi

Secretaría de Bienestar ha desmentido el último video viral de YouTube: "es totalmente falso que las personas deban cumplir requisitos adicionales" . 15:33

Las redes sociales y las plataformas de video se han convertido en una de las principales fuentes de información para millones de personas. Sin embargo, esa misma velocidad con la que circulan noticias y recomendaciones también facilita la propagación de noticias falsas, especialmen

Xataka México

El Águila de Veracruz vs Tecos de Los Dos Laredos, en vivo | Liga Mexicana de Béisbol 2026. 23:50

Marca Claro

Dos adolescentes resultaron lesionados tras chocar contra un vehículo en colonia de #Saltillo. 19:50

Zócalo Saltillo

LA COSTUMBRE DEL PODER/ De la dictadura perfecta a la dictadura imperfecta. 02:00

GREGORIO ORTEGA MOLINA *A tirones y a jalones se inició, al fin, la ruta a la consolidación de la República y la democracia con la ciudadanización del INE, traicionado por Ernesto Zedillo Ponce de León, quien ordenó que, violando la norma y la ley, diera la residencia en el Distrito Federal a AMLO, lo que …

Entresemana.mx

El Águila de Veracruz vs Tecos de Los Dos Laredos, en vivo | Liga Mexicana de Béisbol 2026. 23:50

Marca Claro

Dos adolescentes resultaron lesionados tras chocar contra un vehículo en colonia de #Saltillo. 19:50

Zócalo Saltillo

México y sus posibles rivales: España, Uruguay o Cabo Verde | La Copa en tus Manos | 21 de junio. 23:50

Marca Claro

antonio nusa

¿Juega Erling Haaland? Las alineaciones de Irak vs. Noruega por el Mundial 2026. 16 de Junio, 2026 14:10

Repasa la información más destacada de un duelo que promete grandes emociones. Está todo listo para el final del Grupo I del Mundial 2026. Francia y Senegal le dieron apertura a la zona y este martes desde las 13:00hs del Centro de México se miden Noruega e Irak en un compromiso que es fundamental para las aspiraciones de ambos seleccionados de

BolaVip Mexico

Quién es Antonio Nusa: perfil, estadísticas, presente y rol en la Noruega del Mundial 2026. 16 de Junio, 2026 15:27

Conoce todos los detalles de una las joyas de la Copa del Mundo que promete verlo brillar. Antonio Nusa llega al Mundial 2026 como uno de los atacantes jóvenes más interesantes de Noruega. Ya instalado en el RB Leipzig y con actuaciones destacadas en la selección mayor, su nombre aparece entre los que pueden aportar desequilibrio al equipo desde

BolaVip Mexico

Sigue GRATIS y EN VIVO Irak vs. Noruega vía ViX Premium: transmisión minuto a minuto por el Mundial 2026. 16 de Junio, 2026 15:27

Sigue aquí y al instante todas las acciones que sucedan en el encuentro, a partir del pitazo inicial del árbitro. Irak y Noruega protagonizarán uno de los duelos más atractivos de este martes, cuando se vean las caras en Boston por la continuidad de la jornada 1 del Grupo I. Se viene el estreno de dos selecciones que quieren ser revelación en

BolaVip Mexico

martin ødegaard

La lesión de Martin. Ødegaard fabrica la victoria del Arsenal a través de West Ham |. 04 de Octubre, 2025 17:50

Mikel Arteta está preocupado por la lesión en la rodilla de Martin. Ødegaard después de que el capitán salió del 2-0 fuera del Arsenal ganador sobre West Ham, mientras mantienen la presión sobre el Liverpool en la cima de la Premier League. Los noruegos dejaron el estadio Emirates con la rodilla izquierda en la parte …

Mas Cipolleti

Arsenal confirma Martin. Ødegaard está dañado en el medio de la garantía |. 05 de Octubre, 2025 13:10

Arsenal confirmó que Martin Ødegaard se retiró del equipo de Noruega para sus juegos con Israel y Nueva Zelanda después de una lesión en el ligamento en medio de su rodilla izquierda para ganar 2-0 sobre West Ham el sábado. Ødegaard, por la rodilla, después de chocar con Crysencio Summerville en la primera mitad de …

Mas Cipolleti

Arsenal predice que Martin Ødegaard se perderá 6 semanas por lesión de rodilla | Arsenal. 13 de Octubre, 2025 11:50

El Arsenal espera que Martin Ødegaard esté de baja otras seis semanas debido a una lesión en la rodilla que sufrió antes del parón internacional. El capitán del Arsenal cayó, sujetándose la rodilla izquierda tras un choque con Crysencio Summerville en la primera parte. Victoria por 2-0 sobre el West Ham que llevó al equipo …

Mas Cipolleti

lamine camara

¡Debut soñado! Ansu Fati debuta con el Mónaco marcando doblete ante el FC Metz. 21 de Septiembre, 2025 18:40

¡Debut soñado! Ansu Fati debuta con el Mónaco marcando doblete ante el FC Metz El joven extremo español tuvo sus primeros minutos en Ligue One, consagrándose con dos goles molveraDom, 21/09/2025 - 18:05

Record

PSG cae en Mónaco y pone en riesgo el liderato de la Ligue 1. 29 de Noviembre, 2025 14:48

PSG cae en Mónaco y pone en riesgo el liderato de la Ligue 1 Los dirigidos por Luis Enrique cayeron por la mínima y esperan el resultado del Marsella amartinezSáb, 29/11/2025 - 14:24 El líder Paris Saint-Germain perdió el sábado

Record

¡Disminuido para la Intercontinental! PSG enfrentará al Athletic Club de Bilbao sin Dembélé y sin Chevalier. 09 de Diciembre, 2025 09:27

¡Disminuido para la Intercontinental! PSG enfrentará al Athletic Club de Bilbao sin Dembélé y sin Chevalier El equipo parisino no contará con su delantero estelar y tampoco podrá tener a su portero titular, quien sufrió una lesión ante el Monaco molveraMar, 09/12/2025 - 08:24

Record

Últimas noticias

Trevor Bauer regresa a Diablos Rojos y enciende la ilusión de otro campeonato en la LMB

Coahuila se consolida como referente de desarrollo y seguridad, afirma Gobernador

Analizan alcaldes y Estado obras hidráulicas para captación en la Región Sureste de Coahuila

Garantiza Manolo Jiménez aplicación de la ley tras agresiones a comunicadores en Coahuila

Reino Unido en problemas, cómo se encuentra el país que administrará el sucesor de Starmer

Insta360 Luna Ultra: primeras impresiones de una cámara gimbal 8K hecha para creadores

Acusan a once personas de robar carros en aeropuertos de EE.UU. para venderlos en México

Tom Holland pierde concurso de imitadores de Spider-Man

Ludoteca Ave Badu ofrecerá terapias de tanatología

Nace el Centro de Innovación CaliBaja en CETYS Universidad para impulsar el talento tecnológico de la región binacional

Descubren altar maya que servía para sacrificios humanos en Guatemala

INE emite convocatoria para renovar consejerías del IEM; presidencia la ocupará una mujer

Transportistas anuncian paro nacional para el 24 de junio; prevén bloqueos en carreteras (18:00 h)

El presagio de Corina Machado para el México Dictatorial: Alfredo Brena (18:25 h)

Tres muertos, entre ellos un policía, en un tiroteo en Montreal, Canadá (18:30 h)

Google DeepMind tiene un plan para protegerse si sus agentes de IA se descontrolan Infobae

💙 Suscríbete a nuestras notificaciones y obtén noticias en tiempo real

Monitorización y control dinámico en tiempo real

Prototipos y herramientas en desarrollo

Una estrategia múltiple contra agentes rebeldes

Taxonomía y amenazas identificadas

INAPAM 2026: ¿de cuánto es el descuento en Walmart con la credencial para adultos mayores?. 16:32

Xander Zayas asegura que liquidará a Ennis para entrar en la lista de los mejores libra por libra.16:21

Dependencias en lista negra de ASEY. 16:14

Diplomado en Desarrollo de Páginas Web: La mejor oportunidad para titularte y emprender en el entorno digital.

Cómo elegir el perfume ideal según tu personalidad.

Casetas de obra: la infraestructura temporal que toda construcción en La Laguna necesita desde el día uno.

Denuncian presunta destrucción de vestigios mayas.15:43

Organizaciones nacionales e internacionales celebran 32 años de la CMAP en SLP. 15:05

Secretaría de Bienestar ha desmentido el último video viral de YouTube: "es totalmente falso que las personas deban cumplir requisitos adicionales" . 15:33

El Águila de Veracruz vs Tecos de Los Dos Laredos, en vivo | Liga Mexicana de Béisbol 2026. 23:50

Dos adolescentes resultaron lesionados tras chocar contra un vehículo en colonia de #Saltillo. 19:50

LA COSTUMBRE DEL PODER/ De la dictadura perfecta a la dictadura imperfecta. 02:00

El Águila de Veracruz vs Tecos de Los Dos Laredos, en vivo | Liga Mexicana de Béisbol 2026. 23:50

Dos adolescentes resultaron lesionados tras chocar contra un vehículo en colonia de #Saltillo. 19:50

México y sus posibles rivales: España, Uruguay o Cabo Verde | La Copa en tus Manos | 21 de junio. 23:50

antonio nusa

¿Juega Erling Haaland? Las alineaciones de Irak vs. Noruega por el Mundial 2026. 16 de Junio, 2026 14:10

Quién es Antonio Nusa: perfil, estadísticas, presente y rol en la Noruega del Mundial 2026. 16 de Junio, 2026 15:27

Sigue GRATIS y EN VIVO Irak vs. Noruega vía ViX Premium: transmisión minuto a minuto por el Mundial 2026. 16 de Junio, 2026 15:27

martin ødegaard

La lesión de Martin. Ødegaard fabrica la victoria del Arsenal a través de West Ham |. 04 de Octubre, 2025 17:50

Arsenal confirma Martin. Ødegaard está dañado en el medio de la garantía |. 05 de Octubre, 2025 13:10

Arsenal predice que Martin Ødegaard se perderá 6 semanas por lesión de rodilla | Arsenal. 13 de Octubre, 2025 11:50

lamine camara

¡Debut soñado! Ansu Fati debuta con el Mónaco marcando doblete ante el FC Metz. 21 de Septiembre, 2025 18:40

PSG cae en Mónaco y pone en riesgo el liderato de la Ligue 1. 29 de Noviembre, 2025 14:48

¡Disminuido para la Intercontinental! PSG enfrentará al Athletic Club de Bilbao sin Dembélé y sin Chevalier. 09 de Diciembre, 2025 09:27