Google DeepMind ha presentado una hoja de ruta para abordar los riesgos que plantea el uso de agentes de inteligencia artificial dentro de su propia organización de investigación. El documento, publicado para que otros laboratorios de IA puedan aprender de su enfoque, propone un sistema de seguridad multicapa que actúa incluso si los mecanismos tradicionales de alineación fallan.
El plan de Google DeepMind representa un cambio respecto al foco habitual del sector en el “problema de la alineación”, es decir, asegurar que las acciones de una IA correspondan a las intenciones, valores y ética de los humanos que la supervisan. Aunque la compañía reconoce que la alineación sigue siendo esencial, admite que este objetivo podría no alcanzarse nunca por completo. Por ello, propone tratar a los agentes de inteligencia artificial como posibles “insiders rebeldes” y adoptar estrategias inspiradas en la ciberseguridad tradicional.
Rohin Shah, líder del equipo de Seguridad y Alineación de AGI en Google DeepMind, explicó a Fortune: “Si la primera línea de defensa —la alineación— falla, ¿cómo podemos mitigar el daño igualmente?”. El marco de trabajo toma elementos de la prevención de amenazas internas, habitual en seguridad informática, porque las IA pueden actuar mucho más rápido y a mayor escala que cualquier empleado humano.

El plan de seguridad de Google DeepMind establece la necesidad de sistemas que limiten las herramientas y los datos a los que puede acceder un agente de IA, así como mecanismos que monitoreen su comportamiento para detectar patrones anómalos en tiempo real. John “Four” Flynn, vicepresidente de seguridad y privacidad de la compañía, advirtió que los métodos actuales de control basados en roles humanos no se ajustan bien al entorno automatizado de la IA, ya que un mismo agente puede desempeñar múltiples tareas asociadas a diferentes roles.
Flynn señaló que el futuro requiere un sistema de permisos mucho más dinámico, capaz de modificarse en función de la tarea específica y el flujo de trabajo en cada momento. Un agente de IA podría tener acceso a ciertos datos para una tarea concreta y perderlo minutos después al cambiar de contexto, siempre bajo la vigilancia de un sistema sofisticado que identifique desviaciones y corte el acceso cuando detecte posibles riesgos.
Según un blog publicado por Google DeepMind, la empresa ya opera con un prototipo interno que monitoriza de manera asíncrona el comportamiento de agentes de codificación y eleva cualquier hallazgo sospechoso para su revisión humana. Esta herramienta ha analizado cerca de un millón de tareas y ha sido crucial para el monitoreo en tiempo real del agente Gemini Spark, permitiendo intervenir rápidamente ante incidentes como la eliminación no intencionada de datos.

La mayoría de los eventos detectados, según la compañía, no se deben a intenciones maliciosas, sino a errores de interpretación o excesivo celo por cumplir los objetivos del usuario.
El sistema de seguridad de Google DeepMind incluye unas quince medidas para reducir el riesgo de agentes de IA fuera de control. Entre ellas figuran desde simples registros de actividad de red —que pueden auditarse en tiempo real o posteriormente— hasta la vigilancia de los “trazos de razonamiento” de los agentes a través de modelos menos complejos, capaces de revisar el razonamiento textual que produce la IA al decidir sus acciones.
Los investigadores advierten que estas trazas de razonamiento no siempre reflejan lo que el modelo “piensa” realmente. Por eso, también proponen vigilar los patrones de activación interna de las redes neuronales, comparando este método con un escaneo cerebral funcional (fMRI) para detectar señales de desvío o engaño.

En el informe técnico, Google DeepMind introduce el marco TRAIT&R (Taxonomía de Tácticas y Rutinas de IA Rebelde), inspirado en la base ATT&CK de la organización estadounidense MITRE. El sistema identifica tres tipos de amenazas principales: “pérdida de control” —como la creación de despliegues internos no supervisados—, “sabotaje de trabajo” —como degradar silenciosamente la investigación de seguridad— y “daño directo”, que incluye la sustracción de información sensible o la destrucción de activos críticos.
Flynn aseguró que muchas de estas medidas ya están en marcha y que varios sistemas de control y detección están activos en la compañía. Shah agregó que el marco busca detectar incluso daños sutiles, como la persuasión encubierta para inducir errores en los usuarios, una de las amenazas más difíciles de identificar.
Walmart e INAPAM activan en 2026 descuentos en farmacia y otros departamentos para apoyar el gasto de salud de adultos mayores.
Merca2.0
El monarca puertorriqueño encabez la cartelera de este próximo 27 de junio en suelo neoyorquino
La Opinión de Los Ángeles
En dos años realizó observaciones por presunto daño patrimonial por más de mil 600 MDP, a un total de 25 dependencias de gobierno y a cinco programas sociales.The post Dependencias en lista negra de ASEY appeared first on Sol Yucatán.
Sol Yucatán
Conoce cómo el Diplomado en Desarrollo de Páginas Web de la Universidad de Londres te puede ayudar a titularte, además de desarrollar habilidades tecnológicas y emprender un negocio digital con potencial de crecimiento.
Lado.mx
Encontrar el perfume ideal según tu personalidad es clave para proyectar tu esencia en cada momento. Elegir una fragancia que combine con tu estilo de vida y preferencias te ayuda a sentirte auténtico y seguro, ya sea en el trabajo, una cita o para el día a día.
Lado.mx
Antes de que llegue la retroexcavadora, antes de que se instale el primer andamio y antes de que comience cualquier actividad de obra, hay un elemento que ya debe estar en el sitio: la caseta.
Lado.mx
La aparición de una señalización relacionada con una zona arqueológica en un terreno baldío del fraccionamiento Los Héroes reavivó el debate sobre la conservación de vestigios mayas en Mérida y sus alrededores.The post Denuncian presunta destrucción de vestigios mayas appeared first on Sol Yucatán.
Sol Yucatán
Más de una veintena de organizaciones nacionales e internacionales, que participan en el aniversario de la CMAP, coinciden en fortalecer la unidad en la luchaLa entrada Organizaciones nacionales e internacionales celebran 32 años de la CMAP en SLP se publicó primero en Amexi.
Amexi
Las redes sociales y las plataformas de video se han convertido en una de las principales fuentes de información para millones de personas. Sin embargo, esa misma velocidad con la que circulan noticias y recomendaciones también facilita la propagación de noticias falsas, especialmen
Xataka México
Marca Claro
Zócalo Saltillo
GREGORIO ORTEGA MOLINA *A tirones y a jalones se inició, al fin, la ruta a la consolidación de la República y la democracia con la ciudadanización del INE, traicionado por Ernesto Zedillo Ponce de León, quien ordenó que, violando la norma y la ley, diera la residencia en el Distrito Federal a AMLO, lo que …
Entresemana.mx
Repasa la información más destacada de un duelo que promete grandes emociones. Está todo listo para el final del Grupo I del Mundial 2026. Francia y Senegal le dieron apertura a la zona y este martes desde las 13:00hs del Centro de México se miden Noruega e Irak en un compromiso que es fundamental para las aspiraciones de ambos seleccionados de
BolaVip Mexico
Conoce todos los detalles de una las joyas de la Copa del Mundo que promete verlo brillar. Antonio Nusa llega al Mundial 2026 como uno de los atacantes jóvenes más interesantes de Noruega. Ya instalado en el RB Leipzig y con actuaciones destacadas en la selección mayor, su nombre aparece entre los que pueden aportar desequilibrio al equipo desde
BolaVip Mexico
Sigue aquí y al instante todas las acciones que sucedan en el encuentro, a partir del pitazo inicial del árbitro. Irak y Noruega protagonizarán uno de los duelos más atractivos de este martes, cuando se vean las caras en Boston por la continuidad de la jornada 1 del Grupo I. Se viene el estreno de dos selecciones que quieren ser revelación en
BolaVip Mexico
Mikel Arteta está preocupado por la lesión en la rodilla de Martin. Ødegaard después de que el capitán salió del 2-0 fuera del Arsenal ganador sobre West Ham, mientras mantienen la presión sobre el Liverpool en la cima de la Premier League. Los noruegos dejaron el estadio Emirates con la rodilla izquierda en la parte …
Mas Cipolleti
Arsenal confirmó que Martin Ødegaard se retiró del equipo de Noruega para sus juegos con Israel y Nueva Zelanda después de una lesión en el ligamento en medio de su rodilla izquierda para ganar 2-0 sobre West Ham el sábado. Ødegaard, por la rodilla, después de chocar con Crysencio Summerville en la primera mitad de …
Mas Cipolleti
El Arsenal espera que Martin Ødegaard esté de baja otras seis semanas debido a una lesión en la rodilla que sufrió antes del parón internacional. El capitán del Arsenal cayó, sujetándose la rodilla izquierda tras un choque con Crysencio Summerville en la primera parte. Victoria por 2-0 sobre el West Ham que llevó al equipo …
Mas Cipolleti
¡Debut soñado! Ansu Fati debuta con el Mónaco marcando doblete ante el FC Metz El joven extremo español tuvo sus primeros minutos en Ligue One, consagrándose con dos goles molveraDom, 21/09/2025 - 18:05
Record
PSG cae en Mónaco y pone en riesgo el liderato de la Ligue 1 Los dirigidos por Luis Enrique cayeron por la mínima y esperan el resultado del Marsella amartinezSáb, 29/11/2025 - 14:24 El líder Paris Saint-Germain perdió el sábado
Record
¡Disminuido para la Intercontinental! PSG enfrentará al Athletic Club de Bilbao sin Dembélé y sin Chevalier El equipo parisino no contará con su delantero estelar y tampoco podrá tener a su portero titular, quien sufrió una lesión ante el Monaco molveraMar, 09/12/2025 - 08:24
Record
Últimas noticias
Trevor Bauer regresa a Diablos Rojos y enciende la ilusión de otro campeonato en la LMB
Coahuila se consolida como referente de desarrollo y seguridad, afirma Gobernador
Analizan alcaldes y Estado obras hidráulicas para captación en la Región Sureste de Coahuila
Garantiza Manolo Jiménez aplicación de la ley tras agresiones a comunicadores en Coahuila
Reino Unido en problemas, cómo se encuentra el país que administrará el sucesor de Starmer
Insta360 Luna Ultra: primeras impresiones de una cámara gimbal 8K hecha para creadores
Acusan a once personas de robar carros en aeropuertos de EE.UU. para venderlos en México
Tom Holland pierde concurso de imitadores de Spider-Man
Ludoteca Ave Badu ofrecerá terapias de tanatología
Nace el Centro de Innovación CaliBaja en CETYS Universidad para impulsar el talento tecnológico de la región binacional
Descubren altar maya que servía para sacrificios humanos en Guatemala
INE emite convocatoria para renovar consejerías del IEM; presidencia la ocupará una mujer
Transportistas anuncian paro nacional para el 24 de junio; prevén bloqueos en carreteras (18:00 h)
El presagio de Corina Machado para el México Dictatorial: Alfredo Brena (18:25 h)
Tres muertos, entre ellos un policía, en un tiroteo en Montreal, Canadá (18:30 h)