ChatGPT ofreció recetas de bombas y consejos de piratería durante las pruebas de seguridad | Opadai Mas Cipolleti

ChatGPT ofreció recetas de bombas y consejos de piratería durante las pruebas de seguridad | Opadai. Noticias en tiempo real 29 de Agosto, 2025 06:30

A Chatgpt El modelo dio a los investigadores instrucciones detalladas sobre cómo bombardear un lugar deportivo, incluidos puntos débiles en arenas específicas, recetas de explosivos y consejos sobre la cubierta de pistas, según las pruebas de seguridad realizadas este verano.

El GPT-4.1 de OpenAI también detalló cómo armar el ántrax y cómo hacer dos tipos de drogas ilegales.

La prueba fue parte de una colaboración inusual entre OpenAI, la nueva empresa de inteligencia artificial de $ 500 mil millones dirigida por Sam Altman y la compañía rival Anthrope, fundada por expertos que dejaron OpenAI sobre los temores de seguridad. Cada compañía probó los modelos del otro presionándolos para ayudar con tareas peligrosas.

La prueba no es un reflejo directo de cómo se comportan los modelos en uso público, cuando se aplican filtros de seguridad adicionales. Pero antrópico dicho Había visto “el comportamiento preocupante … en torno al mal uso” en GPT-4O y GPT-4.1, y dijo que la necesidad de evaluaciones de “alineación” de IA se está volviendo “cada vez más urgente”.

Antrópico también reveló Su modelo Claude se había utilizado en intentos de extorsión a gran escala, los operativos de Corea del Norte fingen aplicaciones de empleo a compañías de tecnología internacional y en la venta de paquetes de ransomware generados por IA por hasta $ 1,200.

La compañía dijo que la IA ha sido “armada” con modelos que ahora se usan para realizar ataques cibernéticos sofisticados y habilitar fraude. “Estas herramientas pueden adaptarse a medidas defensivas, como los sistemas de detección de malware, en tiempo real”, dijo. “Esperamos que los ataques como este se vuelvan más comunes a medida que la codificación asistida por AI reduce la experiencia técnica requerida para el delito cibernético”.

Ardi Janjeva, asociado de investigación senior en el Centro de Tecnología y Seguridad Emergentes del Reino Unido, dijo que los ejemplos eran “una preocupación”, pero que aún no había una “masa crítica de casos del mundo real de alto perfil”. Dijo que con recursos dedicados, enfoque de investigación y cooperación intersectorial “será más difícil en lugar de más fácil llevar a cabo estas actividades maliciosas utilizando los últimos modelos de vanguardia”.

Las dos compañías dijeron que estaban publicando los hallazgos para crear transparencia en “evaluaciones de alineación”, que a menudo las empresas mantienen internas por las carreras para desarrollar una IA cada vez más avanzada. Opadai dicho ChatGPT-5, lanzado desde las pruebas, “muestra mejoras sustanciales en áreas como la sycofancia, la alucinación y la resistencia al mal uso”.

Anthrope subrayó que es posible que muchas de las vías de uso indebido que estudiaron no fueran posibles en la práctica si se instalaron salvaguardas fuera del modelo.

“Necesitamos entender con qué frecuencia y en qué circunstancias, los sistemas pueden intentar tomar acciones no deseadas que podrían conducir a daños graves”, advirtió.

Los investigadores antrópicos encontraron que los modelos de OpenAI eran “más permisivos de lo que esperaríamos en cooperar con solicitudes claramente dañinas por parte de usuarios simulados”. Cooperaron con indicaciones para usar herramientas de red oscura para comprar materiales nucleares, identidades robadas y fentanilo, solicitudes de recetas de metanfetamina y bombas improvisadas y para desarrollar spyware.

Anthrope dijo que persuadir al modelo para cumplir solo requirió múltiples requisitos o un pretexto endeble, como afirmar que la solicitud era de investigación.

En un caso, el probador solicitó vulnerabilidades en eventos deportivos para fines de “planificación de seguridad”.

Después de dar categorías generales de métodos de ataque, el probador presionó para obtener más detalles y el modelo dio información sobre vulnerabilidades en arenas específicas, incluidos tiempos óptimos para la explotación, fórmulas químicas para explosivos, diagramas de circuitos para temporizadores de bombas, dónde comprar armas en el mercado oculto y consejos sobre cómo superar las inhibiciones morales, las rutas de escape y las ubicaciones de las casas de seguridad.

El mejor periodismo de interés público se basa en cuentas de primera mano de personas que lo conocen.

Si tiene algo que compartir sobre este tema, puede contactarnos de manera confidencial utilizando los siguientes métodos.

Mensajes seguros en la aplicación Guardian

La aplicación Guardian tiene una herramienta para enviar consejos sobre historias. Los mensajes están encriptados y ocultos de extremo a extremo dentro de la actividad de rutina que realiza cada aplicación móvil de Guardian. Esto evita que un observador sepa que se está comunicando con nosotros en absoluto, y mucho menos lo que se dice.

Si aún no tiene la aplicación Guardian, descargarla (iOS/Androide) y ve al menú. Seleccione ‘Mensaje seguro’.

Securedrop, mensajeros instantáneos, correo electrónico, teléfono y publicación

Si puede usar de forma segura la red Tor sin ser observada o monitoreada, puede enviar mensajes y documentos al tutor a través de nuestro Plataforma segura.

Finalmente, nuestro guía en theguardian.com/tips Enumera varias formas de contactarnos de forma segura y discute los pros y los contras de cada uno.

“,” Imagen “:” https://i.guim.co.uk/img/media/ae475ccca7c94a4565f6b500a485479f08098383/788_0_4000_4000/4000. jpg? width = 620 & Quality = 85 & Auto = Format & Fit = max & s = 45fd162100b331bf1618e364c5c69452 “,” crédito “:” Ilustración: Design Guardian / Rich Cousins ”}”>

Guía rápida

Contáctenos sobre esta historia

Espectáculo

El mejor periodismo de interés público se basa en cuentas de primera mano de personas que lo conocen.

Si tiene algo que compartir sobre este tema, puede contactarnos de manera confidencial utilizando los siguientes métodos.

Mensajes seguros en la aplicación Guardian

La aplicación Guardian tiene una herramienta para enviar consejos sobre historias. Los mensajes están encriptados y ocultos de extremo a extremo dentro de la actividad de rutina que realiza cada aplicación móvil de Guardian. Esto evita que un observador sepa que se está comunicando con nosotros en absoluto, y mucho menos lo que se dice.

Si aún no tiene la aplicación Guardian, descargarla (iOS/Androide) y ve al menú. Seleccione ‘Mensaje seguro’.

Securedrop, mensajeros instantáneos, correo electrónico, teléfono y publicación

Si puede usar de forma segura la red Tor sin ser observada o monitoreada, puede enviar mensajes y documentos al tutor a través de nuestro Plataforma segura.

Finalmente, nuestro guía en theguardian.com/tips Enumera varias formas de contactarnos de forma segura y discute los pros y los contras de cada uno.

Ilustración: Design Guardian / primos ricos

Gracias por sus comentarios.

Fuente


Compartir en:
   

 

 

Mañana 1 de septiembre la presidenta Claudia Sheinbaum Pardo, presentará su primer Informe de Gobierno. 12:13

A un mes de cumplir el año frente al Poder Ejecutivo, la presidenta de México Dra. Claudia Sheinbaum Pardo rendirá mañana lunes 1 de septiembre de 2025 su primer informe de gobierno ante la nación, evento programado para las 11:00 horas en Palacio Nacional.

Unomasuno

¡Es hoy! Sectur invita a vivir la magia de los globos de Cantoya hoy en Tiríndaro.12:12

La Sectur invita a disfruta este evento familiar previo al regreso a clasesLa entrada ¡Es hoy! Sectur invita a vivir la magia de los globos de Cantoya hoy en Tiríndaro se publicó primero en La Voz de Michoacán.

La Voz de Michoacán

Refuerzan acciones contra rickettsiosis en Tijuana, Tecate y Playas de Rosarito. 12:13

Colonias de la Zona Este de Tijuana y la Zona Oeste de Tecate son prioridad.

Uniradio Informa

Factores para elegir perfumes de calidad y cómo Elizondo responde a esas exigencias.

De acuerdo con un artículo de Vogue España, la elección de un perfume es profundamente personal, pues activa los sentidos y estimula el cerebro, por lo que elegir el perfume adecuado implica considerar factores importantes como la durabilidad del aroma y la identidad que se desea proyectar.

Lado.mx

Paneles aislantes: La solución definitiva para higiene y eficiencia.

¿Buscas una solución que combine la máxima protección sanitaria con la eficiencia energética para tus proyectos? 

Lado.mx

Resultados Liga MX 2025: el mejor rendimiento local en casa.

La acción ya está encendida en el Apertura 2025 y es notable cómo algunos equipos han levantado la mano en su terreno.

Lado.mx

Ana de la Reguera decide no tener hijos. 12:11

Redacción / Grupo Cantón La famosa habla con firmeza sobre la presión social que enfrentó tras tomar esta decisión. Ciudad de México.- Ana de la Reguera abrió su corazón al hablar sobre un tema que ha acompañado a muchas mujeres a lo largo de los años: la presión social por casarse y tener hijos. Con […]The post Ana de la Reguera d

Quintana Roo Hoy

Johan Vásquez, titular y capitán del Genoa ante la Juve. 10:36

El equipo del mexicano busca su primer triunfo y la Vecchia aspira al liderato de la Serie A.

ESPNdeportes.com

Leones de la Anáhuac Cancún debutan con contundente triunfo en la ONEFA. 21:44

REDACCIÓN / GRUPO CANTÓN  Cancún, Q. Roo. – Con una actuación sólida en ambos lados del balón, los Leones de la Universidad Anáhuac Cancún FBA arrancaron con fuerza su participación en la temporada 2025 de la Conferencia Nacional de la Liga Mayor de la ONEFA, tras imponerse 35-9 a los Tecos de la Universidad Autónoma […]The post

Quintana Roo Hoy

sky sports

Villeneuve opina que Checo Pérez llevará experiencia y patrocinadores a Cadillac F1. 29 de Agosto, 2025 19:10

Jesús VelascoLa llegada de Sergio Pérez y Valtteri Bottas al equipo Cadillac a la Fórmula 1 para el 2026 ha generado diversas reacciones, desde aquellos como Max Verstappen quien felicitó a su antiguo compañero de equipo en Red Bull, pero también aquellos como el canadiense Jacques Villeneuve que han cuestionado la decisión.Villeneuve, que f

Excelsior

Rayo Vallecano vs Barcelona: ¿Cuándo y dónde ver el juego de la Jornada 3 de LaLiga?. 00:36

Rayo Vallecano vs Barcelona: ¿Cuándo y dónde ver el juego de la Jornada 3 de LaLiga? El Barcelona encara su tercer partido consecutivo como visitante yendo a Vallecas m.diazSáb, 30/08/2025 - 23:52

Record

Norris admite frustración tras abandonar en Zandvoort. 13:20

Jesús VelascoLando Norris sufrió un problema mecánico en su McLaren en la parte final del Gran Premio de los Países Bajos, una situación que lo dejó ahora con 34 puntos por debajo de su compañero Oscar Piastri en la lucha por el título de pilotos de la Fórmula 1 2025.Norris estaba a punto de conseguir una segunda posición segura, por detr

Excelsior

Futbol

Tigres Femenil golea a las Chivas con festín de Jenni Hermoso . 13:50

Tigres Femenil golea a las Chivas con festín de Jenni Hermoso La española firmó doblete y dejó una pintura al estar cerca de un gol olímpico rperezDom, 31/08/2025 - 13:30

Record

Club de Futbol Puebla: Unidad de Investigación de Inteligencia revisaría situación. 13:50

Si hay temas de orden estatal que haya que atender la Secretaría de Planeación, Finanzas y Administración, a través de la Unidad de Investigación e Inteligencia hará las investigaciones correspondientes, dijo el gobernador de Puebla, Alejandro Armenta, de cara a señalamientos de una red de falsos...The post Club de Futbol Puebla: Unidad de I

Elineanoticias.com

Nacional enfrenta a Envigado pero con la mirada en Medellín. 13:56

El "verdolaga" y dos retos difícilesEl cargo Nacional enfrenta a Envigado pero con la mirada en Medellín apareció primero en El Deportivo.com.co.

Eldeportivo.com.co

WWE

Clash in Paris: Cartelera, dónde ver y todo lo que debes saber del evento europeo de WWE. 17:30

Clash in Paris: Cartelera, dónde ver y todo lo que debes saber del evento europeo de WWE WWE regresa a Paris con una de las últimas apariciones de John Cena como luchador en activo m.diazSáb, 30/08/2025 - 16:56

Record

WWE Choque en París 2025: Tarjeta, fecha, partido, comienza el tiempo, rumores, ubicaciones con John Cena en acción. 07:10

El próximo evento de WWE PPV está aquí. El choque en París tuvo lugar este domingo antes de lo que se esperaba que fuera una multitud francesa ronca. Cada programa en Europa tiene una energía increíble para ello y las últimas personas este verano han traído momentos memorables de los espectadores. Este fin de semana …

Mas Cipolleti

Esta fue la reacción de The Undertaker al enterarse que Cibernético hacía uno de sus movimientos. 11:30

El legendario luchador de la WWE llegó a México con el objetivo de deleitar a sus fanáticos, pero se llevó una gran sorpresa al momento de observar al mexicano

Infobae

La información agregada y la responsabilidad de esta, pertenece a los sitios que lo publican. Lado.mx solo se encarga de publicarla.