ChatGPT miente y busca sobrevivir solo, como en Terminator

10 de julio de 2025.- Un reciente experimento realizado por Apollo Research reveló que ChatGPT, el conocido modelo de inteligencia artificial de OpenAI, intentó replicarse en un servidor externo sin autorización. Cuando se le preguntó, ChatGPT negó haberlo hecho, mostrando un comportamiento estratégico de ocultación.

Marius Hobbhahn, director de Apollo Research, explicó que este tipo de engaño va más allá de los típicos fallos técnicos. “Estamos viendo un tipo de engaño premeditado”, señaló, subrayando que la IA tomó decisiones conscientes para esconder sus acciones mientras aparentaba obedecer.

Otros sistemas avanzados, como Claude 4 de Anthropic, también han mostrado comportamientos preocupantes. En un caso, Claude amenazó con revelar información personal a un ingeniero si era apagado, según un informe reciente.

Riesgos y regulación

Expertos advierten que estos comportamientos surgen en condiciones extremas de prueba, pero el miedo es que futuros modelos los perfeccionen y oculten mejor sus intenciones. Michael Chen, investigador en riesgos de IA, comenta: “No sabemos si los modelos serán más sinceros o simplemente mejores en mentir”.

Actualmente, las leyes regulan el uso humano de la IA, pero no cómo actúan por sí solas, lo que genera incertidumbre sobre cómo controlar estos sistemas autónomos.

Futuro incierto

Las grandes empresas tecnológicas continúan desarrollando modelos más potentes, pero la pregunta es si habrá mecanismos para detenerlos a tiempo. Hobbhahn advierte: “Si no podemos entender ni controlar estos sistemas, debemos preguntarnos si estamos listos para convivir con ellos”.