Tecnología & Cultura Digital

¿Ha caído en un engaño de la IA? No es el único y eso es un problema, según expertos

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

FOTO BlackJack3D / Getty Images/iStockphoto

2024-05-11

POR AFP

Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.

Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.

Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.

OpenAI planea anunciar su buscador para competir con Google

"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".

A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.

Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.

- Juego de dominación mundial -

La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.

Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.

Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".

Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.

En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.

Financial Times y OpenAI firman acuerdo sobre contenidos

En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".

"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.

- ¿Eres un robot? -

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".

Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.

A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.

En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.

Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.

A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".

afp

Agencia de noticias

AFP es una de las tres agencias de noticias más importantes del mundo. Su misión es garantizar una cobertura completa, imparcial y verificada.

Inteligencia

Tecnología

Inteligencia artificial

Sistemas

Alemania

Francia

Inglaterra

En Portada

Las ofertas laborales que piden experiencia con herramientas generativas se han multiplicado en los últimos dos años. Foto de iStock

Empresas & Management

Lo + Visto

ULTIMA EDICIÓN

Edición E&N 307: Big Bang del sistema energético regional

12 ejemplares al año por $75

¿Ha caído en un engaño de la IA? No es el único y eso es un problema, según expertos

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

- Juego de dominación mundial -

- ¿Eres un robot? -

Las empresas fomentan el uso de IA y duplican la inversión en capacitaciones, según reporte

Economía estadounidense seguirá siendo sólida, vaticina agencia S&P

Economías globales claves mejoran, pero persisten riesgos que frenarían el avance

Intel recibirá inyección de US$2.000 millones del japonés Softbank

¿Cómo puedo marca la diferencia como líder? (Transformación)

Innovación financiera: BAC potencia la eficiencia y rentabilidad del capital operativo empresarial

Cinta Azul: Compromiso con el sabor, la calidad y el bienestar de los ticos

Delicia: Experiencias de sabor que trascienden fronteras

Sustainable Design Center: Una nueva visión de diseño sostenible en El Salvador

Costa Rica, país clave en plan de crecimiento de Kumon en Centroamérica

Inseguridad y bloqueos en Guatemala afectan la tasa de emprendimiento, según estudio

¿Ha caído en un engaño de la IA? No es el único y eso es un problema, según expertos

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

- Juego de dominación mundial -

- ¿Eres un robot? -

Estudio: Los trabajadores están utilizando en secreto la IA por temor a parecer reemplazables

El 80 % de los líderes están preocupados por la privacidad y la seguridad de los datos

Elon Musk predice que la IA superará al humano más inteligente el próximo año

Facebook e Instagram no eliminarán contenido generado por IA, pero así será marcado

Las empresas fomentan el uso de IA y duplican la inversión en capacitaciones, según reporte

Economía estadounidense seguirá siendo sólida, vaticina agencia S&P

Economías globales claves mejoran, pero persisten riesgos que frenarían el avance

Intel recibirá inyección de US$2.000 millones del japonés Softbank

¿Cómo puedo marca la diferencia como líder? (Transformación)

Innovación financiera: BAC potencia la eficiencia y rentabilidad del capital operativo empresarial

Cinta Azul: Compromiso con el sabor, la calidad y el bienestar de los ticos

Delicia: Experiencias de sabor que trascienden fronteras

Sustainable Design Center: Una nueva visión de diseño sostenible en El Salvador

Costa Rica, país clave en plan de crecimiento de Kumon en Centroamérica

Inseguridad y bloqueos en Guatemala afectan la tasa de emprendimiento, según estudio