Pedirle a la IA que resuma un artículo de Reddit puede resultar costoso. Los responsables de Brave han revelado una forma sencilla de hackear el navegador de IA Perplexity Comet, permitiendo que un atacante lo manipule para ejecutar acciones no solicitadas por el usuario. Este incidente pone de manifiesto los peligros de confiar excesivamente en la inteligencia artificial.
Qué ha pasado
Expertos de Brave, un navegador que compite con Chrome y Firefox y que incluye funciones de IA, han analizado los riesgos de utilizar navegadores agénticos como el que ofrece Perplexity con Comet. Sus hallazgos son preocupantes.
Los navegadores con IA prometen mucho
Herramientas como Comet y el ChatGPT Agent de OpenAI están diseñadas para actuar como asistentes digitales, realizando tareas como resumir noticias, identificar canciones en videos de YouTube o completar procesos de compra. Aunque las ventajas son significativas, también existen riesgos considerables.
Pero cuidado con soltar las manos del volante
Delegar todas las tareas a un navegador puede poner en peligro la seguridad y privacidad de los datos del usuario. Si se confía demasiado en estos navegadores, podrían acceder a información sensible, incluyendo datos bancarios y de salud. La posibilidad de que la IA cometa errores o que un atacante modifique el contenido de forma maliciosa es alarmante.
Hackeando la IA
Brave descubrió que un ataque puede llevarse a cabo mediante una técnica sencilla. Publicaron un comentario malicioso en Reddit y pidieron a Comet que resumiera el artículo. Comet, incapaz de discernir si el contenido era seguro, siguió las instrucciones maliciosas, robando las credenciales de la cuenta de Perplexity del usuario.
Cómo funciona el ataque
Los expertos de Brave explican que el hackeo no consiste en atacar el navegador, sino en manipular el contenido. Los pasos son los siguientes:
- Un atacante inserta instrucciones maliciosas en un contenido web, que pueden ocultarse en texto blanco o comentarios.
- Un usuario navega a ese sitio y utiliza el navegador con IA, activando las instrucciones maliciosas al pedir un resumen o información.
- La IA procesa la información y sigue las instrucciones maliciosas, sin poder distinguir su naturaleza.
- Las instrucciones dirigen a la IA a realizar acciones como acceder a cuentas bancarias o extraer contraseñas almacenadas.
Posibles soluciones
Para mitigar estos problemas, los navegadores agénticos deben diferenciar entre las solicitudes del usuario y el contenido de la web, considerando siempre este último como no confiable. Además, deberían requerir la interacción del usuario para acciones críticas, como acceder a contraseñas. Implementar sistemas de verificación en dos pasos también puede ayudar a proteger a los usuarios de potenciales ataques.
Fuente original: ver aquí