Noticias

Cómo los asistentes de IA producen código malicioso

Publicado el

26 mayo, 2025

por

Los profesionales del marketing promocionan los asistentes de IA como herramientas esenciales para los ingenieros de software. La plataforma de desarrollo GitLab, por ejemplo, afirma que su chatbot Duo puede generar una lista de tareas al instante, eliminando así la carga de semanas de compromisos. Lo que desde el marketing no se menciona es que estas herramientas son, por naturaleza, si no por defecto, fácilmente manipulables por actores maliciosos para que realicen acciones hostiles contra sus usuarios.

Investigadores de la firma de seguridad Legit han mostrado la facilidad para provocar un ciberataque (real, pero en prueba de concepto) induciendo al GitLab Duo a insertar código malicioso en un script que se le había ordenado escribir. El ataque también podría extraer código privado y datos confidenciales, como detalles de vulnerabilidades de día cero. Y casi cualquiera puede hacerlo: solo se requiere que el usuario indique al chatbot que interactúe con una solicitud de fusión o contenido similar de una fuente externa.

¿Código seguro de los asistentes de IA? Cuidado

No son pocos los investigadores que han alertado del ‘lado oscuro de la IA’ y el impacto que las herramientas de inteligencia artificial ya están teniendo en la ciberseguridad mundial, intensificando las amenazas que llegan de los ataques más peligrosos como el ransomware, el phishing, en robos de identidad y en general como ayuda en la generación de malware.

¿Y en tareas de desarrollo? La respuesta rápida es que, ahora mismo, no se puede confiar en que los asistentes de IA produzcan código seguro siempre y cuando no esté supervisado y controlado por humanos. El ataque de prueba a GitLab Duo es un ejemplo.

El mecanismo para desencadenar los ataques es la inyección de indicaciones. Entre las formas más comunes de exploits para chatbots, la inyección de indicaciones se integra en el contenido con el que se le pide que trabaje, como un correo electrónico que debe responder, un calendario que debe consultar o una página web que debe resumir. Los grandes asistentes basados ??en modelos de lenguaje están tan ansiosos por seguir instrucciones que aceptan órdenes de prácticamente cualquier lugar, incluso de fuentes que pueden ser controladas por actores maliciosos.

GitLab Duo: engañar a la IA es muy sencillo

Los ataques dirigidos a Duo provenían de diversos recursos de uso común por parte de los desarrolladores. Algunos ejemplos incluyen solicitudes de fusión, confirmaciones, descripciones y comentarios de errores, y código fuente. Los investigadores demostraron cómo las instrucciones integradas en estas fuentes pueden desviar la atención de Duo.

Esta vulnerabilidad pone de manifiesto la doble naturaleza de los asistentes de IA como GitLab Duo: al integrarse profundamente en los flujos de trabajo de desarrollo, no solo heredan el contexto, sino también el riesgo. «Al integrar instrucciones ocultas en contenido de proyecto aparentemente inofensivos, pudimos manipular el comportamiento de Duo, extraer código fuente privado y demostrar cómo las respuestas de la IA pueden aprovecharse para obtener resultados no deseados y perjudiciales», asegura el investigador de Legit.

Las URL maliciosas generadas en la respuesta se pueden seleccionar, lo que significa que el usuario solo tiene que hacer clic en una para acceder a un sitio malicioso. El ataque utiliza lenguaje Markdown, que permite a los sitios web representar texto sin formato de forma sencilla. Entre otras cosas, Markdown permite a los usuarios añadir elementos de formato como encabezados, listas y enlaces sin necesidad de etiquetas HTML.

El ataque también puede funcionar con las etiquetas HTML <img> y <form>. Esto se debe a que Duo analiza el código Markdown de forma asíncrona, lo que significa que comienza a renderizar la salida línea por línea, en tiempo real, en lugar de esperar a que se complete toda la respuesta y enviarla de una vez. Como resultado, las etiquetas HTML que normalmente se eliminarían de la respuesta se tratan como salida web activa en las respuestas de Duo. La posibilidad de forzar que las respuestas de Duo actuasen sobre HTML activo abrió nuevas vías de ataque.

Legit reportó la investigación a GitLab, que respondió eliminando la capacidad de Duo para mostrar etiquetas inseguras como <img> y <form> cuando apuntan a dominios distintos de gitlab.com. Pero, ¿qué hay detrás de todo esto? «Cualquier sistema que permita a los asistentes de IA acceder a contenido controlado por el usuario debe tratar esa información como no confiable y potencialmente maliciosa. La IA contextual es potente, pero sin las protecciones adecuadas, puede convertirse fácilmente en un punto de exposición», recalcan desde Legit.

Categorías relacionadas:Ciberseguridad desarrollo Destacados GitLab IA

A continuación

Los científicos prometen chips con velocidad de Petahercios usando transistores cuánticos

No te pierdas

Seis proveedores europeos más se unen a la iniciativa de nube soberana Virt8ra

Jose Montes

Colaboro en medios profesionales y de consumo de TPNET: MCPRO, MuySeguridad, MuyCanal y MuyComputer

A FondoHace 6 días

SubQ: la revolución que promete romper el coste de la IA empresarial

La Ley de la IA de la Unión Europea entra en vigor el 1 de agosto

NoticiasHace 5 días

Acuerdo en la UE para modificar y retrasar la aplicación de medidas de la Ley de IA

PayPal recortará su plantilla un 20% de aquí a tres años

NoticiasHace 6 días

PayPal recortará su plantilla un 20% de aquí a tres años

Siguen los despidos por culpa de la IA: Cloudflare recortará el 20% de su plantilla y DeepL el 25%

NoticiasHace 5 días

Siguen los despidos por culpa de la IA: Cloudflare recortará el 20% de su plantilla y DeepL el 25%

MuyComputerPRO

Cómo los asistentes de IA producen código malicioso

Noticias

Cómo los asistentes de IA producen código malicioso

¿Código seguro de los asistentes de IA? Cuidado

GitLab Duo: engañar a la IA es muy sencillo

Esferize y EnGenius Networks se alían para facilitar a los hoteles la modernización de su infraestructura de conectividad

SAP presenta la Empresa Autónoma en Sapphire 2026

Red Hat presenta en su Summit anual su propuesta de IA empresarial, agentes y soberanía digital

Google presenta su nueva plataforma de IA, Gemini Intelligence

Liderazgo en IA empresarial. El caso Mistral vs OpenAI

AMD amplía los Ryzen PRO 9000 con los primeros procesadores comerciales X3D

«El accesorio ha dejado de ser el relleno del pedido para convertirse en una categoría estratégica»

“Innovación y estabilidad no son fuerzas opuestas cuando el modelo está bien diseñado”

IONOS lanza un servidor GPU de alto rendimiento para IA con tecnología NVIDIA Blackwell

Ciberataque a Inditex: atacantes consiguen acceso a sus bases de datos

La IA en 2026: más capacidad y alcance, ya sin brecha entre los modelos de EEUU y China

«El hospital en casa no es el futuro, es una realidad que el sistema no puede ignorar»

Esferize y EnGenius Networks se alían para facilitar a los hoteles la modernización de su infraestructura de conectividad

SaaS frente a la IA: los agentes pagarán licencias de software igual que los humanos

IONOS lanza un servidor GPU de alto rendimiento para IA con tecnología NVIDIA Blackwell

HP TPM Guard, una solución hardware para proteger ordenadores de ataques de acceso físico

«La unión de máquina y humano va a vencer sesgos que arrastramos históricamente»

Cloudflare amplía Agent Cloud para facilitar la creación, implementación y escalado de agentes

Lo más leído

MuyComputerPRO

Cómo los asistentes de IA producen código malicioso

¿Código seguro de los asistentes de IA? Cuidado

GitLab Duo: engañar a la IA es muy sencillo

También te puede gustar

Esferize y EnGenius Networks se alían para facilitar a los hoteles la modernización de su infraestructura de conectividad

SAP presenta la Empresa Autónoma en Sapphire 2026

Red Hat presenta en su Summit anual su propuesta de IA empresarial, agentes y soberanía digital

Google presenta su nueva plataforma de IA, Gemini Intelligence

Liderazgo en IA empresarial. El caso Mistral vs OpenAI

AMD amplía los Ryzen PRO 9000 con los primeros procesadores comerciales X3D

«El accesorio ha dejado de ser el relleno del pedido para convertirse en una categoría estratégica»

“Innovación y estabilidad no son fuerzas opuestas cuando el modelo está bien diseñado”

IONOS lanza un servidor GPU de alto rendimiento para IA con tecnología NVIDIA Blackwell

Ciberataque a Inditex: atacantes consiguen acceso a sus bases de datos

La IA en 2026: más capacidad y alcance, ya sin brecha entre los modelos de EEUU y China

«El hospital en casa no es el futuro, es una realidad que el sistema no puede ignorar»

Esferize y EnGenius Networks se alían para facilitar a los hoteles la modernización de su infraestructura de conectividad

SaaS frente a la IA: los agentes pagarán licencias de software igual que los humanos

IONOS lanza un servidor GPU de alto rendimiento para IA con tecnología NVIDIA Blackwell

HP TPM Guard, una solución hardware para proteger ordenadores de ataques de acceso físico

«La unión de máquina y humano va a vencer sesgos que arrastramos históricamente»

Cloudflare amplía Agent Cloud para facilitar la creación, implementación y escalado de agentes

Lo más leído