Conecta con nosotros

Opinión

La IA preparada para agentes necesita una estrategia preparada para los tokens

Publicado el

La IA preparada para agentes necesita una estrategia preparada para los tokens

La TI moderna está impulsada tanto por decisiones económicas como por criterios técnicos. Los costes de hardware, los servicios cloud, el almacenamiento y otros factores influyen en cómo los CIO y los responsables de TI presupuestan y despliegan sus estrategias. Y ahora, con la IA, tenemos otra decisión que afecta a varias áreas: la economía de los tokens, es decir, cómo nuestras estrategias de IA absorben los costes cambiantes de los modelos subyacentes.

Hoy en día, la mayor parte de la IA empresarial depende del uso de APIs de modelos de vanguardia y del pago por los tokens consumidos y generados. Aunque este es un punto de partida sencillo, las cifras están cambiando. El consumo de tokens se está disparando porque los nuevos modelos de razonamiento suelen consumir entre 10 y 20 veces más tokens que los modelos estándar solo por “pensar” en un problema.

A medida que entramos en la era de los agentes de IA, que iteran, usan herramientas y encadenan tareas, ese consumo se multiplica de forma exponencial. Para prosperar en esta nueva economía, las organizaciones deben evolucionar de consumir tokens a producirlos. Eso significa que el éxito pasa por controlar la infraestructura de inferencia, enrutar las consultas de los modelos al punto de acceso más rentable e incluso ejecutar modelos propios, alojados internamente, optimizados para las necesidades específicas del negocio.

En Red Hat, entendemos este recorrido como un camino de “Metal to Agents”. Requiere un stack abierto e integrado de extremo a extremo, en el que cada capa, desde los aceleradores físicos de IA hasta los propios agentes, esté conectada y diseñada con la seguridad del sistema como prioridad.

Esta base debe dar soporte a un ecosistema diverso de hardware, incluidos NVIDIA, AMD e Intel, así como silicio personalizado de los principales proveedores cloud. Sobre esa capa de hardware se sitúa la infraestructura de IA, empezando por entornos de Linux y Kubernetes centrados en la seguridad, que ofrecen una fiabilidad constante tanto en un rack de servidores como en sistemas en órbita.

El corazón de un sistema de IA es la inferencia, que es el factor decisivo para escalar las estrategias de IA. El liderazgo de Red Hat en proyectos como vLLM y nuestro trabajo en inferencia distribuida con llm-d significa que contamos con una experiencia única para optimizar la ejecución de modelos y el uso de GPU a nivel de software.

En aplicaciones reales, ya hemos visto cómo estas tecnologías reducen en 10 veces el tiempo hasta obtener el primer token y triplican la calidad de la respuesta. Sin control sobre el rendimiento y el coste al mismo tiempo, las organizaciones acabarán viéndose obligadas a hacer concesiones que ni los equipos financieros ni los clientes aceptarán.

Los modelos de IA, sin embargo, no conocen qué diferencia a una empresa de las demás si no se les enseña. Por eso la generación aumentada por recuperación, o RAG, y el fine-tuning han convertido la IA en un verdadero factor diferenciador. Las empresas pueden conectar los modelos con su documentación interna y con el historial de sus clientes, creando sistemas que realmente entienden la experiencia y el conocimiento propio de su negocio.

Todo esto ya es el mínimo imprescindible. La frontera actual son los servicios para agentes. Los agentes ya no son experimentos; son el núcleo de la estrategia empresarial moderna. Pero plantean el reto de “Bring Your Own Agent”, en el que desarrolladores, científicos de datos y equipos de marketing utilizan herramientas distintas, desde LangChain hasta OpenClaw.

Una estrategia eficaz debe dar soporte a esa diversidad sin perder un control riguroso de TI. Eso significa dotar a cada agente de una identidad verificada, gestionar su ciclo de vida con control de versiones y posibilidad de volver atrás, y apoyarse en estándares emergentes como MCP Services para conectar agentes con herramientas y datos sin crear brechas de seguridad.

Vemos esta visión en la práctica con organizaciones como BNP Paribas, que ha generado casi 600 millones de dólares de valor al industrializar 1.000 casos de uso de IA sobre una plataforma unificada. Han convertido el aprovisionamiento de GPU, antes un cuello de botella de varias semanas, en un servicio que se presta en minutos, demostrando que la velocidad y la soberanía digital pueden coexistir.

Del mismo modo, el Marshall Space Flight Center de la NASA ha adoptado estas plataformas unificadas para trasladar miles de cargas de trabajo heredadas a entornos contenerizados, reduciendo los tiempos de despliegue de días a minutos para dar soporte a operaciones críticas en el espacio.

Estos clientes están transformando las estrategias de IA, que dejan de centrarse solo en la eficiencia y el ahorro de costes para convertirse en motores de crecimiento. Sí, queremos ser más eficientes con la IA, pero quedarse sólo ahí es una visión reduccionista. El siguiente salto de la IA es alinearla con el crecimiento; no solo mejorar el resultado neto, sino también impulsar los ingresos.

En última instancia, el objetivo de una estrategia empresarial de IA debería ser que, cuando el mercado vuelva a moverse, y lo hará, la empresa sea dueña de la plataforma que sostiene lo que realmente importa. No necesita elegir forzosamente entre la potencia de los modelos de vanguardia y la seguridad que aportan el control y la gobernanza.

Si apuesta por un stack abierto e integrado, puede tener ambas cosas. Puede ofrecer a sus equipos el acceso a los modelos que necesitan al mismo tiempo que mantiene una postura de seguridad que su equipo de TI pueda defender de verdad. Esa es la única forma de construir una estrategia que juegue a su favor, convirtiendo la velocidad de la disrupción en una ventaja competitiva a largo plazo.

Por Chris WrightCTO y Vicepresidente senior, Global Engineering, Red Hat

El equipo de profesionales de MCPRO se encarga de publicar diariamente la información que interesa al sector profesional TI.

Lo más leído