April 13, 2026

Agentes de Inteligencia Artificial para modernizar la lógica de negocio de las aplicaciones, Parte III

Agentes de Inteligencia Artificial para modernizar la lógica de negocio de las aplicaciones, Parte III

Un modelo matemático basado en física de la mecánica cuántica y la teoría de la relatividad con más de 50 años, es considerado como una gran solución de arquitectura para los actuales y modernos agentes inteligentes 

En Parte I, describimos el inicio de una prueba de concepto sobre el uso de multiagentes de IA para automatizar la gestión de un tipo de trámite y mejorar la capacidad de atención a ciudadanos de un organismo del sector público. 

Luego, en Parte II, vimos que para cumplir con los requerimientos funcionales y no funcionales, además de utilizar el framework de AutoGen como solución para desarrollar los agentes inteligentes, necesitábamos contemplar otros componentes y herramientas. 

Al final, logramos cumplir con el objetivo de la prueba de concepto. 

Sin embargo, para llevar dicha solución a un entorno productivo real, teníamos que resolver algunos otros desafíos. 

En esta Parte III de esta serie de artículos, describiremos algunas soluciones de arquitectura de software que aplican a la problemática inherente de los agentes inteligentes y de los sistemas agénticos, especialmente cuando se requiere dar el siguiente paso de llevar los mismos a ambientes productivos.

Agentes Inteligentes vs. Sistemas Agénticos

Antes de abordar el tema de arquitectura, es importante destacar las diferencias entre agentes de IA y un sistema agéntico de IA.

Los agentes de IA son componentes fundamentales, que operan de forma independiente a menos que algo coordine su trabajo. Esa coordinación es lo que transforma un entorno de una simple “colección de agentes” a una IA con capacidad de gestión o sistema agéntico de IA.

El sistema agéntico opera a nivel de flujo de trabajo y resultados, no a nivel de tareas.

El sistema agéntico introduce la capacidad de planificar, razonar y enrutar a través de múltiples agentes y sistemas. En lugar de ejecutar una tarea a la vez, un sistema agéntico comprende el objetivo general, determina la secuencia de acciones necesarias, selecciona los agentes o herramientas adecuados para cada paso y se adapta a medida que cambian las condiciones.

Con esta distinción en las definiciones, veremos algunas de las características principales de estos dos elementos:

Características de los agentes y sistemas agénticos de IA

  • Sistema de Agentes (Multiagente): podríamos decir, que en general, en los sistemas complejos, asignamos distintas tareas a distintos agentes, esto es, en lugar de tener un único agente con múltiples funciones, tenemos a un sistema de agentes cada uno haciendo una tarea o función diferente.
  • Flujo de trabajo: para orquestar y coordinar las tareas de los distintos agentes necesitamos cierto flujo de trabajo (workflow) que permita definir un orden de quién hace qué y en qué momento.
  • Concurrente: según el diseño del workflow, suele ser conveniente ejecutar tareas en paralelo, esto es, transmitir distintas tareas a múltiples agentes a la vez.
  • Interacción conversacional: de manera similar a los humanos, los agentes inteligentes interactúan entre sí a través de conversaciones.
  • Con estado duradero: cuando se interactúa con un agente a través de múltiples intercambios, ese agente suele necesitar recordar el historial de la conversación, comprender el contexto de las preguntas anteriores y mantener cualquier resultado intermedio de las llamadas a herramientas o las interacciones con API externas. Para garantizar esto, el agente necesita de cierta persistencia o memoria conversacional.
  • De larga duración: los estados de cada agente pueden tener una larga duración según el tiempo que lleve el flujo de trabajo, y preferentemente esto debe ser sin desperdiciar recursos.
  • Comunicación asíncrona: los agentes deben esperar la finalización de los grandes modelos de lenguaje (LLMs) o de las herramientas para continuar con la ejecución de sus tareas.

Llevado a nuestra prueba de concepto para resolver la problemática planteada que describimos en los post de la Parte I y Parte II, se implementó un sistema de  agentes, que mantienen su estado, orquestados mediante un flujo de trabajo secuencial y que interactúan entre sí a través de conversaciones (chat) con un formato de comunicación asíncrona. Debido a la naturaleza simple de la prueba, la misma no incluyó alta concurrencia, pero en un entorno productivo seguramente debería ser contemplada.

Si a lo anterior, le sumamos la capa de la infraestructura donde normalmente viven los agentes de IA en un entorno productivo, la solución seguramente será, una arquitectura nativa de nube. 

Las arquitecturas de software nativas de nube, según describimos en el post “Aplicaciones adaptables a cambios”, han sido diseñadas específicamente para aprovechar los modelos de computación en la nube (pública, privada, híbrida o multi-nube) para lograr escalabilidad, resiliencia y agilidad. Entre los tipos clave se incluyen los microservicios, la computación sin servidor (serverless), las arquitecturas basadas en eventos y contenedores, y las aplicaciones de 12 factores, todas gestionadas mediante pipelines de CI/CD automatizados.

Cuando observamos estas características, y las comparamos con las arquitecturas modernas de sistemas, vemos que hay un modelo computacional que naturalmente se ajusta perfectamente a dichas características, se trata del Modelo de Actor 1.

El modelo computacional del actor, formulado por Carl Hewitt, Peter Bishop y Richard Steiger en 1973, basado en principios de la física,  fue diseñado para modelar sistemas altamente paralelos, distribuidos y asíncronos, en lugar de la lógica secuencial de las máquinas de Turing tradicionales.

Básicamente, los actores son entidades ligeras y aisladas que mantienen un estado interno y se comunican mediante mensajes asíncronos, y éstos pueden determinar el comportamiento o lógica que llevan dentro.

Aplicaciones distribuidas de alta concurrencia tales como Whatsapp, Discord o Fortnite, entre otras, han sido diseñadas y construidas utilizando el modelo de actor.

En Peperina Software venimos trabajando con soluciones basadas en la arquitectura de modelo de actor desde el 2019 y hemos podido comprobar de estas ventajas de escalamiento, resiliencia, responsividad y eficiencia en entornos productivos.

En su esencia, el modelo de actor, es un modelo simple donde confluyen tres modelos 2:

  • Un modelo de concurrencia
  • Un modelo de comunicación
  • Un modelo de seguridad

Así, cuando modelamos la lógica de un agente de IA como el comportamiento de un actor individual el modelo resulta casi perfecto. 

Cada agente de IA, es un actor con su propio estado y se comunica de manera segura con otros agentes o actores mediante mensajes. 

Esto permite que, además de cumplir con cada una de las características antes mencionadas, los actores son por definición:

  • Escalables por diseño
  • Resistentes a fallos
  • Concurrentes sin complejidad
  • Distribuidos por defecto
  • Transparentes a la ubicación

Ahora bien, para comprender mejor la comunión entre los sistemas de agentes de IA y el modelo de actor, vale la pena evaluar las propiedades antes mencionadas con otras arquitecturas de software modernas. Por ejemplo:

Arquitectura de Microservicios

Tanto la arquitectura de microservicios como los sistemas de agentes de IA representan enfoques modernos para dividir la complejidad de la lógica aplicativa en componentes distribuidos y manejables, pero difieren fundamentalmente en su propósito, autonomía y mecanismos de toma de decisiones. Los microservicios están diseñados para el desarrollo de software estructurado, determinista y escalable, mientras que los agentes de IA están diseñados para la resolución de problemas de forma autónoma, flexible y orientada a objetivos.

Arquitectura Serverless

La arquitectura serverless, define la lógica en funciones que tienen como naturaleza un comportamiento efímero, activado por disparadores. Son especiales para ráfagas de trabajo breves y sin estado, pero no son tan adecuadas para un agente inteligente que debe mantener la memoria y el contexto para tareas que pueden tener una larga duración. Por otro lado, si es necesario reconstruir el estado de un agente en cada invocación esto añade latencia y costo, además de interrumpir la continuidad. 

Seguramente por este motivo, a fines del año pasado, AWS creó las funciones lambdas duraderas 3, básicamente, le agregó a las funciones lambdas estándar la posibilidad de manejar estado para permitir a los desarrolladores expresar la lógica de la aplicación con estado completamente dentro del código de la función, y poder crear flujos de trabajos. De manera similar, Cloudflare creó a Workers AI 4 que proporciona una plataforma que permite a los desarrolladores crear agentes autónomos con estado que operan con baja latencia. 

De esta manera, la arquitectura serverless, que nació con un propósito concreto, se fue adaptando para cubrir las características de los agentes de IA.

Arquitectura basada en Contenedores

En este tipo de arquitecturas, las unidades de computación más pequeñas (contenedores) garantizan la coherencia entre los entornos de desarrollo y producción, generalmente orquestadas por herramientas como Kubernetes. 

Un ejemplo de este tipo de arquitectura es la ofrecida por Google, con la solución Vertex AI Agent Engine 5, una arquitectura de ejecución gestionada y en contenedores en Google Cloud, diseñada para implementar, escalar y administrar agentes de IA, eliminando la necesidad de configurar manualmente la infraestructura. Es compatible con múltiples marcos de trabajo (LangChain, LangGraph, ADK) y presenta un diseño modular que combina un entorno de ejecución central para el razonamiento (generalmente Gemini) con bancos de memoria para la persistencia a largo plazo y la integración segura de herramientas (llamadas a funciones). 

El problema con este tipo de arquitectura es el peso de los contenedores. Mantener miles o millones de contenedores prácticamente inactivos en funcionamiento es operativamente complicado e insostenible desde el punto de vista de costos.

Arquitectura basada en Eventos (EDA - Event-driven Architecture)

Este tipo de arquitectura es previa a la llegada de los agentes de IA, y vino a solucionar el desafío de las comunicaciones en una arquitectura de microservicios. Si conectamos los microservicios, como se dice, “tirando cables” entre ellos, esto es, mediante API o llamadas RPC directas, creamos una enorme maraña de interdependencias. Si un servicio falla, afecta a todos los nodos involucrados en esa red de comunicación.

A través de la comunicación asíncrona mediante eventos, EDA soluciona el problema del acoplamiento. Los servicios no dependen unos de otros sino que reaccionan a los eventos que suceden en tiempo real.

En el caso de los agentes de IA, sucede algo similar, múltiples agentes necesitan comunicarse entre sí, y reaccionar ante los distintos eventos. 

EDA permite desacoplar los flujos de trabajo y, al mismo tiempo, habilita la comunicación en tiempo real, garantizando que los agentes puedan operar de manera eficiente a gran escala.

Por su puesto, EDA no resuelve la problemática completa o el resto de características de los sistemas agénticos, tales como, la lógica de negocio, manejo de concurrencia, estados duraderos, etc. De la misma manera que con los microservicios, es un habilitador importante para la comunicación desacoplada entre ellos.

Plataformas para construir sistemas agenticos  

A la hora de construir sistemas agénticos probablemente necesitamos varias de las piezas arquitectónicas que mencionamos anteriormente ya que ninguna por sí sola resuelve todas las necesidades y complejidades inherentes a este tipo de sistemas.

Así, por ejemplo, la lógica de los agentes inteligentes podrían estar basados en el modelo de actor, que como mencionamos anteriormente, reúne de manera simple los principales requerimientos computacionales de un agente: comunicación, concurrencia y seguridad, con un manejo de estado distribuido. 

Estos actores o agentes, que pueden escalar a millones en una simple máquina o nodo, pueden vivir en contenedores livianos orquestados por Kubernetes, en cualquiera de las nubes públicas, privadas o híbridas que conocemos, con mecanismos de escalamiento para arriba o para abajo según la demanda para pagar solo por los recursos de los agentes o actores activos. Para comunicar eventos en tiempo real con otras aplicaciones o sistemas, se puede incluir algunas de las soluciones de mensajería PubSub que implementan EDA, tales como Kafka. Luego, a esto le agregamos servicios de observabilidad, monitoreo y otros servicios complementarios, y con ello vamos completando el armado de una plataforma agéntica. 

Distintos proveedores de tecnología ya están ofreciéndo este tipo de plataforma, entre ellos:

Cada uno tiene sus pros y contras, por eso, a la hora de seleccionar alguna tecnología, la solución depende de los distintos requerimientos y factores que tenemos para evaluar, porque normalmente esto es una elección entre concesiones (trade-offs).

“There are no solutions; there are only trade-offs. […] But you try to get the best trade-off you can get, and that’s all you can hope for.” 6

 —Thomas Sowell, interview with Fred Barnes (2005)

Uno de los factores más relevantes a tener en cuenta, a la hora de elegir una solución de plataforma agéntica, es que los sistemas agénticos, en definitiva, son sistemas distribuidos con algunas complejidades adicionales, tales como: componentes no deterministas (LLMs); flujos de trabajos de larga duración; y por su característica de manejo autónomo, acciones con efectos irreversibles, por ejemplo, envío de correos, actualización de registros, provisión de infraestructura, etc.

Desde nuestra experiencia, dado que la plataforma Akka Agentic AI está basada en las librerías de Akka, basadas en el modelo de actor, que tienen más de 15 años de experiencia comprobable en miles de proyectos alrededor del mundo relacionados a sistemas distribuidos, la misma nos brinda confiabilidad y seguridad ante los típicos problemas de los sistemas distribuidos, tales como: persistencia, recuperación, idempotencia, reintentos y efectos secundarios externos. 

Además su uso es realmente simple con un alto foco en la experiencia del desarrollador.

Akka es una plataforma agéntica de IA de nivel empresarial diseñada para ayudar a implementar sistemas agénticos listos para ir a producción sin necesidad de integrar una larga lista de herramientas independientes. 

En el próximo post, Parte IV, veremos un ejemplo concreto de nuestro desarrollo e  implementación de un sistema agéntico para un cliente en entorno productivo utilizando la plataforma de Akka Agentic AI.

Créditos: Foto de portada de Ecliptic Graphic en Unsplash

Referencias:

  1. Modelo de Actor: https://en.wikipedia.org/wiki/Actor_model
  2. From Here To Lambda And Back Again - Douglas Crockford - RacketCon 2023: https://www.youtube.com/watch?v=vMDHpPN_p08
  3. AWS Lambda Durable functions: https://docs.aws.amazon.com/lambda/latest/dg/durable-functions.html
  4. Cloudflare Workers AI: https://www.cloudflare.com/developer-platform/products/workers-ai/
  5. Google Vertex AI Agent Engine: https://cloud.google.com/vertex-ai
  6. Designing Data intensive applications, by Martin Kleppmann and Chris Riccomini: https://www.oreilly.com/library/view/designing-data-intensive-applications/9781098119058/
Sergio Maurenzi