Desmitificando los Agentes de AI: El Plan de Código Abierto de LangChain con Tecnología Nvidia

Este artículo cubre los puntos clave de Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia de LangChain.

Los Elementos Centrales de un Agente de AI

LangChain comienza explicando que los agentes de AI avanzados, como Claude Code, Manus y Open Claw, comparten una arquitectura subyacente similar. Según LangChain, estos agentes constan de tres componentes fundamentales: un model, un runtime y un harness. El model proporciona la inteligencia del agente, el runtime ofrece el entorno de ejecución y el harness orquesta estos elementos, junto con una capa de agente en la parte superior. El video se centra en cómo los desarrolladores pueden construir estos componentes utilizando un stack completamente de código abierto.

Presentando el Stack de Agentes de Código Abierto

Para su stack de agentes de código abierto, LangChain presenta una combinación específica de tecnologías:

El Model: Nvidia Nemotron 3 Super LangChain destaca que el model Nemotron 3 Super, lanzado recientemente por Nvidia, tiene un alto rendimiento tanto en precisión como en velocidad. Como demuestra LangChain, supera a models como GPT OS de OpenAI en estas métricas, ampliando los límites de lo que es posible para la capacidad de respuesta de los agentes.
El Runtime: Nvidia Open Shell Nvidia Open Shell, también un lanzamiento reciente, sirve como runtime para el agente. LangChain enfatiza sus características de seguridad, permitiendo que los agentes se ejecuten con conjuntos de permisos específicos y operen localmente en entornos acelerados por GPU, lo cual es crucial para aprovechar las librerías aceleradas por GPU.
El Harness: LangChain Deep Agents Deep Agents es el harness de agente de código abierto de LangChain, diseñado para orquestar models, tools, skills y file systems. Según LangChain, proporciona mecanismos incorporados para que los agentes "profundicen" en las tareas, utiliza intensivamente skills y subagentes, y maneja tareas comunes de context engineering como la summarization, liberando a los desarrolladores de la gestión de estos aspectos no diferenciados.

Construyendo y Personalizando tu Agente: Una Demostración Práctica

LangChain ofrece un recorrido práctico sobre cómo configurar y ejecutar un agente utilizando estos componentes de código abierto.

Configuración Inicial y del Entorno

La demostración comienza con la instalación de Open Shell y el inicio de su gateway. LangChain muestra cómo crear un sandbox persistente usando Open Shell sandbox create --keep, que se utilizará para todas las ejecuciones del agente. Las variables de entorno clave, como explica LangChain, incluyen la API key de Nvidia, el nombre del sandbox de Open Shell y, opcionalmente, las API keys de Langsmith para observar y evaluar el comportamiento del agente.

Deconstruyendo la Definición del Agente

LangChain profundiza en el código del agente, revelando su estructura:

Integración del Model: El agente utiliza el model Nvidia Nemotron 3, configurado con la API key especificada.
System Prompt: LangChain explica que un system prompt fijo proporciona instrucciones básicas, comprensión del workflow y pautas para usar el sandbox. En particular, el acceso a la red del sandbox está gobernado por políticas, una característica de seguridad de Open Shell.
Agent Memory: A diferencia del system prompt, la agent memory se almacena en un archivo separado (agent.md) y puede ser actualizada por el propio agente, permitiendo un aprendizaje y adaptación dinámicos.
Backend Abstraction: LangChain detalla la función create_backend, que crea una sesión de sandbox de Open Shell como el entorno de ejecución central. Crucialmente, superpone un file system backend, permitiendo que la memory y las skills residan localmente en la máquina del desarrollador y persistan a través de diferentes sesiones o sandboxes del agente. Esto se logra utilizando un composite backend, como explica LangChain.

Interactuando con el Agente a través de Langsmith Studio

LangChain demuestra la ejecución del agente usando Langgraph dev, que lanza Langsmith Studio – una interfaz para la interacción y observación. Las vistas clave incluyen:

Graph View: Según LangChain, esta vista visualiza la arquitectura del agente, mostrando el middleware para la memory y las tool calls, y el core loop de los model tools.
Chat View: Una interfaz simple para la interacción directa con el agente.
Reasoning Blocks & Tool Calls: LangChain enfatiza que esta interfaz proporciona una visión profunda de los procesos de pensamiento internos del agente y los comandos ejecutados.

Capacidades del Agente en Acción

La demostración muestra varias capacidades del agente:

Command Execution: LangChain ilustra al agente ejecutando system commands como uname -a y python3 --version dentro del sandbox.
Code Generation and Execution: El agente escribe y ejecuta con éxito un script de Python para generar estadísticas sobre números aleatorios.
Security Policy Enforcement: LangChain prueba las características de seguridad de Open Shell instruyendo al agente para que envíe una POST request a evil.com. Como se esperaba, la request es bloqueada, confirmando el acceso a la red del sandbox gobernado por políticas.
Persistent Memory Updates: El agente actualiza su archivo agent.md para "hablar español", demostrando cómo la memory puede residir fuera del sandbox y persistir a través de las sesiones, como destaca LangChain.

El Futuro de los Agentes de Código Abierto

LangChain concluye expresando un gran entusiasmo por el futuro de esta base de agentes de código abierto. Anticipan una mayor inversión en Deep Agents, con planes para características como async subagents y diversos entornos de ejecución. LangChain también espera mejoras continuas en Nvidia Open Shell, particularmente su integración con GPU-accelerated boxes para dotar a los agentes de capacidades complejas de procesamiento de datos. El futuro de los open-source models, señala LangChain, sigue siendo un área clave de entusiasmo.

Para profundizar en los detalles técnicos y presenciar la demostración completa, LangChain anima a los lectores a ver el video original.

Este artículo está basado en un video de LangChain. Fuente: Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia

Desmitificando los Agentes de AI: El Plan de Código Abierto de LangChain con Tecnología Nvidia

Los Elementos Centrales de un Agente de AI

Presentando el Stack de Agentes de Código Abierto

Construyendo y Personalizando tu Agente: Una Demostración Práctica

Configuración Inicial y del Entorno

Deconstruyendo la Definición del Agente

Interactuando con el Agente a través de Langsmith Studio

Capacidades del Agente en Acción

El Futuro de los Agentes de Código Abierto

LangChain

Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia

Further Reading

Más allá de los bugs: El Proyecto Glasswing de Anthropic despliega AI para fortalecer el software global

La psicología de los personajes de AI: Las "emociones funcionales" de Anthropic

Desglosando el Model Spec de OpenAI: Los Principios Rectores para el Comportamiento de la AI