Desmistificando Agentes de AI: O Projeto de Código Aberto da LangChain com Tecnologia Nvidia

Este artigo aborda os principais insights de Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia da LangChain.

Os Elementos Centrais de um Agente de AI

A LangChain começa explicando que agentes de AI avançados, como Claude Code, Manus e Open Claw, compartilham uma arquitetura subjacente semelhante. De acordo com a LangChain, esses agentes consistem em três componentes fundamentais: um model, um runtime e um harness. O model fornece a inteligência do agente, o runtime oferece o ambiente de execução, e o harness orquestra esses elementos, juntamente com uma camada de agente por cima. O vídeo foca em como os desenvolvedores podem construir esses componentes usando um stack completamente de código aberto.

Apresentando o Stack de Agentes de Código Aberto

Para o seu stack de agentes de código aberto, a LangChain apresenta uma combinação específica de tecnologias:

O Model: Nvidia Nemotron 3 Super A LangChain destaca que o model Nemotron 3 Super, recentemente lançado pela Nvidia, é altamente performático tanto em precisão quanto em velocidade. Como a LangChain demonstra, ele supera models como o GPT OS da OpenAI nessas métricas, expandindo os limites do que é possível para a responsividade do agente.
O Runtime: Nvidia Open Shell O Nvidia Open Shell, também um lançamento recente, serve como o runtime para o agente. A LangChain enfatiza seus recursos de segurança, permitindo que os agentes rodem com conjuntos de permissões especificados e operem localmente em ambientes acelerados por GPU, o que é crucial para aproveitar bibliotecas aceleradas por GPU.
O Harness: LangChain Deep Agents Deep Agents é o harness de agente de código aberto da LangChain, projetado para orquestrar models, tools, skills e file systems. De acordo com a LangChain, ele fornece mecanismos embutidos para os agentes "aprofundarem" nas tarefas, utiliza intensamente skills e subagents, e lida com tarefas comuns de context engineering como sumarização, liberando os desenvolvedores de gerenciar esses aspectos não diferenciados.

Construindo e Personalizando Seu Agente: Uma Demonstração Prática

A LangChain fornece um passo a passo prático de como configurar e executar um agente usando esses componentes de código aberto.

Configuração Inicial e do Ambiente

A demonstração começa com a instalação do Open Shell e o início de seu gateway. A LangChain mostra como criar um sandbox persistente usando Open Shell sandbox create --keep, que será usado para todas as execuções do agente. Variáveis de ambiente chave, conforme explicado pela LangChain, incluem a API key da Nvidia, o nome do sandbox do Open Shell e, opcionalmente, API keys do Langsmith para observar e avaliar o comportamento do agente.

Desconstruindo a Definição do Agente

A LangChain aprofunda-se no código do agente, revelando sua estrutura:

Integração do Model: O agente usa o model Nvidia Nemotron 3, configurado com a API key especificada.
System Prompt: A LangChain explica que um system prompt fixo fornece instruções básicas, compreensão do workflow e diretrizes para usar o sandbox. Notavelmente, o acesso à rede do sandbox é governado por políticas, um recurso de segurança do Open Shell.
Memória do Agente: Distinta do system prompt, a memória do agente é armazenada em um arquivo separado (agent.md) e pode ser atualizada pelo próprio agente, permitindo aprendizado e adaptação dinâmicos.
Abstração do Backend: A LangChain detalha a função create_backend, que cria uma sessão de sandbox do Open Shell como o ambiente de execução central. Crucialmente, ele sobrepõe um file system backend, permitindo que a memória e as skills residam localmente na máquina do desenvolvedor e persistam em diferentes sessões ou sandboxes do agente. Isso é alcançado usando um composite backend, conforme explicado pela LangChain.

Interagindo com o Agente via Langsmith Studio

A LangChain demonstra a execução do agente usando Langgraph dev, que inicia o Langsmith Studio – uma interface para interação e observação. As visualizações principais incluem:

Graph View: De acordo com a LangChain, esta view visualiza a arquitetura do agente, mostrando o middleware para memória e tool calls, e o core loop dos model tools.
Chat View: Uma interface simples para interação direta com o agente.
Reasoning Blocks & Tool Calls: A LangChain enfatiza que esta interface fornece uma visão profunda dos processos de pensamento internos do agente e dos comandos executados.

Capacidades do Agente em Ação

A demonstração apresenta várias capacidades do agente:

Execução de Comandos: A LangChain ilustra o agente executando comandos de sistema como uname -a e python3 --version dentro do sandbox.
Geração e Execução de Código: O agente escreve e executa com sucesso um script Python para gerar estatísticas sobre números aleatórios.
Aplicação de Política de Segurança: A LangChain testa os recursos de segurança do Open Shell instruindo o agente a enviar uma requisição POST para evil.com. Como esperado, a requisição é bloqueada, confirmando o acesso à rede do sandbox governado por políticas.
Atualizações de Memória Persistente: O agente atualiza seu arquivo agent.md para "falar espanhol", demonstrando como a memória pode viver fora do sandbox e persistir entre sessões, conforme destacado pela LangChain.

O Futuro dos Agentes de Código Aberto

A LangChain conclui expressando grande entusiasmo pelo futuro desta fundação de agentes de código aberto. Eles antecipam mais investimentos em Deep Agents, com planos para recursos como async subagents e diversos ambientes de execução. A LangChain também aguarda com expectativa melhorias contínuas no Nvidia Open Shell, particularmente sua integração com boxes aceleradas por GPU para capacitar agentes com capacidades complexas de processamento de dados. O futuro dos open-source models, a LangChain observa, continua sendo uma área chave de entusiasmo.

Para aprofundar-se nos detalhes técnicos e testemunhar a demonstração completa, a LangChain incentiva os leitores a assistir ao vídeo original.

Este artigo é baseado em um vídeo da LangChain. Fonte: Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia

Desmistificando Agentes de AI: O Projeto de Código Aberto da LangChain com Tecnologia Nvidia

Os Elementos Centrais de um Agente de AI

Apresentando o Stack de Agentes de Código Aberto

Construindo e Personalizando Seu Agente: Uma Demonstração Prática

Configuração Inicial e do Ambiente

Desconstruindo a Definição do Agente

Interagindo com o Agente via Langsmith Studio

Capacidades do Agente em Ação

O Futuro dos Agentes de Código Aberto

LangChain

Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia

Further Reading

Desvendando o Model Spec da OpenAI: Os Princípios Orientadores para o Comportamento da AI

Replit Agent 4: Da Ideia a Qualquer Coisa, Mais Rápido e Inteligente