Este artigo aborda os principais insights de Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia da LangChain.
Os Elementos Centrais de um Agente de AI
A LangChain começa explicando que agentes de AI avançados, como Claude Code, Manus e Open Claw, compartilham uma arquitetura subjacente semelhante. De acordo com a LangChain, esses agentes consistem em três componentes fundamentais: um model, um runtime e um harness. O model fornece a inteligência do agente, o runtime oferece o ambiente de execução, e o harness orquestra esses elementos, juntamente com uma camada de agente por cima. O vídeo foca em como os desenvolvedores podem construir esses componentes usando um stack completamente de código aberto.
Apresentando o Stack de Agentes de Código Aberto
Para o seu stack de agentes de código aberto, a LangChain apresenta uma combinação específica de tecnologias:
-
O Model: Nvidia Nemotron 3 Super A LangChain destaca que o model Nemotron 3 Super, recentemente lançado pela Nvidia, é altamente performático tanto em precisão quanto em velocidade. Como a LangChain demonstra, ele supera models como o GPT OS da OpenAI nessas métricas, expandindo os limites do que é possível para a responsividade do agente.
-
O Runtime: Nvidia Open Shell O Nvidia Open Shell, também um lançamento recente, serve como o runtime para o agente. A LangChain enfatiza seus recursos de segurança, permitindo que os agentes rodem com conjuntos de permissões especificados e operem localmente em ambientes acelerados por GPU, o que é crucial para aproveitar bibliotecas aceleradas por GPU.
-
O Harness: LangChain Deep Agents Deep Agents é o harness de agente de código aberto da LangChain, projetado para orquestrar models, tools, skills e file systems. De acordo com a LangChain, ele fornece mecanismos embutidos para os agentes "aprofundarem" nas tarefas, utiliza intensamente skills e subagents, e lida com tarefas comuns de context engineering como sumarização, liberando os desenvolvedores de gerenciar esses aspectos não diferenciados.
Construindo e Personalizando Seu Agente: Uma Demonstração Prática
A LangChain fornece um passo a passo prático de como configurar e executar um agente usando esses componentes de código aberto.
Configuração Inicial e do Ambiente
A demonstração começa com a instalação do Open Shell e o início de seu gateway. A LangChain mostra como criar um sandbox persistente usando Open Shell sandbox create --keep, que será usado para todas as execuções do agente. Variáveis de ambiente chave, conforme explicado pela LangChain, incluem a API key da Nvidia, o nome do sandbox do Open Shell e, opcionalmente, API keys do Langsmith para observar e avaliar o comportamento do agente.
Desconstruindo a Definição do Agente
A LangChain aprofunda-se no código do agente, revelando sua estrutura:
- Integração do Model: O agente usa o model Nvidia Nemotron 3, configurado com a API key especificada.
- System Prompt: A LangChain explica que um system prompt fixo fornece instruções básicas, compreensão do workflow e diretrizes para usar o sandbox. Notavelmente, o acesso à rede do sandbox é governado por políticas, um recurso de segurança do Open Shell.
- Memória do Agente: Distinta do system prompt, a memória do agente é armazenada em um arquivo separado (
agent.md) e pode ser atualizada pelo próprio agente, permitindo aprendizado e adaptação dinâmicos. - Abstração do Backend: A LangChain detalha a função
create_backend, que cria uma sessão de sandbox do Open Shell como o ambiente de execução central. Crucialmente, ele sobrepõe um file system backend, permitindo que a memória e as skills residam localmente na máquina do desenvolvedor e persistam em diferentes sessões ou sandboxes do agente. Isso é alcançado usando um composite backend, conforme explicado pela LangChain.
Interagindo com o Agente via Langsmith Studio
A LangChain demonstra a execução do agente usando Langgraph dev, que inicia o Langsmith Studio – uma interface para interação e observação. As visualizações principais incluem:
- Graph View: De acordo com a LangChain, esta view visualiza a arquitetura do agente, mostrando o middleware para memória e tool calls, e o core loop dos model tools.
- Chat View: Uma interface simples para interação direta com o agente.
- Reasoning Blocks & Tool Calls: A LangChain enfatiza que esta interface fornece uma visão profunda dos processos de pensamento internos do agente e dos comandos executados.
Capacidades do Agente em Ação
A demonstração apresenta várias capacidades do agente:
- Execução de Comandos: A LangChain ilustra o agente executando comandos de sistema como
uname -aepython3 --versiondentro do sandbox. - Geração e Execução de Código: O agente escreve e executa com sucesso um script Python para gerar estatísticas sobre números aleatórios.
- Aplicação de Política de Segurança: A LangChain testa os recursos de segurança do Open Shell instruindo o agente a enviar uma requisição POST para
evil.com. Como esperado, a requisição é bloqueada, confirmando o acesso à rede do sandbox governado por políticas. - Atualizações de Memória Persistente: O agente atualiza seu arquivo
agent.mdpara "falar espanhol", demonstrando como a memória pode viver fora do sandbox e persistir entre sessões, conforme destacado pela LangChain.
O Futuro dos Agentes de Código Aberto
A LangChain conclui expressando grande entusiasmo pelo futuro desta fundação de agentes de código aberto. Eles antecipam mais investimentos em Deep Agents, com planos para recursos como async subagents e diversos ambientes de execução. A LangChain também aguarda com expectativa melhorias contínuas no Nvidia Open Shell, particularmente sua integração com boxes aceleradas por GPU para capacitar agentes com capacidades complexas de processamento de dados. O futuro dos open-source models, a LangChain observa, continua sendo uma área chave de entusiasmo.
Para aprofundar-se nos detalhes técnicos e testemunhar a demonstração completa, a LangChain incentiva os leitores a assistir ao vídeo original.
Este artigo é baseado em um vídeo da LangChain. Fonte: Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia
External Intelligence