이 글은 LangChain의 Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia 비디오에서 얻은 주요 통찰을 다룹니다.
AI 에이전트의 핵심 요소
LangChain은 Claude Code, Manus, Open Claw와 같은 고급 AI 에이전트들이 유사한 기본 아키텍처를 공유한다고 설명하며 시작합니다. LangChain에 따르면, 이러한 에이전트들은 모델, 런타임, 하네스라는 세 가지 근본적인 구성 요소로 이루어져 있습니다. 모델은 에이전트의 지능을 제공하고, 런타임은 실행 환경을 제공하며, 하네스는 이러한 요소들과 그 위에 있는 에이전트 레이어를 조율합니다. 이 비디오는 개발자들이 완전히 오픈소스 스택을 사용하여 이러한 구성 요소들을 어떻게 구축할 수 있는지에 초점을 맞춥니다.
오픈소스 에이전트 스택 소개
LangChain은 그들의 오픈소스 에이전트 스택을 위해 특정 기술 조합을 선보입니다:
-
모델: Nvidia Nemotron 3 Super LangChain은 Nvidia가 최근 출시한 Nemotron 3 Super 모델이 정확도와 속도 면에서 모두 뛰어난 성능을 보인다고 강조합니다. LangChain이 시연한 바와 같이, 이 모델은 OpenAI의 GPT OS와 같은 모델들을 이러한 지표에서 능가하며, 에이전트 반응성의 가능성을 확장합니다.
-
런타임: Nvidia Open Shell 역시 최근 출시된 Nvidia Open Shell은 에이전트의 런타임 역할을 합니다. LangChain은 이 런타임의 보안 기능을 강조하며, 에이전트가 지정된 권한 세트로 실행되고 GPU 가속 환경에서 로컬로 작동할 수 있도록 합니다. 이는 GPU 가속 라이브러리를 활용하는 데 매우 중요합니다.
-
하네스: LangChain Deep Agents Deep Agents는 LangChain의 오픈소스 에이전트 하네스로, 모델, 도구, 스킬, 파일 시스템을 조율하도록 설계되었습니다. LangChain에 따르면, Deep Agents는 에이전트가 작업에 "더 깊이" 들어갈 수 있도록 내장된 메커니즘을 제공하고, 스킬과 서브 에이전트를 적극적으로 활용하며, 요약과 같은 일반적인 컨텍스트 엔지니어링 작업을 처리하여 개발자들이 이러한 차별화되지 않은 측면들을 관리하는 부담을 덜어줍니다.
에이전트 구축 및 맞춤 설정: 실용적인 시연
LangChain은 이러한 오픈소스 구성 요소를 사용하여 에이전트를 설정하고 실행하는 실용적인 과정을 안내합니다.
초기 설정 및 환경 구성
시연은 Open Shell을 설치하고 게이트웨이를 시작하는 것으로 시작됩니다. LangChain은 Open Shell sandbox create --keep 명령어를 사용하여 모든 에이전트 실행에 사용될 영구적인 샌드박스를 생성하는 방법을 보여줍니다. LangChain이 설명한 주요 환경 변수에는 Nvidia API key, Open Shell sandbox 이름, 그리고 선택적으로 에이전트 동작을 관찰하고 평가하기 위한 Langsmith API key가 포함됩니다.
에이전트 정의 해부
LangChain은 에이전트 코드를 자세히 살펴보고 그 구조를 공개합니다:
- 모델 통합: 에이전트는 지정된 API key로 구성된 Nvidia Nemotron 3 모델을 사용합니다.
- 시스템 프롬프트: LangChain은 고정된 시스템 프롬프트가 기본적인 지침, 워크플로우 이해, 샌드박스 사용 가이드라인을 제공한다고 설명합니다. 특히, 샌드박스의 네트워크 접근은 Open Shell의 보안 기능인 정책에 의해 관리됩니다.
- 에이전트 메모리: 시스템 프롬프트와는 별개로, 에이전트 메모리는 별도의 파일(
agent.md)에 저장되며 에이전트 자체에 의해 업데이트될 수 있어 동적인 학습과 적응을 가능하게 합니다. - 백엔드 추상화: LangChain은 핵심 실행 환경으로 Open Shell sandbox 세션을 생성하는
create_backend함수를 자세히 설명합니다. 중요한 점은, 이 함수가 파일 시스템 백엔드를 그 위에 계층화하여 메모리와 스킬이 개발자 머신에 로컬로 상주하고 다른 에이전트 세션이나 샌드박스 간에 지속될 수 있도록 한다는 것입니다. 이는 LangChain이 설명한 대로 복합 백엔드를 사용하여 달성됩니다.
Langsmith Studio를 통한 에이전트 상호작용
LangChain은 Langgraph dev를 사용하여 에이전트를 실행하는 것을 시연하는데, 이는 상호작용 및 관찰을 위한 인터페이스인 Langsmith Studio를 시작합니다. 주요 뷰는 다음과 같습니다:
- 그래프 뷰: LangChain에 따르면, 이 뷰는 에이전트의 아키텍처를 시각화하여 메모리 및 도구 호출을 위한 미들웨어와 모델 도구의 핵심 루프를 보여줍니다.
- 채팅 뷰: 에이전트와 직접 상호작용하기 위한 간단한 인터페이스입니다.
- 추론 블록 및 도구 호출: LangChain은 이 인터페이스가 에이전트의 내부 사고 과정과 실행된 명령에 대한 깊은 통찰력을 제공한다고 강조합니다.
에이전트 기능 시연
시연은 여러 에이전트 기능을 보여줍니다:
- 명령어 실행: LangChain은 에이전트가 샌드박스 내에서
uname -a및python3 --version과 같은 시스템 명령어를 실행하는 것을 보여줍니다. - 코드 생성 및 실행: 에이전트는 무작위 숫자에 대한 통계를 생성하는 Python 스크립트를 성공적으로 작성하고 실행합니다.
- 보안 정책 적용: LangChain은 에이전트에게
evil.com으로 POST 요청을 보내도록 지시하여 Open Shell의 보안 기능을 테스트합니다. 예상대로 요청은 차단되었고, 이는 샌드박스의 정책 기반 네트워크 접근을 확인시켜 줍니다. - 영구 메모리 업데이트: 에이전트는
agent.md파일을 "스페인어를 사용하라"로 업데이트하여, LangChain이 강조한 대로 메모리가 샌드박스 외부에 존재하며 세션 간에 지속될 수 있음을 보여줍니다.
오픈소스 에이전트의 미래
LangChain은 이 오픈소스 에이전트 기반의 미래에 대한 상당한 기대감을 표명하며 결론을 맺습니다. 그들은 비동기 서브 에이전트 및 다양한 실행 환경과 같은 기능을 포함하여 Deep Agents에 대한 추가 투자를 예상하고 있습니다. LangChain은 또한 Nvidia Open Shell의 지속적인 개선, 특히 GPU 가속 박스와의 통합을 통해 에이전트에게 복잡한 데이터 처리 능력을 부여하는 것에 대한 기대를 나타냅니다. LangChain은 오픈소스 모델의 미래가 여전히 주요 관심 영역으로 남아 있다고 언급합니다.
기술적인 세부 사항을 더 깊이 이해하고 전체 시연을 확인하려면, LangChain은 독자들이 원본 비디오를 시청할 것을 권장합니다.
이 글은 LangChain의 비디오를 기반으로 작성되었습니다. 출처: Open Models, Open Runtime, Open Harness - Building your own AI agent with LangChain and Nvidia
External Intelligence