本文基于NVIDIA的OpenClaw: The ChatGPT Moment for Long-Running, Autonomous Agents视频,并以叙述形式重新组织。
想象一下,一个人工智能不仅能回答你的问题,还能不懈地追求复杂目标,从失败中学习并自我纠正——所有这些都无需持续的人工监督。NVIDIA表示,这个未来不仅可能,而且即将到来,并宣布其新的OpenClaw平台是长时间运行的自主代理的“ChatGPT时刻”。在最近的一个视频中,NVIDIA展示了OpenClaw(由NVIDIA NemoClaw强化并由OpenShell提供安全保障)如何重新定义我们与AI的互动,将其从一个被动响应的助手转变为一个主动、自我进化的伙伴。
NVIDIA解释说,OpenClaw的核心设计目标是安全可靠地运行自主代理。该系统利用NVIDIA Inference Microservices (NIM) 来驱动像Nemotron-3-super-120b-a12b这样的强大模型,所有操作都在一个隔离的sandbox环境中进行。这种设置使OpenClaw能够高度独立地运行,协调各种工具和平台上的复杂工作流程。
为了说明OpenClaw的能力,NVIDIA的视频首先深入探讨了一个引人注目的工程挑战:设计一个自适应机器人抓手。用户要求OpenClaw“给我建造一个能抓取所有这些东西的机器人抓手”——一个咖啡杯、一把螺丝刀、一块巧克力棒和一根香蕉。OpenClaw立即行动起来。它分析了这些多样化的物体,提出了一种复杂的抓手设计,其中包括用于咖啡杯的弧形硅胶垫、用于螺丝刀的V形槽、用于巧克力棒的扁平TPU垫,以及用于娇嫩香蕉的柔软硅胶手指。
代理随后提出生成用于3D打印的STLs或模拟抓手。用户选择在Isaac Sim中进行模拟,并在PTC Onshape中进行迭代调整。当初始测试显示抓手未能抓住杯子时,OpenClaw并没有放弃。它智能地识别出问题并推荐了具体的设计更改,例如增加手指伸展、钳口伸展和抓垫深度。至关重要的是,当它遇到限制——MCP Server缺少直接的update_feature工具时——OpenClaw提出了智能的变通方案:生成Onshape API调用以供手动执行,甚至帮助用户以编程方式添加所需的工具。NVIDIA强调,这次演示展示了OpenClaw不仅能解决问题,还能驾驭和克服工具链复杂性的能力。
接着,NVIDIA转向了一个更为复杂的场景:赋能一位MLOps工程师来增强一个名为Alpamayo的自动驾驶AI。目标是利用合成数据,改善Alpamayo在交通中右转、有行人以及恶劣光照条件下的性能。这项任务需要多模态、多工具的工作流程,而OpenClaw以令人印象深刻的流畅性处理了它。代理协调了一系列操作:从NVIDIA的数据集中查找相关视频数据,使用NuRec和3DGS重建3D场景,替换资产(例如用一辆巴士替换一辆汽车以增加数据多样性),使用Cosmos改变环境条件以生成一百种变体,最后使用Qwen评估结果以重新运行表现不佳的案例。即使当用户请求特定调整,例如纠正巴士的旋转或将帧放大到1080p,甚至管理到QNAP NAS的大数据传输时,OpenClaw也能完美执行,无缝集成各种工具和服务。
NVIDIA解释说,支撑OpenClaw的一个核心理念是“自主研究员”。这个想法简单而深刻:给AI代理一个任务,它就会不懈地追求它。NVIDIA指出,“如果有效,就保留。如果无效,就丢弃”,强调了一个迭代、自我进化的过程。规则很明确:每个实验都应该有时间限制(例如,5-10分钟),崩溃应该得到智能处理(修复简单错误,丢弃根本性错误的想法),最重要的是,一旦实验循环开始,代理就绝不能停止或请求人工干预。NVIDIA将其与Andrej Karpathy的“自动研究”进行了类比,用户可以在一夜之间给AI分配100个实验,醒来时就能看到大量已完成的结果。
但NVIDIA指出,OpenClaw的应用范围远不止于高度技术化的领域。视频有趣地展示了一个代理通过Bluetooth连接到Grainfather G30酿造系统,以“酿造一些拉格啤酒,然后为它制定一个营销策略”。NVIDIA分享了一个轶事,一位60岁的父亲使用OpenClaw酿造啤酒,然后自动化创建一个网站供人们订购。这个生动的例子强调了OpenClaw的多功能性和可访问性,展示了它弥合物理行动和数字业务流程之间差距的潜力,使先进的AI代理能力能够惠及更广泛的受众。
NVIDIA展示的OpenClaw不仅仅是另一个AI工具;它代表着一场范式转变。通过在安全框架内实现真正自主、长时间运行和自我进化的代理,NVIDIA正在开创一个新时代,在这个时代中,AI能够以前所未有的独立性和创造力解决复杂、多方面的问题。这确实是一个“ChatGPT时刻”,它使先进AI代理的力量民主化,并为各个领域的创新开启了无限可能。
要更深入地了解这项革命性平台背后的技术演示和愿景,我们鼓励您观看NVIDIA的原始视频。
本文基于NVIDIA的一个视频。 来源:OpenClaw: The ChatGPT Moment for Long-Running, Autonomous Agents
External Intelligence