Skip to content Skip to footer

揭开大型行动模型(LAM)时代的面纱:将人类意图转变为人工智能执行”

image-20240125203307497

人工智能 (AI) 领域的一个热门话题和发展是大型行动模型,也称为大型代理模型或简称 LAM。 LAMs 是我们大多数人现在熟悉的大型语言模型 (LLM) 的延伸。LLM 可以通过根据输入预测下一个单词或标记来生成文本。LAM 通过增强这些 LLM 转变为“代理”来推动这一阶段。代理是能够自行运行任务的软件单元,因此它们最终不是简单地回答人类用户的查询,而是帮助实现目标。这结合了法学硕士的语言流利度与自主完成任务和决策的能力,这涉及重大变化。

大型动作模型的结构基于应用程序的组成和它们旨在模拟的人类操作。LAM 可以清楚地模拟各种应用程序的组成和在其上执行的人类操作,而无需文本等瞬态演示。这是由神经符号编程的发展所赋予的。我们无权访问模型来验证这一点。

大型语言模型 (LLM) 和大型代理模型 (LAM) 都是人工智能模型的类型,但它们的用途不同,功能也不同。图 1 说明了核心差异。

image-20240125203421172

图 1.LLM 和 LAM 之间的差异

就其工作概述而言,LAM通过与外部系统(例如物联网设备等)的集成与现实世界进行交互。通过连接到这些系统,LAM 可以执行物理操作、控制设备、检索数据或操作信息。这使得 LAM 能够[将整个流程机械化,并巧妙地与世界互动、与人交谈、根据条件变化进行调整,甚至与其他 LAM 一起工作。

LAM具有许多功能,使其成为人工智能领域的主导工具。首先,LAM的开发是为了理解用自然语言表达的复杂的人类目标,将这些意图转化为可操作的步骤并实时响应。其次,LAM可以通过智能与世界互动,包括人、环境变化适应和其他LAMs。第三,LAM通过与外部系统的集成与现实世界进行交互。最后,LAM 将生成式 AI 从温顺的工具提升为实时完成工作的功能协作者。

大型动作模型的潜在用例可以应用于不同的领域。在医疗保健领域,LAM可以通过现代诊断和量身定制的治疗策略来改变患者护理。在金融领域,LAM 可以帮助进行风险测量、欺诈发现和算法交易。在汽车领域,LAM可以帮助生产自治车辆和改善车辆安全系统。

LAM 可用于实际产品,一个值得注意的例子是 Rabbit r1 设备,目前零售价为 199 美元,可供预订。Rabbit r1 是一款独立设备,尺寸约为 iPhone 的一半,配备触摸屏和独特的 360 度旋转摄像头,用于拍摄照片和视频。滚轮简化了在设备中的导航,允许用户毫不费力地与内置助手进行交互(远场麦克风、一键通按钮等)。

Rabbit 是一家人工智能公司,它通过自然语言界面和托管操作系统的专用硬件创建了量身定制的操作系统 (OS)。Rabbit 的核心产品是 Rabbit OS,由其私有 LAM 操作,允许 Rabbit r1 设备在各种技术界面上识别和再现人类行为,自然地通过应用程序实现导航现代化。这标志着在无需任何应用程序的情况下轻松进行在线用户交互方面取得了显着进步。

大型行动模型已准备好在塑造人工智能的未来方面发挥重要作用。通过加强语言模型,使其成为可以自行执行任务的“代理”,将生成式人工智能打造成实时动作伴侣。像 Rabbit 这样的实际应用程序已经在利用 LAM 的强大功能。这散布了新的前景,并标志着人工智能发展的巨大转变。随着我们不断发现和转型,LAMs绝对将在影响人工智能的前景方面发挥着至关重要的作用。