Skip to content Skip to footer

“思想骨架”如何加速人工智能并使其更加人性化

image-20231128203454383

GenAI无疑令人印象深刻。然而,如果你真的尝试过与 ChatGPT 或 Claude 等人聊天,你可能已经注意到他们可能是痛苦的机器人。根据一天中的时间和使用该模型的人数,只回答一个问题可能会花费非常不人道的思考时间!此外,这些回应虽然复杂,但往往缺乏人类逻辑的结构化组织。

如果我们也能吃蛋糕呢?快速的人工智能和类人思维?嗯,这正是清华大学和Microsoft的研究人员在最近发表的一篇论文中概述的“思想骨架”技术提出的。他们的关键见解是什么?从纯粹的顺序处理转变为同时并行生成,更类似于我们的大脑解决问题的方式。

和野兔

LLM 有时缓慢的步伐源于它们一步一步的令牌生成,这与逐个字母输入一个句子没有什么不同。不幸的是,现代硬件并不是为这种串行操作而构建的。因此,尽管人工智能系统背后有巨大的计算能力,但大多数芯片都闲置着,摆弄着它们的硅拇指等待数据!

我们人类写句子的方式暗示了一种更聪明的方法。我们通常先计划整体结构,也许记下要点,然后再填充每个部分的内容。类似地,骨架框架首先从 LLM 本身引出结构轮廓,然后并行完成部分。

教老狗新花样

研究人员没有重新设计模型,而是采用巧妙的提示来激活分层推理的潜在能力。多阶段提示鼓励LLM:

  1. 生成包含关键点的答案骨架
  2. 批量并发扩展每个点

值得注意的是,这种技术加快了所有测试模型的响应生成速度,包括 Claude、GPT-4 和几个开源选项(Vicuna、LLaMA)。对于某些系统,骨架方法的周转速度提高了 2-3 倍,而不会造成任何精度损失。在特定情况下,它甚至提高了答案质量!

具有 X 射线视觉的 AI

骨架技术与经过时间考验的人类问题解决框架(如概念图和大纲)表现出惊人的相似之处。正如骨骼为人体提供结构一样,提取计算支架可以引导有效的系统思维。由此产生的对黑匣子思维过程的“X射线”窥视揭示了一个更有组织的推理景观。

对于企业来说,这些交互式骨骼可以指导训练以改进批判性分析,甚至可以根据大纲形状和流程审核模型逻辑。骨架点还可以用作导航锚点,以便用户方便地跳到相关的模型突出显示段落。

教人工智能走路

一个更诱人的可能性是通过有针对性的提示工程来刻意磨练特定类型的结构化思维。例如,医学诊断骨架可能首先探究症状,然后评估紧急风险,最后探索治疗计划。除了事实的准确性之外,这种定向的骷髅通过严格遵循专业途径来避免幻觉内容,从而传递纪律。

就像父母陶醉于孩子迈出的第一步一样,观看 LLM 有意识地计划然后生成内容代表着一个重要的里程碑。它暗示了有意识的建筑思维的边缘——一种处理新颖复杂情况不可或缺的能力。一些研究人员已经开始走这条路,开发“思维图”框架,使LLM能够动态调整推理结构。

底线

虽然在通用人工智能与人类相匹配之前仍然存在重大障碍,但骨架方法能量使用商品硬件将目前未开发的分配潜力转化为可观的速度提升。通过将骨架分区策略集成到推理服务系统中,可能会获得进一步的收益。该技术有意义地推动了消费者的生存能力,使企业能够部署对话式代理,提供更快、更一致和响应迅速的支持。然而,速度只是等式的一半。真正持久的价值来自于通过窥视黑匣子内部发现的质量提高——这是由巧妙的提示驱动的结果。虽然LLM没有大脑,但至少我们现在可以想象他们的思想是建立在隐喻骨架上的!