AutoGPT不靠谱,微软推出升级版!可编辑自主规划过程

65e572a76f7ebe042d1728355aaf68d5.png  夕小瑶科技说 原创
 作者 | iven

火遍全网的AutoGPT[1]在Github收藏量突破十万。这种自我规划、自我执行的智能体首次关注人工智能模型内部的自我调整与优化。

但是有不少网友发现,AutoGPT的表现不稳定,死循环是最常见的现象。此外,AutoGPT执行速度很慢,据网友测试,New Bing需要8s的任务,AutoGPT用了整整8分钟!

AutoGPT的工作方式使得它对与单个任务要调用很多次API,据计算单次任务的成本就超过了100元!显然这样的花费对于个人使用是昂贵的。

微软研究院近日新工作提出Low-code LLM,通过简单的可视化操作通过拖拖拽拽的方式与智能体进行协作。

1fa61469e834d472e426e1f2897bd362.jpeg

该模式首先让GPT生成一个任务流程图,这点与AutoGPT的自我规划自我执行的逻辑很为相像,但不同的是,用户可以直观地轻松地了解和修改整个执行流程,从而有效控制人工智能的操作。

之所以称为“Low-code”,是因为它采用了可视化编程的概念,用户只需通过简单的点击和拖拽就可以对流程进行调整。对于复杂的任务,用户可以将自己的想法或偏好有效地对智能体进行控制。

Low-code LLM生成流程图是在一次对话中完成的,调用API的花费基本可以忽略不计,而且这样一次性生成流程图的方式也避免了AutoGPT中死循环的问题,使得服务更加稳定!

作者发现这项工作放在微软TaskMatrix.ai[2]的Repo里,已经超过30k star。Visual ChatGPT[3]也来自同一团队。TaskMatrix.AI展现了如何连接foundation models和大量的各领域的api实现Task Automation(Visual ChatGPT就是其在视觉领域的一个经典范例)。最新推出的Low-code LLM则可以在与用户交互方面发挥作用,帮助用户让AI更理解用户到底想做什么。

论文地址:
https://arxiv.org/abs/2304.08103

论文题目:
"Low-code LLM: Visual Programming over LLMs."

开源代码:
https://github.com/microsoft/TaskMatrix/tree/main/LowCodeLLM

演示Demo:

工作流程

c113b7428e0ffe19ff27ec6382587b31.png
  1. Planning LLM对复杂的任务生成一个结构化的流程图,这点有点类似AutoGPT通过用户给出的目标进行自我规划的思路

  2. 用户通过定义好的低代码可视化操作修改流程图(包括点击、拖拽、文本编辑),将自身的偏好、观点传达给LLM

  3. Executing LLM按照用户修改好的工作流程执行命令,生成回答

  4. 用户可以参考当前的回答不断修改流程图,直到获得满意的结果

48c17687c89604ebdb78028711e50a81.png

预定义的6类low code操作

26beb03391d9feafb8f72441ce3b0d24.png

该模式的优点如下:

  1. 更可控的生成结果:用户可以直接了解并控制人工智能的执行逻辑,使结果更容易被预测和控制,更符合用户的需求;

  2. 用户友好的交互界面:用户可以直观地看到执行流程,点击和拖拽方式也使得操作更加便捷,提高了工作效率;

  3. 广泛的应用场景:该方法可以应用于许多领域,特别是那些用户的想法和偏好至关重要的场景,文中提出了4种典型案例。

此外,Low-code LLM还可以与外部API扩展,进一步丰富场景应用。例如,高效传达用户想法和偏好,帮助用户实现任务自动化。在对接其他工具时,可以将视觉和语音等多种功能整合进来。

AutoGPT和Low-code LLM都在努力提升人工智能模型的性能和效果,前者关注模型内部的自我优化和学习,后者关注用户与模型之间的协同和交互。这两种方法可以相互补充,在不同场景和任务下取得更好的表现。

论文的致谢部分,还提到了这篇文章部分就是通过这种模式进行合作生成的,看来未来人和大模型紧密合作共创不再是梦。

c16b07084f3ea659c5eef9d1e571f2af.png cbcb09840f757737e6f0a912e782174b.png ca32deaac498dde13e62a2fa9609f182.png

参考资料

[1]

AutoGPT: https://github.com/Significant-Gravitas/Auto-GPT,

[2]

TaskMatrix.ai: https://arxiv.org/abs/2303.16434

[3]

Visual ChatGPT: https://arxiv.org/abs/2303.04671,

猜你喜欢

转载自blog.csdn.net/xixiaoyaoww/article/details/130418013