新闻中心

产业数字金融观察 | 将人工智能推向“自主”新高度,AutoGPT是何方神圣

2023.07.14

导读

风起于青萍之末,ChatGPT、GPT4、Midjourney等以内容生成为导向的人工智能应用,自诞生以来在全球引发了一轮又一轮的创新浪潮,被认为是推动数字经济时代生产力范式变革的标志性产品。如今,ChatGPT的进化版本——AutoGPT接踵而至,我们有必要在人工智能新时代开启之际,洞穿新技术可能带来的巨大产业变革。

1、从ChatGPT到AutoGPT

当前,全球新一代人工智能进入了快速发展阶段,AI自动化提速、关键技术持续涌现,发展方向日益多元化;AI大模型发展迅猛,正在加快形成人工智能应用新范式。据IDC预测,2022年中国人工智能市场相关支出达到130.3亿美元,并有望在2026年达到266.9亿美元,2022至2026年年复合增长率达19.6%。

中国人工智能行业渗透度

图片来源:IDC
制图:聚量集团

在这场时代浪潮下,继ChatGPT席卷全球之后,AutoGPT横空出世。AutoGPT于今年3月30日在GitHub发布,在短短的一个多月时间里,该Git项目已经获得了超过12万的star(点赞)。

什么是AutoGPT呢?AutoGPT由GPT-3.5和GPT-4等多个程序驱动,可以能够根据用户需求,在用户完全不插手的情况下自主执行任务,包括日常的事件分析、营销方案撰写、代码编程、数学运算等等。AutoGPT不仅在语言理解上有所突破,在推理、生成和多模态处理等方面也具备更强大的能力。特斯拉前 AI 总监、刚刚回归OpenAI的Andrej Karpathy表示,“AutoGPT是Prompt工程的下一个前沿。”

AutoGPT和ChatGPT实际都是基于GPT模型的自然语言处理技术。ChatGPT是一种基于GPT模型的聊天机器人,只能回答已训练过的历史样本数据中涵盖的信息,很多事情都依赖于人类想出能够引导AI回应的提示语。AutoGPT则更进一步,它通过数据自动标注和学习,可以让AI自主行动、能够“自我提示”,无需人工干预即可自我提出并解决问题的每个子集。

例如,你想计划一场生日聚会,那么就需要向ChatGPT一个一个地提出各种特定问题,如生日主题、场地、客人清单、礼物、食物和装饰品;同时,需要在随后的每个步骤中提示ChatGPT,例如如何购买礼物或发送邀请。相比之下,如果你要求AutoGPT计划生日聚会,那么它可以直接完成制定主题、编写来宾名单、策划邀请函、购买礼物等一系列动作。又比如,某国外测试者要求AutoGPT帮他创建一个网站,AutoGPT直接调用React框架生成了一个前端页面;而对于ChatGPT,则需要将创建网站的任务拆分为一个个具体的工作步骤,再交给ChatGPT完成。


2、AutoGPT技术大拆解

从技术角度讲,AutoGPT是一个实验性的开源应用程序,它由GPT-4驱动,这与ChatGPT的底层语言模型一致。但有别于ChatGPT的是,AutoGPT的定位是将LLM(Large-scale Language Model,大规模语言模型)的“思想"串联起来,自主地实现设定的任何目标。想让AutoGPT运行起来,就需要依靠以下4个组件。

ⅰ. 架构:AutoGPT基于强大的GPT-4和GPT-3.5大型语言模型构建,它们充当机器人的大脑,帮助它思考和推理。

ⅱ. 自主迭代:AutoGPT可以回顾它的工作,在之前的基础上取得进展,并利用之前的历史来产生更准确的结果。

ⅲ. 内存管理:与向量数据库集成,使AutoGPT能够保留上下文并做出更好的决策。

ⅳ. 多功能性:AutoGPT的功能如文件操作、网页浏览和数据检索等使其具有广泛用途,相较于以前的AI进步,这就像赋予机器人多种技能来处理更多任务。

有了以上组件之后,AutoGPT就可以根据以下三个流程运作:需求下发、自主运行、结果输出。其中,自主运行是AutoGPT的核心模块。

AutoGPT运行流程

图片来源:github
制图:聚量集团

我们可以看到,AutoGPT会基于一定的策略自动组装需求Prompt向ChatGPT下发任务,初次下发任务需包含用户名(Name)、角色(Role)、目标(Goals)等任务。对于下发的Prompt,ChatGPT API通过大模型对语义内容理解,相当于Thinking的过程,输出详细的Step-by-Step解决方案,然后返回下一步指令。这些指令都是可扩展的,每一种命令代表一种外部能力,包括访问网站、解析网站、爬取数据、执行电脑指令等等。指令操作完成后,系统返回执行结果,AI会评估结果以确定是否达到预期目标、或是否需要进一步完善。这种评估有助于AI了解其行动的有效性并做出必要的调整。

3、一道面向未来的AI之光

如今的数字经济时代,我们已经随处可以看到全球各行各业与数字技术有机融合后产生的革命性颠覆与巨大潜力,AutoGPT亦有望在未来成为许多行业如互联网、金融、医疗、教育等领域的重要基础设施之一。想象一下,AutoGPT通过与各种软件和服务(内部和外部)交互、自动提取和分析数据,为所有相关利益者生成不同报告,例如在医疗保健行业,Auto-GPT可以帮助医生更快地分析病例、制定诊疗方案;在智慧城市建设中,Auto-GPT可以协助规划和管理城市基础设施,提高城市运行效率;在新闻媒体上,AutoGPT技术可用于开发具有高度自主性的机器人,从而自动分析和判断网络上的热点话题,生成有趣、引人入胜的短新闻,吸引更多用户关注和互动。

金融业作为大数据和人工智能应用的重要领域,AutoGPT的引入将可能成为其整体业务数字化转型的关键。尤其在产业金融服务方面,产业链体系涉及上下游的资源整合,跨领域和跨团队的沟通效率较低。基于类AutoGPT的智能助手可以辅助各个参与方保持高效率的沟通和产业链知识共享,从而让金融机构能够更好地去理解客户意图,助力产业链供应链金融服务向更多层次的产业端延伸。AutoGPT还可以从主体信用+交易信用的维度,快速、高效地帮助金融机构生成相应产业链供应链场景下的风险预警报告。此外,在智能投顾、营销文案、信用评分等各个方面,AutoGPT也有着广阔想象空间。

当然, 像任何一项新技术一样,AutoGPT存在自身局限性。从技术角度讲,一旦遇到一些GPT-4无法处理的问题时,它就会陷入“死循环”,每一个步骤执行完后的动作都为“do_nothing”;同时,由于GPT-4生成token的速度比GPT-3.5慢许多,再加上脚本执行其它指令所消耗的时间,AutoGPT存在执行速度过慢现象。从落地应用角度讲,如何确保训练数据的数量与质量、如何降低大模型的运行和维护成本、如何保证数据安全与模型安全等,都是AutoGPT等人工智能应用需要面临的挑战。

总 结

面对人工智能兴起的时代浪潮,聚均科技始终保持技术创新性和科技领先性,融合前沿的人工智能、大数据、物联网、信息安全等全场景数字技术,以先进科技驱动金融创新,为金融机构产业金融服务的数字化转型提供综合解决方案,服务金融机构高质量数字化转型。

参考文献:
   【1】IDC:《2022-2023中国人工智能计算力发展评估报告》
   【2】Ksred:《Leveraging AutoGPT and BabyAGI for Enhanced Problem Solving and Innovation in Financial》
   【3】肖涵:《揭秘AutoGPT 喧嚣背后的残酷真相》
   【4】老梁:《AutoGPT:自动化GPT原理及应用实践》
   【5】AI前沿观察:《AutoGPT:通用人工智能雏形?》
   【6】新华社中国经济信息社,新一代人工智能产业技术创新战略联盟:《新一代人工智能发展年度报告(2022-2023)》
   【7】姚前:《关于大模型生态建设的若干思考》

微信公众号
扫码关注微信公众号
  • 上海总部

    上海市浦东新区樱花路868号建工大唐国际A座25、20楼

  • 北京分公司

    北京市朝阳区光华路15号院亿利生态广场1号楼806室

打开微信扫一扫进行分享。

关闭