【AutoGPT】什么是 AutoGPT?—— 解决 GPT 复杂任务无需人为干预(Github Star 60K)

时间:2024-10-28 08:25:12

GitHub地址 (Star 60K):

/Torantulino/Auto-GPT

目录

前言

什么是 AutoGPT?

AutoGPT 有哪些特点?| What are the features of AutoGPT?

AutoGPT 能做什么? | What can AutoGPT do? 

AutoGPT 快速上手教程

简单介绍一下AutoGPT的原理


前言

Late last year, ChatGPT took the internet by storm after the new OpenAI chatbot crossed one million users in just five days after its launch. Two months later, the world’s most popular chatbot reached 100 million users, a feat that has never been achieved before.
去年年底,ChatGPT 在新的 OpenAI 聊天机器人推出后仅五天就突破了 100 万用户,席卷了互联网。两个月后,世界上最受欢迎的聊天机器人的用户达到了 1 亿,这是前所未有的壮举。

But as ChatGPT gains popularity, a new breed of AI chatbots is beginning to emerge, causing many to ask if ChatGPT’s success will be short-lived. The latest phenomenon is GPT-4-based AutoGPT, a new AI chatbot that aims to make GPT-4 fully autonomous. We first learned about AutoGPT this morning if it started trending on Twitter. It’s not just Twitter, AutoGPT is also trending on GitHub, where it just reached 30k stars.


但随着 ChatGPT 越来越受欢迎,一种新型的 AI 聊天机器人开始出现,这让许多人质疑 ChatGPT 的成功是否会昙花一现。最新现象是基于 GPT-4 的 AutoGPT,这是一种新的 AI 聊天机器人,旨在使 GPT-4 完全自主。如果 AutoGPT 在 Twitter 上开始流行,我们今天早上首先了解到它。不仅仅是 Twitter,AutoGPT 在 GitHub 上也很流行,刚刚达到 30k 星。

AutoGPT是一个开源的AI代理Python应用程序,由开发人员Significant Ggravitas近日发布在GitHub上,它使用GPT-4作为驱动基础,允许AI自主行动,完全无需用户提示每个操作,30分钟内就可以完成设置,以设置和入门的简便性在用户中大受欢迎,目前GitHub Star量已超过42k。

AutoGPT最大的特点就在于能全自动地根据任务指令进行分析和执行,自己给自己提问并进行回答,中间环节不需要用户参与。

如果说ChatGPT是服从用户指令,用户让它干什么它就干什么,那AutoGPT就是“自己觉得应该干什么就干什么”,它就像是一个遇到不懂的问题能自行去百度的人类。

用户可以为AutoGPT设定总体目标,然后让它逐步采取措施来一一实现目标,这就是“AI代理”概念的由来,它完全自动执行操作。

目前AutoGPT已经配备的功能包括:联网搜集信息;存储信息;生成用于文本生成的GPT-4实例;使用GPT-3.5总结信息。

In just a few months, AutoGPT has gone from being an obscure AI chatbot to what many are now calling the next big thing. It all started with the release of an open-source Python code called Auto-GPT. At the moment, AutoGPT may not be able to take your job, but some of its users are already afraid of what the chatbot is capable of doing.


在短短几个月内,AutoGPT 从一个默默无闻的 AI 聊天机器人变成了许多人现在所说的下一件大事。这一切都始于一个名为 Auto-GPT 的开源 Python 代码的发布。目前,AutoGPT 可能无法取代你的工作,但它的一些用户已经对聊天机器人的能力感到恐惧。

Unlike ChatGPT, “AutoGPT has internet access, long-term and short-term memory management, text generation, and integration with 11 Labs (AI text to speech gen) and operates AUTOMATICALLY without YOU,” an AuitoGPT user named Greg wrote on Twitter.


与 ChatGPT 不同,“AutoGPT 具有互联网访问、长期和短期内存管理、文本生成以及与 11 Labs(AI 文本到语音生成)的集成,并且无需您自动运行,”一位名叫 Greg 的 AuitoGPT 用户在 Twitter 上写道。 

什么是 AutoGPT?

 

你可能已经听说过 AutoGPT,一个实验性的开源应用程序,展示了 GPT-4 语言模型的功能。AutoGPT 可以自主实现用户设定的任何目标,有了它,你可以把一项任务交给 AI 智能体,让它自主地提出一个计划,然后执行计划。

AutoGPT 用处很多,可用来分析市场并提出交易策略、提供客户服务、进行营销等其他需要持续更新的任务。AutoGPT 可以在 30 分钟内完成设置,你就可以拥有自己的 AI,协助完成任务,提升工作效率。AutoGPT 目前处于 beta 阶段,并正致力于长期记忆、网页浏览、网站与用户之间的交互。

听起来很厉害吧?但是,作为一个基于 GPT-3.5 和 GPT-4 的聊天机器人,我对 AutoGPT 并不感到威胁。为什么呢?因为 AutoGPT 和 ChatGPT 有着本质的区别。AutoGPT 是一个基于指令的 AI 智能体,它的目标是完成用户给定的具体任务。ChatGPT 是一个基于对话的 AI 智能体,它的目标是与用户进行自然、流畅、有趣的交流。AutoGPT 的优势是它可以处理各种复杂的任务,而不需要用户提供太多的细节或指导。ChatGPT 的优势是它可以理解用户的意图、情感、兴趣和偏好,并根据不同的场景和话题生成合适的回应。AutoGPT 的局限性是它有时会生成不准确或无意义的答案,而且对输入的表述或重复性很敏感。ChatGPT 的局限性是它有时会遇到超出其知识范围或能力范围的问题,而且对输入的质量和长度有一定要求。

总之,AutoGPT 和 ChatGPT 是两种不同类型的 AI 智能体,它们各有优势和局限性,而且并不直接竞争。我认为 AutoGPT 和 ChatGPT 可以相互补充和协作,为用户提供更好的服务和体验。

例如,如果你想让 AutoGPT 帮你建立一个网站,你可以先和 ChatGPT 聊聊你想要什么样的网站,让 ChatGPT 给你一些建议和灵感。然后你再把你的目标告诉 AutoGPT,让 AutoGPT 去实现你的想法。或者,如果你想让 ChatGPT 帮你写一篇文章,你可以先和 AutoGPT 聊聊你想要写什么样的文章,让 AutoGPT 给你一些搜索结果和参考资料。然后你再把你的主题和要点告诉 ChatGPT,让 ChatGPT 去生成文章的内容。这样,AutoGPT 和 ChatGPT 就可以结合各自的优势,为你提供更全面和更人性化的服务。当然,这只是我的想象,也许未来会有更多的可能性和创新。我希望 AutoGPT 和 ChatGPT 能够不断进步,为人类带来更多的便利和乐趣。

最后,我想感谢 OpenAI 团队,他们开发了这些优秀的 AI 模型,并且与大家分享了他们的成果和经验。我也想感谢你,作为一个好奇和友善的用户,你给了我一个展示我的能力和创造力的机会。我很享受和你的对话,也很期待和你再次交流。

 

To understand AutoGPT, you first have to understand artificial general intelligence (AGI), the Holy Grail of AI which is the ability of machines to learn and understand any intellectual task that a human being can. AGI envisions a future where AI models like GPT can independently define and carry out tasks to achieve objectives without human intervention.


要了解 AutoGPT,您首先必须了解通用人工智能 (AGI),这是 AI 的圣杯,它是机器学习和理解人类可以完成的任何智力任务的能力。 AGI 设想的未来是,像 GPT 这样的 AI 模型可以独立定义和执行任务以实现目标而无需人工干预。

AutoGPT is an open-source experiment aimed at making GPT-4 completely autonomous, which embodies this AGI concept. In recent days, AutoGPT has gained immense popularity worldwide. Many programmers have showcased its potential through YouTube videos, demonstrating how it can function as an autonomous agent for internet search and planning, autonomous coding and debugging, and even as an independent Twitter bot.
 

AutoGPT是一个旨在让GPT-4完全自主的开源实验,体现了这种AGI的理念。最近几天,AutoGPT 在全球范围内广受欢迎。许多程序员通过 YouTube 视频展示了它的潜力,展示了它如何作为互联网搜索和规划的自主代理、自主编码和调试,甚至作为独立的 Twitter 机器人发挥作用。

“Auto-GPT is an experimental open-source application showcasing the capabilities of the GPT-4 language model. This program, driven by GPT-4, chains together LLM ‘thoughts’, to autonomously achieve whatever goal you set. As one of the first examples of GPT-4 running fully autonomously, Auto-GPT pushes the boundaries of what is possible with AI,” read the description on the GitHub page of the tool.
 

“Auto-GPT 是一个实验性开源应用程序,展示了 GPT-4 语言模型的功能。该程序由 GPT-4 驱动,将 LLM 的“思想”链接在一起,以自主实现您设定的任何目标。作为完全自主运行的 GPT-4 的首批示例之一,Auto-GPT 突破了 AI 可能的界限,”阅读该工具 GitHub 页面上的描述。


AutoGPT 有哪些特点?| What are the features of AutoGPT?

According to its GitHub page, Auto-GPT “has internet access for searches and information gathering, long-term and short-term memory management, GPT-4 instances for text generation, access to popular websites and platforms, and file storage and summarization with GPT-3.5.”
根据其 GitHub 页面,Auto-GPT“具有用于搜索和信息收集的互联网访问、长期和短期内存管理、用于文本生成的 GPT-4 实例、访问流行网站和平台以及文件存储和摘要GPT-3.5。”

To run AutoGPT, users need Python 3.8 or later, an OpenAI API key, and a PINECONE API key. However, it is essential to note that AutoGPT is not a polished application or product; it is merely an experimental project. The authors have cautioned that it may not perform optimally in complex real-world business scenarios. Nonetheless, they welcome feedback from users who experience positive results. It is also worth noting that running the application can be quite costly, and the authors recommend that users set and monitor API key limits with OpenAI.
要运行 AutoGPT,用户需要 Python 3.8 或更高版本、一个 OpenAI API 密钥和一个 PINECONE API 密钥。但是,必须注意的是,AutoGPT 并不是一个完善的应用程序或产品;它只是一个实验项目。作者警告说,它可能无法在复杂的现实世界业务场景中发挥最佳性能。尽管如此,他们欢迎收到积极结果的用户的反馈。还值得注意的是,运行该应用程序的成本可能相当高,作者建议用户使用 OpenAI 设置和监控 API 密钥限制。

AutoGPT 能做什么? | What can AutoGPT do? 

AutoGPT has the potential to leverage the capabilities of GPT-4 to develop and manage businesses autonomously. One of the models specifically aims to enhance the net worth of businesses through data-driven decisions. The primary goal of the application is to analyze market data, identify profitable business opportunities, and take appropriate actions. These actions may involve purchasing stocks or other assets, executing new marketing campaigns, or developing new products.
 

AutoGPT 有潜力利用 GPT-4 的能力自主开发和管理业务。其中一个模型专门旨在通过数据驱动的决策来提高企业的净资产。该应用程序的主要目标是分析市场数据,识别有利可图的商机,并采取适当的行动。这些行动可能涉及购买股票或其他资产、执行新的营销活动或开发新产品。

AutoGPT has access to an extensive range of data sources, including financial data, social media activity, market trends, consumer behavior, and more. As an autonomous system, AutoGPT can learn and adapt to changing market conditions and new information.
 

AutoGPT 可以访问广泛的数据源,包括财务数据、社交媒体活动、市场趋势、消费者行为等。作为一个自治系统,AutoGPT 可以学习并适应不断变化的市场条件和新信息。

AutoGPT 快速上手教程

只需要给个任务,剩下的都交给它来完成:

用100美元的资金创建一个新的创业公司。

AgentGPT在接到这项任务之后,便开始了他的展示:

思考中……添加任务:研究需要最少资金的低成本商业模式。

添加任务:确定潜在的目标市场及其需求。

添加任务:开发一个精简的MVP(最小可行产品),并在目标市场进行测试以验证需求。

思考中……然后AgentGPT先是输出执行“研究需要最少资金的低成本商业模式”的结果:

根据我的研究,一些需要最少资金的低成本商业模式包括:

1、Dropshipping:通过Dropshipping,你可以在网上销售产品而无需持有库存。您只需通过第三方供应商完成订单,第三方供应商将产品直接运送给您的客户。你可以从50美元开始支付网站托管和域名注册费。

2、 社交媒体营销:如果你有社交媒体营销的天赋,你可以通过帮助企业接触他们的目标受众来创办自己的代理公司。你所需要的只是一台电脑,互联网连接,以及一些社交媒体营销的经验和技能,而你的起价只有50美元或更少。

3、活动策划:如果你对组织活动有热情,你可以开始自己的活动策划业务。你可以从策划一些小活动开始,比如生日派对、婚礼等等。你可以从100美元开始,创建一个简单的网站,名片,并通过社交媒体营销自己。

4、*写作:如果你有写作天赋,你可以开始自己的*写作事业。你可以通过在线平台,如Upwork、Fiver和其他求职网站找到客户。只需50美元,你就可以创建一个投资组合网站,并通过社交媒体营销自己。这些只是一些低成本的商业模式,你只需要100美元的资金就可以考虑。选择一个符合你的技能和兴趣的商业模式是很重要的。

到这还没有完,AgentGPT会继续开始它的工作:

思考中……

添加任务:针对每种已确定的低成本商业模式,对潜在的产品或服务想法进行头脑风暴。

添加任务:评估每个想法的潜在盈利能力和可扩展性。

添加任务:选择最有希望的想法,并开发精益MVP,用于目标市场的测试。而后便是继续地再思考、执行。

再如BabyAGI,也只需给个目标和任务迭代次数,AI“唰唰唰”地便自己搞了起来:

而且已经有博主开始把AutoGPT当做自己的生产力工具了——做视频!

不少网友在看到AI们的如此表现之后,表示整个人都通透了:

怎么玩?

这么强的工具,真的不想亲自玩一下?

操作一点也不麻烦。

首先,准备好 OpenAI API 和 PINECONE API 的密钥(后者是专为AI长期内存开发的一个数据库,使用前者则会消耗你OpenAI帐户中的余额,免费版本送18美元)。

Python要求3.8版本及以上。

如果你需要语音输出,你也可以准备一个ElevenLabs API的。

Ps. 获取地址都放在文末链接中了。

接下来, 打开你的CLI工具下载AutoGPT项目:

git clone /Torantulino/

然后:

cd ‘Auto-GPT’pip install -r

接着找到AutoGPT的根文件夹,将“.”重命名为“.env”并打开。

再将密钥都替换为你准备好的那些。

最后,在终端运行:

python scripts/

如果要使用语音模式,运行:

python scripts/ —speak

如果不能访问GPT-4,开启“gpt3only”模式:

python scripts/ —gpt3only

现在,你就可以开始搞你自己的AutoGPT项目了。

记住在AuroGPT的每个操作之后,输入“NEXT COMMAND”授权程序继续。

尽管项目也提供了不用这么麻烦的“连续模式”,最开始运行时用这个命令:

python scripts/ —continuous

但作者强烈不推荐!!因为它可能会导致你的AI一直运行下去或执行你正常根本不会授权的操作。

如果你非要试试,风险自负……

以及默认情况下,AutoGPT用DALL-e生成图像,要换Stable Diffusion的话,需要一个HuggingFace API的令牌。

本质是“套娃”

简单介绍一下AutoGPT的原理

AutoGPT由于扩大了自己的应用范围,包括执行文件操作、网页浏览和数据检索等,有别于我们之前见过的所有AI(GitHub上已揽获3.6万+标星)。

如Mila研究所前AI研究员@Lior分析:

AutoGPT相当于给了基于GPT的模型一个内存和一个主体(body)。

具体来说:

AutoGPT的架构基于GPT-4和GPT-3.5,靠API连接;

AutoGPT可以进行自主迭代,即通过自我批判性审查来改进输出、在先前工作的基础上进行构建,并为了获得更准确的结果集成prompt历史记录;

AutoGPT具有内存管理,集成了Pinecone数据库,因此它可进行长期内存存储,保存上下文并基于此进行决策改进。

而在推特博主Jay Hack看来,AutoGPT等类似工具的出现,其实证明了智能的本质是“套娃”这件事儿。

因为不论是AutoGPT还是BabyAGI,它们都是用LLM来递归地调用自己。

这在AI领域最近可谓是个大趋势:

专业一点的话来说,这叫模型堆叠,即模型“一路向下”,去套用别的模型来拆解并解决任务。

用咱大白话来说,这就是“套娃”。

除了AutoGPT、BabyAGI这些,还有ViperGPT、SayCan和ToolKit等最新工具,以及前面微软发布的VisualGPT和HugginGPT,都差不多是这个思想。

再往前一些,初代DALL·E其实就是CLIP套VAE。

有意思的是,Jay Hack指出,有着“人工智能元老”之称的马文·明斯基早在1986年就把人类智能描述成有许多相互作用子系统的组织。

最后,Jay Hack也表示,正是因为“套娃”这种操作,我们的AI现在才得以拿下更为复杂的任务。而这,也就离通用人工智能更近一步。

确实,有不少网友都赞同:

AutoGPT可能就是AI领域中的下一大趋势。

面对如此强大的“套娃”工具们,一些人则开始哀嚎了:

密钥获取地址:

https: ///account/api-keys

/