OpenAI chatGPT火爆出圈,世界悄悄发生着变化
这几天 chatGPT刷爆了朋友圈,它是一个智能聊天引擎,本来人工智能聊天机器人也不算什么新鲜东西,但是由于它的表现过于出众,拉开同类产品一大截,因此引发了破圈效应,引起了很多人的注意。
一、为什么突然火起来了?
2020年7月,OpenAI(一家公司)提出了包含175 billion (1750亿)个参数的GPT究极进化版模型GPT-3,作者们在发布的论文中证明,不通过梯度更新或参数精调,就能在对话、翻译、推理和分类等任务上取得初始的成果。
- 论文下载地址:https://arxiv.org/pdf/2005.14165.pdf
官网公布了GPT-3提供的服务,有49种之多,包括机器翻译、代码Bug修改、智能对话、论文写作、语法纠正和文章关键词提取等。以下是GPT-3提供的部分服务:
之所以吸引了大家的眼球,一方面是因为模型本身性能的强大,另一方面也是因为GPT-3是第一个将模型转换为付费服务的产品。OpenAI公司基于“Model as Service”的理念,向用户传达了一个信息:GPT-3不是一个停留在实验室的Demo,而是真的能产生实际价值,其中chatGPT的火爆出圈就是一个例子。
二、ChatGPT功能实例
2.1 AI聊天
2.2 AI写新闻稿
2.3 AI写代码
2.4 AI写论文
题目:生成一篇关于新冠病毒的论文提纲
题目:生成一篇关于新冠病毒的论文,小于3000字
2.5 AI画画
题目:三个人在吃火锅
题目:四个人在钓鱼
2.6 chatGPT是怎么训练的
chatGPT好像是离线训练的,想想这么大规模的模型,训练一次花费的代价还是蛮大的。猜测训练的时间是2021年,因为问它2022年的事情它就不知道了。
三、如何使用OpenAI的ChatGPT功能
那么,GPT-3和上面演示的chatGPT是什么关系呢?答案是chatGPT只是GPT-3其中的一个服务,其他的服务广大人民群众关注得少。
值得注意的是,OpenAI是一个盈利的组织,GPT-3是要收费的,目前只有codex和chatGPT是免费的,且Dalle2(AI画画)仅提供免费200张图片。
另外,OpenAI为众多国家开放了白名单,中国不在首批开放的国家列表中。它会检测你的IP所属的国家,并拒绝白名单外的地区访问。因此,国内是访问不了它的服务的。如果您在拥有访问权限的地区,可以通过一下步骤体验服务:
- 登录官网:
- 聊天请登录:https://chat.openai.com
- AI画画请登录:https://labs.openai.com
- 查看所有功能请登录:https://beta.openai.com/examples/
- 注册账号,网上有很多教程[1],比如这个。
- 使用功能。
四、如何使用OpenAI的GPT-3其他功能
GPT-3一共提供了4款模型供用户选择,分别是:Ada、Babbage、Curie和Davinci,特点不一样,价格不一样。Ada是最轻量、响应最快的模型,Davinci效果最强大,可以应对复杂文本推理和因果分析。
- Ada Good at(擅长): Parsing text, simple classification, address correction, keywords
- Babbage Good at(擅长): Moderate classification, semantic search classification
- Curie Good at(擅长): Language translation, complex classification, text sentiment, summarization
- Davinci Good at(擅长): Complex intent, cause and effect, summarization for audience
每位用户在开始的3个月中,有18刀的免费额度。以Davinci为例,0.06美金可以调用1000个token。后面只需要为你使用的资源付费,如果想在某些子领域内获得更好的性能,还可以通过特定数据微调GPT-3,同样也是按token收费。
如何将模型用到自己的代码中,直接导入openai模块(import openai),就像下面这样:
import os
import openai
openai.api_key = os.getenv("OPENAI_API_KEY")
response = openai.Completion.create(
model="code-davinci-002",
prompt="class Log:\n def __init__(self, path):\n dirname = os.path.dirname(path)\n os.makedirs(dirname, exist_ok=True)\n f = open(path, \"a+\")\n\n # Check that the file is newline-terminated\n size = os.path.getsize(path)\n if size > 0:\n f.seek(size - 1)\n end = f.read(1)\n if end != \"\\n\":\n f.write(\"\\n\")\n self.f = f\n self.path = path\n\n def log(self, event):\n event[\"_event_id\"] = str(uuid.uuid4())\n json.dump(event, self.f)\n self.f.write(\"\\n\")\n\n def state(self):\n state = {\"complete\": set(), \"last\": None}\n for line in open(self.path):\n event = json.loads(line)\n if event[\"type\"] == \"submit\" and event[\"success\"]:\n state[\"complete\"].add(event[\"id\"])\n state[\"last\"] = event\n return state\n\n\"\"\"\nHere's what the above class is doing:\n1.",
temperature=0,
max_tokens=64,
top_p=1.0,
frequency_penalty=0.0,
presence_penalty=0.0,
stop=["\"\"\""]
)
五、总结
AI有三要素:算力、算法和数据。在前两者固定的情况下,GPT3通过庞大的规模带来了震撼的影响。更为重要的是,它基于“Model as a Service”,成功实现了“产品化”,考虑了很多不同的业务场景,形成了一条可盈利的商业模式,使得人工智能从实验室走向了产业。
利用当下的技术和数据积累,产出服务和价值,继而获取更多的需求和数据,是一个良性循环[2]。长此以往,一定能形成真正的壁垒。
旧时王谢堂前燕,飞入寻常百姓家。
参考资料
[1] https://www.yanlutong.com/gonglue/30511.html
[2] https://zhuanlan.zhihu.com/p/436160702?utm_campaign=shareopn&utm_medium=social&utm_oi=41495855890432&utm_psn=1584596619407843328&utm_source=wechat_session