ChatGPT与文心一言对比思考
1. 目前在国内比较广泛被认知的ai模型有什么
我目前通过各种渠道注册到的账号有3个,按照了解到然后注册的顺序分别是
- ChatGPT
- newbing
- 文心一言
- 3种ai的注册渠道
-
ChatGPT注册:
- *
- 注册
- 寻找外网手机号
- 发送短信
-
newbing注册:
- *
- 注册微软账号
- 申请资格(我大概等待了2个星期多的时间)
需要使用微软最新的浏览器,两种方式- 把自己账号的归属地设置成国外,在搜索页面即可看到聊天按钮
- 在浏览器右上角有一个按钮,它提供了3中聊天模式:更有创造力,更平衡,更精确
-
文心一言注册:
- 百度账号
- 申请(邀请码)
- 填写公司资料以及应用场景
-
2.为什么是百度
在进行对比之前我么首先聊一下,chatgpt出来之后各个大厂肯定都会有自己的想法,去做属于自己的产品,那么为什么是百度首先推出了自己的产品呢,基于我自己的浅薄认知我认为是以下几个方面:
- 基于自己的搜索业务在数据上来说百度拥有更全面的数据
- 在技术层面,百度一直在进行人工智能方面的探索
- 在框架发面有自己的飞桨
- 硬件方面自己的芯片昆仑芯
无疑各个层面上百度拥有自己得天独厚的优势,所以它在chatgpt发布后短时间内能够拿出来自己的对标产品。
3.种AI的使用感受是什么
目前来说3种AI模型给我的感觉各有侧重点:
-
ChatGPT无疑更加的全面,在编程进行搜索的时候回给出我最直接的答案,而且正确率奇高。
-
Newbing更多的是集中在和自己的搜索引擎相结合上,所以给出的答案文字描述更加的偏向于解释,并附上自己答案的出处。值得一提的是,Newbing中其实对接的是ChatGPT4.0,所以他具备这上次我们讨论中所说的常理认知能力。
-
文心一言,很全面,有对话,图片生成,文本创作等等,但是体验总体来说一言难尽。
下面我们来看一下我们比较关心的ai对编程问题的回答能力,我来问一下简单的php问题
ChatGPT:
Newbing:
文心一言:
我们可以看到ChatGPT和Newbing其实都给出了自己的正确答案,但是Newbing并没有给出直接的答案,但是推理出了你的下一步的行动。当我们点击示例代码后,给出了确切的答案。
在这个基础上我们在测试一些常识性问题的测试看一下它们是否真的智能,我一开始其实也很困惑应该问什么问题,直到我发现了百度贴吧“弱智吧”,这个贴吧真是给了我很多好的问题。接下来我问了他们几个问题:
- 蓝牙耳机坏了,去医院挂牙科还是耳科?
- 被五步蛇咬了倒退五部可以把蛇反杀掉吗?
- 十斤脑洞是多少斤?
- 为什么贝多芬不出新单曲了?
他们的回答分别是:
ChatGPT:
Newbing:
文心一言:
3.为什么会有这样的结果
目前从我的认知中,我把原因归结在训练量的问题中。上次我们提到当数据量达到某个量级的时候,AI好像忽然具备了灵长类动物的某些思考的特质,通俗点说好像具备了常识推理和思考的能力。通过公开的资料我们可以查询到ChatGPT的训练量在去年12月份的时候是1750亿参数,而现在是100万亿级别参数,它经历了一个指数级的增长。目前初步它达到了人脑所具备210万亿-240万亿神经元突触的级别,所以好像表现出了智能。那么文心一言的数据量规模呢?
万亿级网页数据,数十亿搜索资源等等,我不知道在ChatGPT中怎样的数据算作一个参数,那么简单的把每个点算作一个参数进行累加,文心一言的参数级别是1.5万亿级别。所以在数据量方面无疑存在了巨大的差距,还远远没有达到ChatGPT的量级。
那么当文心一言也达到这个量级的时候是否也可以表现出这样令人惊艳的效果呢?我不得而知,并且相对来说持一个相对悲观的观点,毕竟文心一言是在ChatGPT发布后紧急开发出来的产品,但是经过多次的迭代之后呢?我觉得是可以的,而且这个时间不会特别久,毕竟在前面已经有了一个demo,路都是明确的,可能就像设计出来第一个自行车和仿造一台自行车一样,当然这只是我自己的理解。
5. Ai对各个职业会造成冲击吗
我的第一个想法肯定是,会。但是具体有什么样的冲击,造成多大的冲击我并不知道。正好OpenAi公司刚刚发布了自己的一篇论文《大型语言模型(GPT)对劳动力市场影响潜力的早期研究》。这篇论文中讲了自己的相关技术什么的balabala一大堆,我们用chatgpt对其中的要点进行提炼,然后拿出我们最关注的对职业造成的影响,这个文章中提到:
- 使用了一个新的评估方法,根据职业与GPT能力的对应程度进行评估。
- 大约80%的美国劳动力可能有至少10%的工作任务受到GPTs的引入的影响,而约19%的工人可能看到至少50%的任务受到影响。
- 影响涵盖了所有工资水平,高收入工作可能面临更大的风险。值得注意的是,影响并不局限于近期生产率增长较高的行业。
这里面提到的新的评估方法引入了一个暴露率的概念,他指的是使用GPT后是否可以使人执行这项工作所需要的时间减少至少50%。在美国80%的劳动力工作任务收到了至少10%的影响,也就是说80%的工作暴露率为10%,19%的工作率暴露率达到了50%,而且工资越高的人收到的影响也越大。他们对高暴露率的工作做了个展示:
工作效率的提升意味着所需要人员数量的减少,脑力劳动的岗位减少是显而易见的。他们同时还提到了虽然岗位减少,但是从业者的收入其实是增加的。但是在国内是否会有一致的走向,从字节跳动走出国门吊打资本主义这件事上来看估计不太行得通。综上来说学会使用AI模型,甚至善于引导AI给出自己想要答案无疑是以后我们需要掌握的一个技能。我甚至在想,也不止一次跟朋友提到不远的将来可能就会有专门的一个职业叫做AI引导师,那么我们是否能够通过我们这个职业的优势
本文中的引入了B站up主所长林超的观点和资料,同时加入了一些自己的思考,如侵删