百度搜索引擎千人千面的转型之路

时间:2024-03-18 18:35:00

腾讯没有梦想,阿里没有盟友,百度没有文化……去年一系列对互联网巨头的灵魂拷问没有在2019年结束,这一次的主角还是百度。

1月22日晚间,一篇题为《搜索引擎百度已死》在朋友圈刷屏了,文章指出百度搜索结果一半指向自家的内容平台百家号,充斥着大量营销号和真假难辨的劣质内容,认为「作为搜索引擎的百度已死」。

百度搜索引擎千人千面的转型之路

这一观点也引起了不少争议,有人深有同感,「百家号简直三观不正道听途说指鹿为马」。微博 CEO 王高飞则认为百度只是把「搜新闻」这个需求做成了内生化。

在百度角度,腾讯/头条的资讯搜索都是内生的,凭啥百度要做开放?今天上午百度也对这篇文章作出回应,称百家号在全部搜索结果占比不到 10%。但百度搜索对百家号的流量倾斜也是事实,去年3月百度曾在给站长的一封邮件中宣布「 2018-2020 年 80% 搜索流量将全部分布给优质熊掌号 」。

百度搜索引擎千人千面的转型之路

作为一个搜索引擎,到底应不应该利用自身在搜索市场的主导地位,来为自家的服务和平台导流。

而在移动互联网时代,信息被各种 app 分割成一座座孤岛,搜索不再是人们从网上获取信息的第一入口,这种背景下搜索引擎应该给用户提供什么内容。

这些都是所有搜索引擎,更是转型中的百度必须要思考的问题。

从搜索引擎到「流量工厂」,百度是怎么想的

其实百度搜索中早就存在信息流,不过搜索框和信息流是分开的,这次直接将搜索结果中导向百家号,加上百家号的内容生态确实还不够成熟,不可否认会对用户体验造成影响。

百度搜索引擎千人千面的转型之路

跟过去一直被诟病的竞价搜索一样,百度在商业化和用户体验之间选择了前者。

过去百度将搜索的流量直接变现,如今则用搜索的流量扶持自己的内容产品,这是头条系常见的打法,这一变化也与百度的信息流布局有关。

百度搜索引擎千人千面的转型之路

内容来自百家号

信息流和 AI 是陆奇担任 CEO 时为百度定下两大主航道,在陆奇离开后,信息流依然是百度重点押注的一个方向, 百家号就是百度其中一个信息流产品 。

早在 2017 年手机百度信息流用户月活就超过 1 亿,虽然信息流在百度营收中占比不多,但去年第三季度信息流广告的增速已经超过搜索广告。这两年百度其实已经不是一个纯粹的搜索引擎,而是奉行「搜索+信息流」的双引擎模式。

这背后是互联网广告格局和信息分发模式的改变,这两者都与移动互联网的兴起有关。

搜索广告一直是百度最主要的收入来源,2012 年三分之一的网络广告份额都被百度搜索占据。但随着移动互联网普及,搜索引擎开始式微,不复 PC 时代的辉煌。

百度搜索引擎千人千面的转型之路

▲图片来自:艾瑞咨询

根据艾瑞咨询的数据,移动广告规模占网络广告的比例近 70%,而搜索广告的份额持续下降,而信息流广告则保持着高速增长,收入突破千亿大关。

另一方面,移动互联网也改变了用户获取信息的方式,从主动搜索到在社交媒体等应用中获取,基于算法的分发已经成为主流。

大量信息散落在公众号、头条号和百家号等碎片化的平台中,而搜索引擎也不能再通过爬虫来聚合这些内容。

搜索广告越来越不值钱,信息流越来越受青睐,百度当然大力推广信息流。而信息的孤岛化又让综合搜索的价值打大折扣,不如用这些流量扶持信息流产品,换取更大的价值,只从商业角度考量这似乎无可厚非。

2016 年百度信息流业务上线,百家号和也在这一年上线,信息流广告从跟凤巢推广搭配投放,到 2017 年设立单独产品线,对信息流的资源倾斜已经很明显。

随之而来的是信息流商业变现的压力,据腾讯《潜望》报道,百度去年曾把信息流已调高至 300 亿,而 2017 年百度信息流业务营收还不到 100 亿元。

要维持这样高的增速,百度搜索的流量倾斜是个能短时间见效的方法。

搜索引擎百度死了吗?

百度用搜索给自家产品导流,是不是有「既当裁判员又当球员」的嫌疑,这样的质疑从百度贴吧推出时就开始出现,这个问题归根结底就是搜索引擎究竟应不应该保证搜索结果的公正,也就是所谓的「网络搜索中立」。

与过去对于百度搜索竞价排名近乎一边倒的批评不同,这次有不少舆论认为百度这样做无可厚非,毕竟腾讯和字节跳动等公司也都是这样为信息流产品导流的,百度为什么就不能呢?

百度当然可以,但作为搜索引擎的百度就不一定了。在桌面互联网时代,搜索不仅是人们进入互联网的第一入口,也是连接各个网页的枢纽。

作为互联网的重要入口,搜索引擎虽然蕴藏着极大的商业价值,但是如何让用户快速准确地找到所需信息才是立身之本,也是核心竞争力。

百度搜索引擎千人千面的转型之路

Google 的诞生就是基于 PageRank 算法,1998 年 Larry Page 和 Sergey Brin 在一篇论文中解释了 PageRank 的核心理念,如果一个网页被很多其他网页所链接,说明它受到普遍的承认和依赖,那么它的排名就高。

编者注:PageRank 中的 Page 取自创始人 Larry Page ,而不是网页的意思。

这一算法被认为是*表决式的网页排名技术,给互联网中的网页建立了一种新秩序,后来 Google「不作恶」的座右铭其实也是与 PageRank 的理念一脉相承。

可惜 PageRank 的初衷并没有在 Google 搜索中完全实现,虽然竞价排名机制跟百度不完全一样,但对搜索结果的干预是不可避免的。

去年美国总统特朗普还曾在 Twitter 上发文指责 Google 操纵关于他的的搜索结果,刻意隐藏正面新闻,找到的都是负面新闻。

而且如今 Google 也在搜索引擎中加入自家的信息流产品「Google discover」,形态跟手机百度中的信息流类似,包含了图文和视频等内容。

百度搜索引擎千人千面的转型之路

尽管 Google 没有直接将搜索结果导向信息流内容,但也不避讳类似的操作。2017 年 7 月 欧盟给 Google 开出 24.2 亿欧元的天价罚单,主要原因就是 Google「通过对其搜索服务的主导地位,引导用户使用自己的服务」。

负责调查 Google 垄断案件的 Margrethe Vestager 表示,调查团队在 Google 进行 17 亿次搜索后发现,用户搜索时会优先显示 Google 的产品和服务,竞品的信息通常要到第 4 页才出现。

这显然违反了「不作恶」的原则,但不可否认 Google 依然是目前最好用的搜索引擎,能满足大部分搜索需求。

正如那篇文章说,百家号内容确实参差不齐,起码我自己也已经很久不用百度搜索新闻资讯,但资讯类搜索也不能等同于整个百度搜索的价值,由此推导出「搜索引擎百度已死」也有失偏颇。

再者,以「搜索中立」的标准来要求任何一家搜索引擎其实并不现实。

搜索中立可能是一个伪命题

搜索引擎到底应不应该主动干预搜索结果?这似乎是个两难的问题。

百度过去那些莆田系等竞价医疗广告说白了就是在「作恶」,终于酿成了魏则西的悲剧。但是放任不管也有问题,去年百度首页推荐出现滴滴安全事件遇害者照片相关内容,百度很快就回应称内容审核还不够强,言下之意要进一步加强对搜索结果的干预。

百度搜索引擎千人千面的转型之路

很多时候「搜索中立」只是一种乌托邦式的理想, Google 副总裁 Marissa Mayer 就曾撰文表示网络搜索中立不现实。

搜索引擎利用算法和等式在网上生成顺序和组成,手工操作做不到这一点。这些算法包括决定哪条信息是「最好」的规则,以及衡量的方法。很显然,要确定哪种产品或服务是最好的,这一过程中存在主观性。

诺贝尔经济学奖得主 Kenneth Arrow 在上世纪 50 年代曾提出过一个「阿罗不可能性定理」(Arrow’s Impossibility Theorem):

对任何一种排序机制来说,当排序对象有三个或三个以上时,排序结果不可能永远同时满足给定的几个公正性条件。

在移动互联网普及前,互联网的海量和多样信息已经倒逼 Google 等 搜索引擎不断优化搜索算法 ,这本身就是对搜索结果的一种干预。而在信息被割裂在一个个 app 的现在,如果沿袭过去的模式也未必能更高效。

百度搜索引擎千人千面的转型之路

但这并不意味着搜索引擎可以无视任何原则,一切取决于能否为用户带来价值,就像康奈尔大学法学教授 James Grimmelmann 在一篇讨论「搜索中立」的文章所说的:

关于搜索的中立性,有一点是毋庸置疑的:搜索是用户的自主行为。一个好的搜索引擎,应该比任何一种通信技术都更加着眼于用户的利益。

所以对于搜索引擎来说,真正的问题应该是:是否有什么结构性的力量会妨碍到提升用户的自主性?

那些搜索中立的拥护者,实际上是将网站利益置于用户利益之前。但是,网站通常不是用户的朋友。在某些情况下,它们是;但更多时候,网站需要流量,并会不惜任何手段来抓住用户。

搜索引擎到底应不应该干预搜索结果,这可能是个不需要考虑太多的问题,关键在于怎么去干预。百度是最大的中文搜索引擎,如果把商业变现建立在践踏用户体验的基础下,也无异于饮鸩止渴,「搜索引擎百度已死」将成为一个预言。

在 2019 年第一个工作日,李彦宏在百度内部信中表示:

那个能够做出好产品、那个受用户喜爱的百度,已经回来了!

嗯,还真是。

百度搜索引擎千人千面的转型之路

来源:爱范儿 作者: 李超凡

出处:卢松松博客

转载于:https://my.oschina.net/u/3938111/blog/3005966