记者 | 周翔
AI 在中国到底有多热?下面的一组数字或许可以说明。
去年 12 月,旷视科技完成 1 亿美元的 C 轮融资。
今年 5 月,依图科技获得 3.8 亿元人民币的 C 轮融资。
两个月前,成立不到 3 年的商汤科技获得 4.1 亿美元的 B 轮融资,估值超过 15 亿美元。此举不仅创下全球 AI 领域单轮融资最高纪录,商汤科技也成为全球融资额最高的 AI 独角兽企业。
而以上这些,还只是计算机视觉领域的创业公司。
不管是不是虚火,在国务院印发的《新一代人工智能发展规划》 的加持下,商汤科技的融资额显然触动了圈内圈外人的神经。
不过,商汤内部是如何看待此次融资的?融到的钱要怎么花?AI科技大本营采访了商汤科技联合创始人杨帆,希望对这家“网红”公司做一个全面扫描。
商汤科技联合创始人、副总裁——杨帆
商汤凭什么“这么贵”?
相比竞争对手,商汤如此高的融资显然让人“眼红”,甚至有人在网上质疑这个数字的真实性。
不过,杨帆并不在意这个“猜疑”,毕竟鼎辉、赛领、华兴、基石等 20 来家大型投资机构都出面背书。
在他看来,商汤之所以比旷视、依图等“更贵”,主要有两方面的原因:
首先,作为一个以技术为核心的公司,商汤的核心团队具有非常强大的原创能力。 除了在每年都在计算机视觉的三大*会议 CVPR、ECCV、ICCV 上发表多篇论文之外,商汤在 LFW、ImageNet 等学术界主流竞赛中也取得了令人瞩目的成绩。此外,商汤还拥有 350 余件专利,其中 90% 为发明专利。
其次,商汤有强大的技术变现能力。目前,商汤已经拥有超过四百多家企业客户,中间不乏银联、小米这样的头部客户。
除此之外,这或许也跟商汤所处的领域也有关系。毕竟,目前商业化最好的 AI 领域还是计算机视觉,这也决定了商汤的“钱途”。杨帆向AI科技大本营解释了为何“视觉”如此重要。
过去互联网三十年最盈利的是谁?搜索引擎。搜索引擎就是把世界上所有的信息全部呈现给用户。文字信息是经过二次提炼的,信息提炼成本比较高昂,而且提炼的过程中会有信息损失,或者掺杂信息。影像则是人类跟外界进行交互时信息量最大的方式,而视觉占据了人类与外界进行信息交互中超过 90% 的比例,当你具备了较好的结构化提炼和分析传输这些视觉信息的能力时,它带来的价值是远远超出想象的。
融到的钱要怎么花?
围绕着计算机视觉,目前商汤最大的业务依然是安防、金融、以及基于智能手机的解决方案(比如智能相册、智能美颜等)等。但是,商汤的野心显然不止于此。
杨帆表示,在获得融资之后,除了会扩大对底层技术平台的投入之外,还会拓展新的领域:
首先,底层平台需要持续的人力资源投入。在视频内容的理解等问题上,机器能够做到的跟人的差距还非常大。
第二,我们在提供解决方案的时候,需要跟行业伙伴合作,因此我们有必要更多地去了解行业的上下游,在这个过程中牵扯到技术的迭代演进,这样我们的解决方案才能够更加有针对性。
第三,我们会对一些行业提前布局,包括无人驾驶、医疗影像等等。
据介绍,商汤从去年就开始发力无人驾驶,如今已经跟世界前五的某一家汽车企业形成了非常深入的合作,未来会投入更多的资源。
存在哪些技术挑战?
当然,计算机视觉的“钱途”可期,但是也面临诸多技术障碍。毕竟目前的 AI 大多处于“感知”阶段,离真正的“认知”还有很长的距离。
商汤也是如此。
过去,商汤主攻的方向集中在感知领域,但是如今商汤正在往更深的领域拓展:
一个方向是图像智能增强。如果你真正的去做一个影像认知类的解决方案,那么从一开始就要去考虑怎么做,比如你做安防,拍过来的影像里面人都是花了,你就要考虑怎么去解决(这个问题)。
另外一个方向,当我们真正的去深化做行业解决方案的时候 ,你会发现里面的技术问题不再是单纯研究技术点。比如一千多个视频放在一起,我要做一个快速的内容搜索,它其实是一个纯粹视觉类技术的研究问题和大的系统工程问题的混合。
此外,深度学习背后最本源的机理这样的底层问题也是商汤研究的一个方向。
然而,这一波深度学习、大数据和强大计算力引发的 AI 复兴并不能解决所有问题,虽然整个行业都在进步,但是依然面临诸多挑战。杨帆表示,目前的挑战主要有两类:
第一个挑战:深度学习做的越好,就需要把网络搞的越深,这就意味着大量的计算成本。如何把识别做的更好、网络做的更深的同时,对网络的结构进行优化,优化它的计算开销,这个其实是整个人工智能行业所面临的一个共通的问题。
第二个挑战:今天深度学习的认知还是依照大量的数据,如何减少对数据的依赖,是需要(我们)去做的。
此外,虽然中国在 AI 应用技术的研发和落地上可能已经走在了世界前列,但是在基础领域的科研上,跟美国的差距依旧巨大,这也是整个中国面临的挑战。图灵奖首位亚裔获奖者姚期智就认为,中国人工智能弱点在系统和理论,如果想让计算机科技全面发展,工程和理论都必须兼顾。
杨帆也持相同观点,“国内还是太偏应用型科研,而基础科研解决的是最本质的问题,深度神经网络为什么能 work?为什么机器就能比人学得好?他会去思考这些问题,我觉得在那个层面上,国内其实做的还是太少。”
怎样看待竞争对手?
当然,除了技术方面的挑战之外,商汤也面临诸多的竞争对手。除了旷视、依图这些初创算法公司之外,一些大公司也在发力计算机视觉。
比如海康威视是目前安防领域的龙头,提供硬件+软件的全套解决方案,而商汤目前最大的营收也来自安防。但是杨帆认为,商汤提供的是平台化的能力,这种模式的益处是具备很好的开放性,跟合作伙伴具备可追溯性,而不同行业的公司肯定需要做一些这样的工作,最终还是看结果说话。
不过,BAT 这些科技巨头也都将自己定位平台型的公司,并通过自己的云平台提供包括计算机视觉在内的 AI 能力,商汤如何与这些大公司进行差异化的竞争呢?
杨帆似乎并不担心。
我们其实跟他们的差异蛮大的,从美国到中国,所有的高科技公司,都在拥抱 AI,都在把 AI 作为头等战略,我觉得这个毫无疑问说明了这件事情的重要性。但是,任何一个商业化的公司,特别像 BAT 这种体量的公司,它们 AI 技术的演进目的,以及它们提供的 AI技术解决方案,一定是要去服务于本身的商业战略和规划的。
商汤提供了什么?商汤的 AI 战略是为不同行业企业提供解决方案,帮助它们解决现有的问题,在这一点上,我觉得从 BAT 每家都会有自身最重要的业务和发展方向,他们的AI会优先去解决这些东西。所以在这个点上,我觉得其实大家不存在冲突。
但是,就像如今的互联网几乎被几家大公司垄断一样,未来计算机视觉领域到底能容纳多少玩家?最终也会赢家通吃吗?
杨帆对AI科技大本营表示,
任何一个市场最终都是一样的,都是一个长尾的状态,就算是互联网,其实它仍然也是一个长尾的状态,头部(公司)一定是很少数的,然后会有一些长尾在一些细分行业活下来,这是大概率事件。
此外,AI 和互联网不一样,AI 本身不是一个行业,计算机视觉本身也不是一个行业,它其实是多种行业的一个行业的结合体,或者说它是一种生态,在这个过程中,我相信大家都能够找到一个最适合自己发展的位置。
怎样与BAT争抢人才?
不过,就算某些业务不存在冲突,但是人才的争夺却是商汤不得不直面的问题。
据杨帆透露,目前商汤的研发人员占整体员工的 70% 以上,差不多有 300 多人,包括 18 名教授、以及 120 余名来自世界名校的博士生。
然而,由于 AI 近几年的突然爆红,相关人才的培养速度已然跟不上业界的需求,这些 AI 人才的工资也跟着水涨船高。腾讯发布的报告显示,AI 相关的技术岗位,30万-60万年薪基本上是比较主流的收入水平。
在 AI 人才吃紧、薪资高涨的情况下,商汤要靠什么与 BAT 等巨头争抢人才呢?
杨帆表示,提供非常有竞争力的薪酬只是一方面,对于真正顶尖的人才而言,他们非常看重以下两点:
第一,企业是不是能够给他一展所能的空间和机会。怎么理解?你高薪挖了一个人,或者挖了一个团队,但是这个团队他想要做一件事情,或者想把一件事情落地,它的周期非常长,流程非常复杂,对于真正优秀的人才而言,这种情况是很难受的。
第二,优秀人才非常看重人才的集聚性,也就是说他们之间会彼此相吸。他会觉得我需要一些跟同等水平的人在一起工作,才能更大发挥我的价值。
而且,商汤对转行做 AI 的人才也并不排斥。杨帆认为,从产品化落地的角度来说,这样的人才是非常有价值的。
是否存在泡沫?
回到商汤 4.1 亿美元的融资额,当时这个数字超过了很多人的心理预期。但是,在 AI 创业如此火热的浪潮下,4.1 亿美元这个记录被刷新很可能只是时间问题。
腾讯研究院发布的《2017 年中美人工智能创投现状与趋势研究报告》统计数据显示,截至2017 年 6 月 31 日,中国 AI 公司总融资金额达 635 亿元,位居第二,占据全球 AI 公司总融资额的 33.18%。同时,数据显示, 中国 AI 企业获投率为 69%,超过美国企业的 51%,呈后来居上之势。
那么,这是否预示着泡沫呢?
在杨帆看来,AI 创业领域不仅存在着泡沫,而且泡沫很大,而这个泡沫的罪魁祸首就是因为不专业的人太多。
今天我们的问题是,大家恨不得一对这个东西有一些简单的认知和了解,就投入到这个行业去做相关的事情,我觉得其实这个是最大的泡沫。我觉得任何时候,任何地方,在今天这样一个高度分工的社会,一定是最专业的人来做最专业的事。
但是,任何事物都有两面性。比如 1995~2001 年期间的互联网泡沫,就为如今移动互联网的兴盛留下了诸多宝贵的遗产。这一轮AI泡沫,显然也不是百害而无一利的。
杨帆认为,在未来的十年中,AI会形成非常大的趋势,会比大多数人想象得更加深刻地去改变生活的每一个角落,而泡沫的好处就是让更多的人感受到这样一股大的浪潮的来临,并且为之做好接纳的心态和准备。
— End —
AI公开课
主题:让机器读懂你的意图——人体姿态估计入门
时间:9月26日晚8点
嘉宾:曾冠奇,便利蜂智能零售实验室团队负责人
内容:
人体姿态估计在新零售的应用点
人体姿态估计的整个知识结构树
人体姿态估计一个流派的论文、算法和代码解析
扫码报名
主题:深度学习中基础模型性能的思考和优化
时间:已结课(可看复播)
嘉宾:吴岸城 菱歌科技首席算法科学家
扫码学习:
主题:XGBoost模型原理及其在各大竞赛中的优异表现
时间:已结课(可看复播)
嘉宾:卿来云 中科院副教授
扫码学习:
主题:深度学习入门及如何转型AI领域
时间:已结课(可看复播)
嘉宾:覃秉丰 深度学习技术大咖
扫码学习:
以上课程都是免费的哦,快上车~~
☞ 点赞和分享是一种积极的学习态度