大数据开源商业化领域近日有一个爆炸性新闻,“Confluent 收购 Immerok”,字越少事越大,先给大家简单科普一下 Confluent 和 Immerok 这两家公司,Confluent 是掌控 Apache Kafka 社区的大数据开源商业化公司,Immerok 是 Apache Flink 创始人团队二次创业创办的公司。
说这件事之前又不得不提一下那家由 Apache Flink 创始人第一次创业创办的公司 Ververica,没错,正是前几年阿里巴巴花了 9000 万欧元收购的那家德国公司,但是被阿里收购后,Flink 创始人团队成员于22年初都陆续离职了。更魔幻的是这帮人离职后竟然直接创办了 Immerok 这家公司,而 Immerok 主要做的事情和 Ververica 无比相似,相当于 Flink 创始人团队另起炉灶和阿里对着干,这件事背后的隐情谁也不知道,但是吃瓜群众都有一个大大的问号 “没有竞业协议吗???”。阿里这一次无疑是哑巴吃黄莲有苦说不出,9000 万欧元最终买到的可能只有 Flink 社区的主导权。
上面说的这些事情是发生在22年初, Immerok 这家公司也是在那个时候成立的,然而仅仅不到一年的时间,这家初创公司就被 Confluent 收购了,这一操作让吃瓜群众再一次傻眼,不得不佩服 Apache Flink 创始人团队整活和整钱的能力,也不得不佩服阿里把一把好牌打得稀烂的能力。
话说回阿里收购 Ververica 之后, Flink 表面上好像发展得还不错,阿里自研的 Alink 合并到了主分支,国内越来越多公司用上了 Flink,阿里云的 Flink 生意看似也做的风声水起。但是这只是在国内小打小闹,Ververica 应该有更大的目标才对,他对标的应该是国外有大数据第一股之称的 Databricks(Apache Spark 背后的大数据商业公司,百亿美元市值),从近几年在国际上不温不火的表现来看,阿里这些年做的无疑是失败的。
另外说到 kafka 大家也很容易想到另外一家做流计算的公司 StreamNative(Apache Plusar 背后的商业公司),这起收购案也会给 StreamNative 带来一些压力,可能会加快流计算领域的布局,但是这并不算是致命的威胁,因为毕竟做 Flink 商业化且做的不错的公司可不止创始人团队那一家。
再说回 Confluent 收购 Immerok 的事情,猜测一下,大概率是做 Kafka和Flink的深度集成,两把流数据处理领域的利刃结合,不知道会擦出什么样的火花,可以预知的是动作肯定不会小,毕竟收编的可不是普通的 Flink PMC。如果有大动作的话,那和阿里的 Flink 团队对社区的发展方向势必会出现分歧,社区走向就会变得扑朔迷离。
虽然一般来说创始人团队对开源社区的话语权是最大的,但是对于 Flink 来说,毕竟之前和阿里做了一笔交易,名义上已经是把主导权卖给了阿里巴巴,创始人们个个也都赚得盆满钵满,现在再转过头来阿里对着干,在道德上和舆论上其实都很难占到上风。而且争夺 Apache Flink 社区掌控权这件事,无论成功与否都会对 Flink 社区造成了很大的内耗和伤害。
其实这种事件在开源领域并不少见,就比如大家熟悉的 facebook 主导开的源项目 Presto,是三位创始人(史称 presto 三巨头)在 facebook 工作时开源的,但是他们对 Presto 的发展方向并不满意,因为方向实际上是被 facebook 的需求所掌控的,所以最终他们三离职后创办了 Starburst 这家公司,关键是这家公司并不是做 Presto 的商业化,而是另起炉灶,从 Presto fork 出来一个分支,创建了 Trino 项目,以这种方式让 Presto 朝自己想要的方向发展。目前来看,虽然 star、fork 这些数量比不上 Presto,但是 Trino 的社区活跃度已经超过了 presto。
Trino 这个剧本,会不会被 Flink 创始人团队拿到,也许现在最担心这件事发生的就是阿里了,作为吃瓜群众也无法得知 Flink 创始人团队离职的原因是不是对目前阿里主导的社区发展方向感到失望,如果是的话,走上和trino类似的道路也不是不可能。
说实话社区的分裂对用户来说并不是一件好事,多了选择和学习的成本。对开源社区来说也不是一件好事,无法集中火力干好一件事。但是为了利益,这样的案例总是层出不穷,只希望能给后面的开源商业化公司提个醒,不要走上类似阿里这样的冤种大道。