1.数据自服务门户的定义
数据自服务门户是为企业所有用户提供集成的,统一的数据相关产品和服务唯一的入口,所有的数据用户能够在数据自服务门户中找到所需要的数据和数据产品,数据工具和平台,在这个平台上进行数据的开发生产,协作分享等相关工作。
数据自服务门户是所有数据应用,数据资产,数据产品,和用户活动等,通过一个统一的平台进行展示,连接,将原来分散的,割裂的数据资产统一呈现,从而集中的管理和发挥数据的价值。
数据自服务门户是数据中台的入口,数据中台的所有组件功能都是通过数据自服务门户来集成,用统一的体验提供给用户的。
2.数据自服务门户的5大价值定位
对于企业来说,数据自服务门户的价值主要体现在以下5个方面,如下图6-10所示:
图6-10数据自服务门户的5大价值定位
(1)统一入口
将过去割裂的,分散的,数据资产,应用,工具都统一起来,通过一个入口提供给用户,避免用户的多次登录,一站式解决所有问题,这是数据自服务门户的核心价值。
当前企业的数据用户是非常痛苦的,不知道自己企业都有什么数据,这些数据都在哪里,哪些是能访问的,哪些是不能访问的。
所有的一切都要通过开会,培训才能知道,而这一切都是滞后的,现在的很多企业并不缺少数据,而是缺少数据共享,协作的机制。
数据自服务门户就是从根本上解决这个问题,让一个入口,一个平台,一套体系,一个身份就能访问企业最新的,所有的能访问的数据,数据产品和数据相关的系统。
(2)整合资源
统一入口,让所有的数据相关的资产,资源,工具,技术,项目都在一个平台上展示出来,通过企业级搜索,让用户能够更便捷的查找。通过数据自服务门户,能够最简化地整合所有的数据相关的资源,提高协同效率。
(3)推动协作
过去企业的数据缺少协作,不是因为没有需要,而是因为没有协作的条件,要数据,不知道找谁,到处打电话问,好容易问到了,结果要看数据,需要审批,走流程,等走了半天了流程拿到以后,发现不是自己要的数据,折腾一圈,业务都耽误了,所以每个团队只要拿到了一份数据一定会在本地保存一份,留着以后再用。可是等下次在使用的时候,其实本地的版本已经滞后了。数据自服务门户让数据资产更容易的共享,流转,交换,集成,从本质上让协同变着简单很多,这样就能指数级的推动企业的数据协作。
(4)价值运营
数据的价值随着连接,集成和分享的次数而增加,必须要让数据流动起来,数据才能产生更多的价值。对于数据自服务门户来讲如何能够让企业的数据生产方,消费方更多地分享数据,利用数据自服务门户的各种工具来加工数据,交易数据产品,是能否最大化发挥数据价值的根本。这就需要很强的运营能力,设计价值度量体系,数据产品营销活动,让可信的数据集和数据产品能够被更多的用户所看到,引导用户去解决企业最有价值的业务问题等。
数据自服务门户是一个强运营型的平台,必须要建立专业的运营团队来支撑数据自服务门户的业务。《精益数据方法论》第6.2.4节会详细介绍企业数据自服务门户的运营策略。
(5)赋能全员
数据的开发和利用是一个比较专业的技能,在很多传统企业,由于数据工作者的稀缺性,导致很多数据需求只能排队,等待数据团队的带宽。数据自服务门户能够用简单易用的工具和流程,赋能不懂数据和技术的业务和管理人员来快速掌握一些基础的数据分析工具,从而做到数据自服务,减轻数据工作者的压力,同时也提升了业务人员的数据意识和能力。
6.2.2 企业数据自服务门户的核心组件
数据自服务门户包括以下核心组件,如图6-11:
图6-11 数据自服务门户的核心组件
1.个性化首页
数据自服务门户最重要的功能就是首页,每个用户一登陆,就应该能够把自己常用的功能一览无余,要尽可能地减少一层层地打开菜单。所以,个性化首页是非常重要的,每一个角色都可以定制自己专属的个人门户,能够自己配置首页和定制管理模块,像定制手机桌面一样,让每个人的首页布局/功能/展示风格都不一样。比如,管理人员的首页一般把实时状态,待办事项,告警事件等放到醒目的地方,而数据工程师则把我的项目,热度最高的10个数据集这样的内容放到首页中间。
企业数据自服务门户是一个开放性,可集成可扩展的平台,通过技术协议,将企业所有的数据相关的应用和功能都集成在一个视窗里,让用户感觉不到散落在各地的数据应用和资产,促进了企业级的数据协同和生产。
2.内容管理平台
企业数据自服务门户的内核其实是一个内容管理平台,企业可以定义自己的各种栏目,然后各个栏目交由不同的部门角色去管理,栏目的运营人员可以发布管理自己的内容。
3.数据产品/服务市场
数据产品/服务市场,是数据生产者和数据消费者进行交易的平台,每个用户同时都具有双重身份,既是数据的生产者,也是数据的消费者。它可以上传自己的数据集,数据产品也可以搜索,查找其他用户发布的数据集和数据产品。数据产品/服务市场还需要支持撮合交易,订单管理,运营监控等类似于电商平台的功能。
4.数据资产目录
数据资产目录是大数据自服务门户里最核心的功能,用户可以通过数据目录查看,管理自己可以浏览和访问的企业数据资产,包括数据源/数据产品和各类数据服务,用户还可以订阅数据资产的更新信息,获得及时地推送。
数据资产目录可以是一个独立的系统,通过单点登录和集成变成了数据自服务门户的一个组件。
5.企业级内容搜索
数据自服务门户包括大量的文章,内容,数据资产,用户评论等,要想提高用户的使用体验,必须能够快速简洁地找到他想要的内容,所以高效的企业级数据搜索是必不可少的。
企业级搜索提供了快速/全面根据特定规则找到相关数据资产/服务/数据源/内容等所有信息的功能,也是大数据自服务门户里使用频率最高的一个功能。
6.数据探索平台
当用户通过浏览或者搜索找到对应的数据源或者数据产品的时候,数据探索功能提供了各种进行数据探查,浏览的工具集,从而让用户可以对数据对象有一个全面的了解。数据探索平台与数据资产目录需要形成紧密的集成,并且探索的工具需要随着新技术的出现不断增加。
7.数据创新平台
数据创新平台集成了从想法提出到数据实验,到最后模型验证,MVP产品测试的全链路功能,让业务人员/数据人员和技术人员在一起围绕业务目标基于数据做各种创新试验。对于大型企业来说,数据创新平台是持续创新和打造数据驱动的文化的引擎。本书6.4节重点介绍了数据创新平台。
8.数据标签体系
为了让用户能够更高效的查找,管理海量的数据资产,数据标签体系是很实用的功能。每一个数据产品,数据服务,数据集,包括文章,内容,都可以打上标签,常见到可以设置为作者/业务领域/时间等,还可以打上用户自定义的标签,从而提高数据利用的便捷性和协作的效率。比如,原来在传统的报表系统里,业务人员对一张报表的数据有疑问的时候,只能通过组织结构去反馈,这个效率是极其低下的,而有了作者的标签后,加上大数据自服务门户内置的实时协作工具,他可以直接和数据产品的产品经理对话交流,就能大幅度提高效率。
9.数据自服务工具包
大数据自服务门户为不同的角色提供了对应的数据自服务工具包,包括各类专业的数据分析和挖掘工具,比如Tableau等。
比如,业务人员可以使用在线的Excel表格或者是所见即所得的编辑器,数据工程师利用ETL工具或者是代码编辑器,数据科学家就是jupytor或者是matlab等,不同的角色都能够利用这些自服务工具包去在“玩”数据,从而发现业务的价值。数据自服务门户应该支持用户自己灵活的配置自己所熟悉的主流工具包。
10.沟通协作工具
数据的开发是一个集体活动,企业数据自服务门户应该提供了便捷的沟通协作工具,让在不同地点的员工可以远程沟通,协同工作,主要包括大规模讨论的论坛,点对点沟通的即时通信软件,开发人员的协作编程等。
11.门户运营看板
数据自服务门户本身就是一个数据产品,它的运行状态如何,当前有多少用户访问,有多少用户在访问哪些数据产品和服务,停留了多久,大部分用户都在哪一个栏目,那篇文章最受欢迎?这些运营数据不仅对于运营人员有价值,对于用户也非常有参考意义,用户可以设置自己关注的对象都浏览了哪些栏目,当然要在对方打开浏览记录的前提下。
大量的企业进入了与海量数据博弈的阶段,如何能够驾驭这头不断增长的巨兽,企业自服务数据门户将是2023年,首席数据官必须关注,思考并且建设的数据应用基础设施。