画像不应该是堆积如山的标签
每一个画像都应该承载价值
本文为大麦网高级数据工程师王志伟在U-Time巡回上的分享。
阅读之后,你会对用户画像的构建及标签应用有新认知。
以下为演讲精选:
我是大麦网的王志伟,从事数据行业七八年,在流量数据、数据埋点、数据运营和数据应用方面有一些经验。今天抛两个点:画像的三个基础点(精准、多样、清晰)、画像应用。
——画像建设及三个基础点——
我们不需要有很多画像,但结构一定要清晰,维度要多样,数据要精准。哪怕有GB、TB甚至有很多样化的数据,如果我们不了解业务,很难落地应用。
例如,某个性化推荐场景,从去年10%的转化率到半年后达到15%,这增长的5%是怎么来的?分析师、产品经理会从产品改版、数据统计上抛出一个点,我们增长可能不是真正的增长,而是用户画像随时间推移而越来越不精准,数据质量降低,从而造成的假的增长。大家抱着这种心态看清晰、多样、精准三个点。
大麦网从2015年开始接触用户画像建设,一开始也踩过坑,就是捧着一个新鲜的词儿去做,投入工程师、产品运营,开会讨论需要什么标签、有哪些场景,但是走了一段时间发现没有场景铺垫和规划,总觉得画像不够细和完整,运营也会抱怨这样的场景怎么都没有,如果很快采纳他们的需求不断建设、接下来冒出另一个问题,我应该选A还是选B?这背后可能是运营在构建底层标签或画像时,缺乏相应的场景维度。
我们是电商平台,要考虑人货场,概括为用户、商品和场景,标签有人口属性、兴趣爱好、社交关系、信用属性。演出类行业不像电商商品可以卖一年、卖两年,它是持续的新品迭代,大麦网商品会有一个体量问题;还有项目周期性问题,可能项目周期只有一个月、一周,甚至有些在开演之前才允许网络销售,商品分级在其他领域涉及不到,包括商品热度。
——画像应用之个性化推荐——
用户基础建设就是精准、多样、清晰几个维度,我们也抱着这种初衷应用到画像建设中。基础数据,如流量、用户、交易、艺人、场馆作为基础维度进行收集。再向上一层,基于不同的场景、推荐的算法,抽象出用户特征、项目特征、语境特征以及其他特征,同时离线是最基础的推荐机制,还有实时推荐。
受限行业特性,我们的项目量会很少,这是难以改变的。这会让用户有一种错觉,在个性化推荐场景下,用户在网站浏览演出,很少有最后一页的情况,除了分类强制筛选以外的场景。其实在运营后台,会按热度或者用户偏好做交叉排序,大家会在推荐模型里看到我们的rank及rerank后的演出排序,在产品首页、发现页为大家提供更多内容,提升商品的曝光、点击和购买。
(备注:rank即精排,通过一个准确的预估模型对Match阶段海选的商品进行精准打分,并根据打分结果进行排序截断,决定最终向用户展示的结果顺序。)
这些截图是我们的场景:
场景一:大麦App首页演唱会楼层
我们行业的地域性非常强,除非你是一个忠实粉丝,比如周杰伦演唱会在北京,对于上海粉丝可能会飞过来,但是成本会加机票、酒店、餐饮等会高一些。对于北京粉丝就是福利,打开App会在演唱会楼层里看到爱豆的演唱会,如果是上海的用户,考虑地域特征就不会放在第一位。
场景二:精准营销
大家也有自己的营销平台,无论是Push、短信都做过很多营销活动,因为受限于技术和行业基础大家会全量推,也知道推完效果不好,粉丝掉得很多,防骚扰做的不够强。我们在从全量、精准再到智能化的过程中,画像和标签奠定了运营基础。
我们在尝试往营销上游创作方向走,包括下游分发,受限于地域特性可能不能做全量,肯定不能把北京德云社相声推给上海同学,他们会很反感甚至卸载App。我们从创造、营销、分发三个领域出发,在营销维度主要体现用户初期认知、兴趣培养、购买、忠诚度的循环过程,再加上传播技巧、方法论,实现精准营销不断增长。
——画像应用之算法圈人——
可能是基于历史做人工圈人的维度和特征、场景;可能是项目特征、人群特征、地域特征、IP特征做算法学习;我们不可能通过算法直接推,中间有一个不断学习的过程。可以将人工圈选和算法圈选的人群做重合度识别,看哪种形式效率更高。
我们有三个统计,就是人工圈人转化统计、算法圈人的转化统计,两者的对比统计。判断算法和转化效果是否好,从而不断完善算法圈人,最终实现自动化的营销。无论是短信、App、Push,假设用户在某个场馆周边等,就会出现相应的推送。
使用方也是运营方,从运营的项目特征、特点、生命周期,通过不同角色、通过投什么、投给谁,带着这样的问题带到圈人的过程,之后进行人群投放,包括自有端和站外渠道。
我们有数据回流,第一步定义渠道,第二步渠道特征,第三步通过渠道来的用户标签。比如,我投放郭德纲的演出,来的都是00后,这样业务敏感性会很差。从渠道投放到用户来了,和预期用户群体形成鲜明对比。通过算法学习和精准率学习,从渠道统计再回溯到算法模型,不断生出预测标签,使画像更加精准。
——画像应用之渠道和流量——
我们从定义到回流再到学习、使用的过程。我会过度关注流量,我们在使用画像、精准营销时要养成看流量、使用流量的习惯,这样才知道产品的变化、业务的变化都体现在什么地方。
构建流量渠道会从三个方向做:
1. 点,即定义,了解每个渠道
大麦有两套渠道管理系统,其中一套管理系统用了N年,结果就是渠道多而乱,那个系统随着业务不断变动,像画像一样有增有减,有废弃有新增,还有相似交叉的渠道,是历史的经验和总结让我们清楚了定义的重要性,所以在第二套系统中将定义做的很清晰和精准。
2. 线,即结构,明白渠道要做什么
例如,第一大类叫搜索引擎,旗下有百度、谷歌、360等,每个搜索引擎都有搜索流量产品,我们会在不同结构下添加相应的产品。
3. 面,即维度,让渠道发声
我们有一个大的维度叫自媒体,旗下有短视频、文章,搜索引擎下面有各个维度,第一个最大的面,比如说搜索引擎、自媒体称之为面。
活动内容,有活动类型以及业务方的精细化区分,以及活动标识,这是做画像采集的数据基础,我们前期很清晰定义了数据,再回流的画像才更精细、更精准、更多样。
渠道就是流量的一部分,我们要敬畏流量,来的每一位用户都是产品的机会。渠道定义“流量”,每一个渠道都是一个机会。
下载演讲PDF完整版
——U-App AI版抢先用——
升级数据运营思路,更需要升级数据运营工具,了解U-App AI版:
——U-Time报名——
1/10深圳站 1/15 广州站
↑扫一扫或识别二维码报名
(可能需要复制链接,在浏览器中报名)
点击 “ 阅读原文 ” ,同样可以抢位。