文件名称:深入理解用户画像-python使用梯度下降和牛顿法寻找rosenbrock函数最小值实例
文件大小:3.86MB
文件格式:PDF
更新时间:2024-07-18 23:03:53
用户画像 模型标签 spark项目 大数据项目 涛哥
2.4 深入理解用户画像 画虎不全反类汪,想要用好它,首先得深入理解用户画像。 不要想当然的归纳一个齐全完备的体系,却忽略了画像的核心价值:用户画像首先得是商业目的下 的用户标签集合。 下面以“流失用户”为例来探讨画像标签的设计; 现在运营按用户生命周期设立了几个标签,比如新用户、活跃用户、流失用户,这些标签当然够细 分。但它真的是一个好标签么?不是。 因为这些都是滞后性的。按流失用户的一般定义,往往是用户很长一段时间没有回应和行动,但是 都几个月没有响应了,哪怕知道是流失用户也于事无补。它有价值,但太滞后。 聪明的运营会设立一个新的标签:最近一次活跃距今天数,用户有六个月没有活跃,那么天数就是 180天。这个比单纯的流失用户标签好,能凭此划分不同的距今天数,设立 30天,90天,180天的 时间节点。 距今天数也不是最好的。用户有差异,同样两个用户 A和 B,哪怕不活跃天数相同,我也不能认为 它们的流失可能性相等。该问题在低频场景更凸显,旅游 APP,半年没有活跃也是正常的,此时距 今天数力有未逮。 回过头看流失用户,我们定义它,不是为了设立一个高大上的系统。任何企业,肯定一开始就希望 流失用户越少越好,其次才是如何挽回。这种业务前提下,预防性的减少流失用户比已经流失的标 签更重要。 所以最好的标签是用户流失概率,流失概率 (优于) 距今消费天数 (优于) 流失标签。 猜用户是男是女,哪里人,工资多少,有没有谈恋爱,喜欢什么,准备剁手购物吗?探讨这些是没 有意义的。 是男是女如何影响消费决策,工资多少影响消费能力,有没有谈恋爱会否带来新的营销场景,剁手 购物怎么精准推荐,这些才是用户画像背后的逻辑。 不是我有了用户画像,便能驱动和提高业务。而是为了驱动和提高业务,才需要用户画像。这是很 容易犯的错误。 用户画像的标签一般通过两种形式获得: 基于已有数据或者一定规则统计加工,流失标签和距今天数皆是。 另外一种是基于已有的数据计算概率模型,会用到机器学习和数据挖掘。 概率是介于 0~1之间的数值。拿性别举例,除非能直接获取用户的身份证信息,用户很少会填写性 别,填写的性别也不一定准确,网游中性别为女的扣脚大汉一抓一大把呢。 这里就要增加一层推断用户真实性别的算法。中国人的性别和名字是强相关,建国建军,翠花翠 兰,很容易判断。算法中常用贝叶斯,通过已有的姓名性别库预测新加入的用户性别。 特殊情况下,不少姓名是中性,男女不辩。像晓晶,可男可女。更特殊的情况,看上去是男性的名 字,也有可能是女性,我的初中老师就叫建军,然而是个和蔼可亲的小姐姐。 特殊情况意味着特殊的概率,所以不能用非此即彼的二分法。所谓概率,它更习惯告诉你,通过模 型推断,建军有 95%的可能是男性姓名,表示为 0.95;晓晶有 55%的可能是男性,表示为 0.55。