1.了解用户画像的设计方法、技术、应用场景
2.了解金融行业用户画像最佳实践
什么是用户画像?体系、方式方法都已成熟,但是银行金融等相关领域的实施刚刚起步
数据来自用户本身,注册数据、消费数据、银行卡信息
应用:用户相关的海量数据--->抽象为机构化数据(用户标签)---->解决问 题(我们的用户价值大小?)
用户画像标签体系:人口属性:性别、年龄、职业、婚姻状况、学历教育
商业人口属性:工作岗位、公司规模、行业类型
行为属性:访问时长、访问频次、访问媒体
打造用户画像的基础思路-结构化标签体系
*标签组织成比较规整的树或森林,有明确的层级划分和父子关系,一般是4级
*采用半结构化文本方式描述用户
打造用户画像的基础思路-非结构化标签体系
特点:标签无层级关系
典型例子:搜索关键词、美团用户兴趣词
银行与用户有关的数据
1.用户基础数据:注册信息、卡的信息等。app微信微博,
将用户的数据打通,比如手机号、身份证、银行卡号
2.用户卡的交易行为
用户交易数据打通:信用卡、银行卡
3.用户app、网站、微信等数据
浏览行为等
4.用户服务数据
用户投诉等
5.用户风险数据
征信等
提供自定义
单位--->银行数据可能会失真,所以需要校验
银行如何根据自有数据判断,2个人是父子关系
1.身份证:年龄,住址2.定期汇款3.汇款留言-文字
90%准确率
银行的目的:卖理财、卖产品、风险
上学生命保险
银行只能通过:电话、短信、邮件来营销
为什么需要社交关系?银行营销--->固定的红包数,发给谁呢?才能有最大的营销效果
银行用户兴趣?与电商等画像的区别是:
1.银行理财产品、购买周期很长、所以用户的兴趣持续时间长(30天),电商持续短(15天)
是否有车?1.车险 2.车贷 3.与车有关的消费
个人画像和群体画像
用户画像的基础数据存储平台:
存储:hadoop(原始数据)
用户画像计算
sql类型的统计分析:spark sql
分析用户是否可以被打上对理财A感兴趣,标签
APP,浏览A产品超过10次,那么A就对理财感兴趣
数据要滤水--->浏览A产品pv/
用户当天或者某个时间段所有有关产品浏览pv汇总
来看比例
算法预测类标签:违约概率、性别 spark sql lib
性别:男,概率:0.9
业务用户,想卖理财A,男性
使用用户的姓名,预测性别
用户画像的存储HBase,NOSQL(MongoDB)
key:用户id
cf:sport:nba:0.9
moive:action:0.8
用户画像检索ElasticSearch:
直接使用HBase api
1.数据打通
2.数据价值应用、模型
3.标签体系
银行:从营销增值角度,效果差,降低成本效果比较明显