1、简介
1.1 原始数据来源
https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data,也可通过https://www.kesci.com/home/dataset/5d12e2f9708b90002c541692进行下载。
1.2 目标
通过对用户在爱彼迎使用情况进行分析,市场规律,为进一步制定发展策略提供依据。
1.3 数据集字段
train_users.csv - 训练集
test_users.csv - 测试集
id:用户ID
date_account_created:帐户创建日期
timestamp_first_active:第一个活动的时间戳,请注意它可以早于date_account_created或date_first_booking,因为用户可以在注册前进行搜索
date_first_booking:首次预订的日期
gender:性别
age:年龄
signup_method:注册方式
signup_flow:用户注册的页面
language:语言偏好
affiliate_channel:营销方式
affiliate_provider:营销来源,例如google,craigslist,其他
first_affiliate_tracked:在注册之前,用户与之交互的第一个营销广告是什么
signup_app
first_device_type
first_browser
country_destination:这是您要预测的目标变量
sessions.csv - 用户的Web会话日志
user_id:与users表中的“id”列连接
action
action_type
action_detail
device_type
secs_elapsed
countries.csv - 此数据集中目标国家/地区的摘要统计信息及其位置
age_gender_bkts.csv - 用户年龄组,性别,目的地国家的摘要统计信息
sample_submission.csv - 提交预测的正确格式
2、整体流程
3、用户画像分析
3.1 用户年龄分析
用户的年龄集中在25-45岁的中青年群体,占比为68.4%,说明这个年龄段的用户具有消费能力和旅行的意愿。
3.2 用户性别分析
女性渣比略高于男性,差别不大。
3.3 用户地区分析
爱彼迎的用户来源广泛,但绝大部分的用户都是以英语作为第一语言。
3.4 目的地分析
用户的目的地首选美国,其次是法国、意大利等欧洲国家。
4. 推广渠道分析
4.1 每月新增用户
从结果可以看到:
- 以年度为单位观察,2010年用户增长较缓慢,原因是公司可能是在成立初期,没有打开市场,知名度小,到后期开始增长,并且增长速率每年递增。
- 2011年中开始快速增长,公司发展进入快车道。
- 观察发现,每年的7~9月有一个增长高峰,推测可能是夏季为北半球旅游旺季,而且大多数学校都会在这个时间段放假。
4.2 不同客户端的注册量
从结果可以看到:
- 58%的用户正在使用Apple产品,意味着Mac用户的预订频率更高
- PC设备端用户注册数量约占总注册数量的79%,远大于移动端,因这是截至2014年的数据,推测是之前智能移动端的普及率还不高。
4.3 不同推广渠道转化率
渠道转化率方面:
- 大部分渠道转化率都是在30%以上,表现比较健康。
- 从营销方式来看,content(内容营销)方式转化率较其他方式少。
- 从营销来源来看,主要营销来源(Google)中,除了content方式,其他方式的转化率都比较健康。
5. 转化漏斗分析
用户状态 | 数量 |
---|---|
有行为状态的用户 | 135484 |
活跃的用户 | 111977 |
下单用户 | 10367 |
支付的用户 | 9019 |
复购用户 | 2450 |
根据结果可以看到:
- 活跃用户中仅有9.26%的用户下单,sessions数据时间段为2014-01-01到2014-06-30,推测原因为此时间段为旅游淡季导致下单用户很少。
- 下单用户中最终支付的为87.0%,需要分析是什么原因导致用户取消订单。
6. 总结
1. 从用户画像上看:
在进行产品推广时,应该侧重于对25~40岁之间的用户,还可以稍微倾向于男性。
2. 从推广渠道上看:
- 每年的7~9月为旅游旺季,可以考虑在这个时间段内加大推广投入。
Google渠道除了content方式外,转化率都比较理想,后续可以继续以Google作为渠道推广。 - content方式的转化率很差,可能和内容营销的信息质量,内容更新,发布渠道,发布人群等有关。
3. 从转化漏斗上看:
- 从活跃用户到下单用户转化率非常低,建议围绕提高下单率做更多的工作。例如针对活跃用户的用户画像推送优质房源。此外,对于用户浏览的界面内容,也需要设计优化,提高下单兴趣。
- 已下单的用户中有87.0%实际支付,可以进行用户调研查找是否是支付流程,支付类型或后台服务的问题。或者针对产品本身分析,对支付产品和未支付产品进行分类统计。还可以从时间节点统计,查看已支付和未支付在时间上有何区别等。