Part 1
一、国企
1. 招聘解析
工行:技术化、分为保守、职责模糊
招行:职位具体、要求宽泛、看重能力
广发:跟业务线、杂
电信:中规中矩
2. 工作模块
1) 日报、周报、月报:每天看数据、短期复盘、决策
2) 临时数据: 弄清本质需求
3) 工作技巧:机器人发日报、目标建立、寻找领导帮助
3. 专题分析
1)需求解读
原始需求、了解需求、本质需求。沟通
2)建立逻辑树
3)SQL提数及分析
sql提数三段论;分析(组成部分、数量比较、有何变化、各项分布、各项相关性)
4)撰写报告
4. 软技能、面试技巧
吹水、展示、时间管理、预判
二、BAT数据分析
1. 招聘解析
2. 日常工作
1)数据异常排查
前期准备:业务理解、指标口径、当前数据产出过程
方法论:判断是否异常:亲自看、时间轴拉长看是近期异常还是历史异常、看和该指标关联的其他指标或其他核心指标是否异常、找到一个关键人物提前沟通。
最大概率法则归类:假期效应、热点事件、活动影响、政策影响、底层系统故障(数据传输、存储、清洗有无问题)、统计口径(业务逻辑更改、指标计算方式)
闭环:持续跟踪后续数据是否异常;记录、沉淀、文档化;邮件化
案例:通过数据异常排查,找到新的增长点
2)融入专项被KPI
有目标: 紧贴项目KPI
有节奏:2—3周输出一份报告
有闭环:报告说人话、做人事
案列:今日头条新用户留存专项
第一阶段:新用户留存整体分析,摸清现状找到切入点
第二阶段:寻找优化切入点,一般是1-2个;
第三阶段:不断重复前面两个阶段,继续寻找其他切入点;同时进行竞品分析、用户流失分析、营销活动分析
个人理解:演绎思维(描述现象、分析原因、对策)
3)埋点、指标体系
3. 面试技巧
流量波动:
三个手机上常用APP:
商业模式、商业化变现:
三、中小企业数据分析
-
日常工作解析
杂、多, -
转型
-
业务线
四、数据分析工具
- 数据分析整体流程
明确问题
搭建框架
数据提取
数据处理
数据分析
数据展现
撰写报告
报告演讲
报告闭环 - excel
excel 对比分析(筛选和色阶)
excel时间序列拆解分析(透视图)
excel相关性分析(常用函数)
excel临界点分析 - SQL
超级熟练
max函数:误认为数值型但实际为字符型
日期处理:
先聚合再计数:尽量少用distinct
一列变多行:Lateral view explode
Select *,b from t1 Lateral view explode(a) table as b
取TOP:rank() over(…)
避免数据倾斜:小表在左,大表在右,同时对空值进行过滤 - R语言
Part 2
数据分析多元分析
-
背景
-
中观能力
真正的专业度,需要长期的总结和思考。
技术理解:技术是为了让业务更加方便高效,而不是让人困惑。
如数据标准化,去除量纲的差异性max-min、z-score、指数对数法
逻辑性:相关性是一种基于向量的伴随关系,不代表因果关系。分析师的逻辑性非常重要,每一环节必须严谨。
价值点:指导性、预测性分析,价值最大,但一定要注意到价值点,即使只有一个 -
微观能力
有效沟通力+快速发散收敛力:想象力、敏感度、快速发现提问、高维视角 -
宏观能力
洞见性的全局观
电商数据分析
以京东app为例
-
视角
引流(场)
漏斗(货)
用户(人) -
分发效率评估
CTR:点击UV/曝光UV
人均访问页面数:总访问页面PV/总访问UV -
漏斗模型
-
新用户分析
新用户优惠券:逻辑性、分发、文案
互联网金融toC授信模型
- 互联网金融背景
风控、数据建模;
toB、toC。央行征信报告 - 授信模型
身份:稳定性
履约能力:兜底性
信用历史:历史性
人脉关系:
行为偏好:真正价值
变量选择:基于RFM原则
数据处理:数值型和字符串型字段缺失性和合理性检验,剔除无效字段;数值型字段的相关性检验;字符串型字段的离散化处理。
数据标准化:
数据建模:查全率、查准率,ROC曲线
游戏数据分析
- 背景
游戏:互联网思维+钱都要具备
两极化:要么快速流失,要么玩的时间长
流失分析+商业分析
- 指标口径
常规指标
DAU、MAU:规模
留存率:次留、7留、30留
渗透率:某功能模块的使用人数/该产品的日活
转化率:针对某个连贯路径,使用下一个节点的用户数/使用上一个节点的用户数
商业化指标
ARPU:一段时间内的每用户平均收入,付费金额/活跃人数
CPM:千次曝光的成本,(广告投入总额/所投广告的展示数)*1000
CPC:每个点击用户的成本,广告投入总额/锁头广告带来的点击数
ROI:投资回报率,收入/支出
- 用户流失分析
一般定义为一个月内不使用产品即定义为流失。要合理定义流失。
回流率=回流用户数/流失用户数=某个周期内的流失用户数在周期结束后又回来了/某个周期内的流失用户数
套路:看流失前最后一步在干啥;
差异化很大的点:深入游戏
- 用户付费分析
整体思路:
以付费金额和付费模块为切入点;
根据前一步确定是在高中低哪个群体;
AB测试,每天看收入情况
传统行业数据分析
Part 3 指标体系
一、指标体系的通俗定义和选取原则
定义:在业务的不同阶段,分析师牵头、业务方协助,制定的一套能从各维度取反映业务状况的一套实施框架
选取原则:根本性、可理解性、结构性
二、指标体系的四部法
原子性指标:最基础的不可拆分指标
修饰词:可选,某种场景:如搜索
时间段:时间周期,如双11
4=1+2+3:派生指标,双11这天通过搜索带来的交易额
1、理清业务阶段和方向
创业期:盘子大小,用户量
上升期:盘子大小、健康度。用户量,留存
成熟期:收入、市场份额。收入指标
2、确定核心指标
3、确定核心维度拆解
公式计算,业务模块分解
4、指标宣贯、存档、落地
三、知乎APP指标体系实操
问答数
Part 4 流量分析
一、背景
定义:流量是广义的流量,从哪来,经过什么,产生什么价值,如果波动了,为何波动
二、渠道分析
1)常见渠道和分类
内部渠道:产品矩阵
外部渠道:搜索引擎、APP广告、社交媒体、软件市场。
拉新,前期app靠渠道
分类:横坐标是量级、纵坐标为质量指标,划分四象限:
扩量 变现
放弃 精细化
一级渠道 二级渠道
2)渠道推广过程
外部渠道、文案展示、落地页、下载、打开、浏览、注册。。。退出
3)渠道关键指标及分析方法
关键指标:前期看有效用户数和次留,中期看次日、7日、30日留存,后期看ROI
有效用户数:主动行为的用户数,比如停留大于3秒的
分析方法:结构分析+趋势分析+对比分析+作弊分析。
结构分析:先按一级渠道来拆解,再按二级渠道来拆解
趋势分析:看每个渠道的变化趋势,包括量级和留存
对比分析:不同渠道间的趋势对比
作弊分析:用户行为分析+机器学习,python
三、转化分析
1)漏斗分析
先把漏斗的每一步拆分完整,针对需要提升的某一步,核心思想都是用户细分:基础属性和行为属性
基础:手机、地域、imei特征
行为:入口、时段、用户活跃度、用户标签
对有问题的群体进行针对性优化-----精细化
2)功能模块常规分析
功能渗透率=功能用户数/大盘用户数
功能功能留存率:第一天使用该功能同时第二天也使用该功能的用户数/第一天使用该功能的用户数
功能大盘留存率:第一天使用该功能同时第二天是大盘用户的用户数/第一天使用该功能的用户数
大盘用户=所有功能用户排重+不使用任何功能的用户
四、价值分析
1)功能核心用户数
复合某种要求,如时长、天数、具备某种行为
2)功能对大盘贡献度
比如对大盘留存提升的贡献,严格来说只有AB测试才能说明问题
3)功能带来的收入对比
每个功能每个月赚多少钱
五、波动分析
流量波动模型
1)日活
日活波动=外部影响+内部影响
外部影响=行业变化+竞品变化=常识+外部事件+竞品策略
内部影响=数据统计+用户基础属性+用户行为属性
数据统计:数有没有错,采集和统计口径
用户基础属性:从哪里来,什么方式,入口,画像
用户行为属性:进来干了什么,具体功能变化,跟版本可能有关
2)留存
留存波动=新用户留存+老用户留存
新用户留存=渠道+渠道过程有关
老用户留存=所有功能用户去重留存+大盘非功能用户留存
Part 5 路径分析
一、路径分析定义
基于用户的所有行为,去挖掘若干条重要的用户路径,通过优化界面交互让产品用起来更加流畅和符合用户习惯,产生更多价值:先有数据再验证假设
二、路径分析过程
1、所有功能用户量级查看,筛选出重要功能
2、先时间序列排序用户行为、再关联功能间数据(抽样)
3、数据标准化及路径画图
4、找出有意思的路径(启发)
三、路径分析思考
Part 6 竞品分析
一、背景
1、场景
准备进入时,看行业规模和前景;
发展处于下降时,看竞争对手,侧重头部玩家分析;
瓶颈时,看竞争对手的数据和功能迭代,监控哦对手数据,寻求突破;
上升期,一般不会做竞品分析
2、定义
1)竞品的选择
哪些才是竞品
2)分析什么点,需要知道分析背景,有针对性切入
二、步骤
1、确定分析目的
1)尝试进入某个新行业,评估可行性。行业趋势、市场规模、财务收入;
2)纯粹看竞品的功能、玩法和数据,学习优点,人无我有,人有我优。学习为主
3)揣摩竞品,预防为主
2、挑选1-2家竞品,进行对比分析
核心功能一样
1)功能体验分析:不需要大而全
2)运营手法分析:某个功能的运营手法
3)宏观微观数据分析
3、给出初步分析结论
1)进入新行业,评估可行性,SWOT分析
2)学习,学习了什么
3)预防,是否需要进行同竞品相似的尝试
三、实例
爱奇艺会员分析,学习优点,提升自家会员
1、基础数据对比
还要看用户画像
2、产品对比
选择:
功能价值:
退货:
3、运营的概念
产品:生孩子
运营:养孩子
数据分析:持续观察孩子成长阶段的各个指标,保证他健康成长。
所有运营都额可以理解为用户运营:提新增、拉留存、降流失。
往往需要产品内容和产品活动来吸引用户
Part 7 营销活动分析
一、营销活动的当前现状
活动参与人数
拉新数
用户画像
理解:
分析的连贯性:活动前、活动中、活动后
分析的对比性:活动与活动间对比,什么样的活动比较适合产品本身
分析的公正性:按标准评判
活动效果评估+活动优化建议
二、营销活动具体怎么分析
1、活动前好好准备:
和运营方定好目标
和研发沟通好埋点
搭建好指标体系和报表
定好输出格式
2、活动中好好观察
观察第1天数据
观察1-3天数据
定时输出活动战报
活动1周后数据——进行一次详细复盘,同步给管理层
3、活动后复盘——公正性
对大盘影响
短期效果——目标完成度,参与人数、拉新、品牌传播指数
长期效果——活动带来的长期用户数
存在的问题——产品设计和用户反馈
三、案例讲解-----百度app
Part 8 用户增长分析
一、用户增长模型理解
1、AARRR,拉新、**、留存、变现、推荐。看似很完美,然而很有问题,野蛮增长过去式。
2、留存—》变现—》推荐—》拉新—》**
3、未来也有可能:
变现—》推荐—》拉新—》**—》留存
不要纠结模型和概念;抱大腿;产品壁垒。
分析师的任务就是做规模和带收入
二、国内用户增长现状
看似很虎的几个用户增长方法
1、魔法数字:一个用户阅读数超过3篇,留存将大大提升
1)本身是用户的一种主动性行为;
2)让阅读篇数小于3篇的人阅读很难
2、优化渠道结构提升新增用户留存
1)用户量大、质量高的渠道总是有限的,渠道人员开始的时候就想着这件事;
2)渠道链路非常长,很多因素控制不了,反馈周期很久
3、流失用户召回
1)手段除了push,还有啥?
2)与其精力放在召回,不如放在流失分析上
实际很好的2个增长思维
1、北极星指标:一定要找到最核心的指标
对北极星指标进行不断拆解,拆解后的指标跟每个团队的kpi挂钩起来
MAU=新增+老=本月新增+上月新增留存+上月老留存+上月老回流
2、AB测试:公正性和快速反馈性
1)基于数据分析做ab
2)看过程数据,排坑
三、摩拜和滴滴的用户增长案例
part 9 专题报告
一、找到本质问题和逻辑树拆解
1、举例
二、SQL提数和分析
1、前期准备
写SQL前准备,准备
哪张表、哪份日志
筛选条件
之前有什么坑
现在是否有坑
2、报告
白话、结论先行、落地。
三、彩妆行业分析
part 10 AB测试
一、AB测试介绍
常见的AB测试:UI界面型、算法测量型
二、AB测试注意事项
三、AB测试案例
part 11 行业分析
一、背景
进入某行业;业务发展遇到瓶颈
抓住主要,切忌求全,数数支持