数据分析思维案例实战学习笔记

时间:2024-03-29 15:56:06

Part 1

一、国企

1. 招聘解析

工行:技术化、分为保守、职责模糊
招行:职位具体、要求宽泛、看重能力
广发:跟业务线、杂
电信:中规中矩

2. 工作模块

1) 日报、周报、月报:每天看数据、短期复盘、决策
2) 临时数据: 弄清本质需求
3) 工作技巧:机器人发日报、目标建立、寻找领导帮助

3. 专题分析

1)需求解读
原始需求、了解需求、本质需求。沟通
2)建立逻辑树
数据分析思维案例实战学习笔记

3)SQL提数及分析
sql提数三段论;分析(组成部分、数量比较、有何变化、各项分布、各项相关性)
4)撰写报告

4. 软技能、面试技巧

吹水、展示、时间管理、预判

二、BAT数据分析

1. 招聘解析

2. 日常工作

1)数据异常排查
前期准备:业务理解、指标口径、当前数据产出过程
方法论:判断是否异常:亲自看、时间轴拉长看是近期异常还是历史异常、看和该指标关联的其他指标或其他核心指标是否异常、找到一个关键人物提前沟通。
最大概率法则归类:假期效应、热点事件、活动影响、政策影响、底层系统故障(数据传输、存储、清洗有无问题)、统计口径(业务逻辑更改、指标计算方式)
闭环:持续跟踪后续数据是否异常;记录、沉淀、文档化;邮件化
案例:通过数据异常排查,找到新的增长点
2)融入专项被KPI
有目标: 紧贴项目KPI
有节奏:2—3周输出一份报告
有闭环:报告说人话、做人事
案列:今日头条新用户留存专项
第一阶段:新用户留存整体分析,摸清现状找到切入点
数据分析思维案例实战学习笔记
第二阶段:寻找优化切入点,一般是1-2个;
第三阶段:不断重复前面两个阶段,继续寻找其他切入点;同时进行竞品分析、用户流失分析、营销活动分析
个人理解:演绎思维(描述现象、分析原因、对策)
3)埋点、指标体系

3. 面试技巧

流量波动:
数据分析思维案例实战学习笔记

三个手机上常用APP:
商业模式、商业化变现:

三、中小企业数据分析

  1. 日常工作解析
    杂、多,

  2. 转型

  3. 业务线
    数据分析思维案例实战学习笔记
    数据分析思维案例实战学习笔记

四、数据分析工具

  1. 数据分析整体流程
    明确问题
    搭建框架
    数据提取
    数据处理
    数据分析
    数据展现
    撰写报告
    报告演讲
    报告闭环
  2. excel
    excel 对比分析(筛选和色阶)
    excel时间序列拆解分析(透视图)
    excel相关性分析(常用函数)
    excel临界点分析
  3. SQL
    超级熟练
    max函数:误认为数值型但实际为字符型
    日期处理:
    先聚合再计数:尽量少用distinct
    一列变多行:Lateral view explode
    Select *,b from t1 Lateral view explode(a) table as b
    取TOP:rank() over(…)
    避免数据倾斜:小表在左,大表在右,同时对空值进行过滤
  4. R语言

Part 2

数据分析多元分析

  1. 背景

  2. 中观能力
    真正的专业度,需要长期的总结和思考。
    技术理解:技术是为了让业务更加方便高效,而不是让人困惑。
    如数据标准化,去除量纲的差异性max-min、z-score、指数对数法

    逻辑性:相关性是一种基于向量的伴随关系,不代表因果关系。分析师的逻辑性非常重要,每一环节必须严谨。
    价值点:指导性、预测性分析,价值最大,但一定要注意到价值点,即使只有一个

  3. 微观能力
    有效沟通力+快速发散收敛力:想象力、敏感度、快速发现提问、高维视角

  4. 宏观能力
    洞见性的全局观

电商数据分析

以京东app为例

  1. 视角
    引流(场)
    漏斗(货)
    用户(人)

  2. 分发效率评估
    CTR:点击UV/曝光UV
    人均访问页面数:总访问页面PV/总访问UV

  3. 漏斗模型

  4. 新用户分析
    新用户优惠券:逻辑性、分发、文案

互联网金融toC授信模型

  1. 互联网金融背景
    风控、数据建模;
    toB、toC。央行征信报告
  2. 授信模型
    身份:稳定性
    履约能力:兜底性
    信用历史:历史性
    人脉关系:
    行为偏好:真正价值

变量选择:基于RFM原则
数据处理:数值型和字符串型字段缺失性和合理性检验,剔除无效字段;数值型字段的相关性检验;字符串型字段的离散化处理。

数据标准化:
数据建模:查全率、查准率,ROC曲线

游戏数据分析

  1. 背景
    游戏:互联网思维+钱都要具备
    两极化:要么快速流失,要么玩的时间长

流失分析+商业分析

  1. 指标口径
    常规指标
    DAU、MAU:规模
    留存率:次留、7留、30留
    渗透率:某功能模块的使用人数/该产品的日活
    转化率:针对某个连贯路径,使用下一个节点的用户数/使用上一个节点的用户数

商业化指标
ARPU:一段时间内的每用户平均收入,付费金额/活跃人数
CPM:千次曝光的成本,(广告投入总额/所投广告的展示数)*1000
CPC:每个点击用户的成本,广告投入总额/锁头广告带来的点击数
ROI:投资回报率,收入/支出

  1. 用户流失分析
    一般定义为一个月内不使用产品即定义为流失。要合理定义流失。
    回流率=回流用户数/流失用户数=某个周期内的流失用户数在周期结束后又回来了/某个周期内的流失用户数

套路:看流失前最后一步在干啥;
差异化很大的点:深入游戏

  1. 用户付费分析
    整体思路:
    以付费金额和付费模块为切入点;
    根据前一步确定是在高中低哪个群体;
    AB测试,每天看收入情况

传统行业数据分析

Part 3 指标体系

一、指标体系的通俗定义和选取原则
定义:在业务的不同阶段,分析师牵头、业务方协助,制定的一套能从各维度取反映业务状况的一套实施框架
选取原则:根本性、可理解性、结构性
二、指标体系的四部法
原子性指标:最基础的不可拆分指标
修饰词:可选,某种场景:如搜索
时间段:时间周期,如双11
4=1+2+3:派生指标,双11这天通过搜索带来的交易额

1、理清业务阶段和方向
创业期:盘子大小,用户量
上升期:盘子大小、健康度。用户量,留存
成熟期:收入、市场份额。收入指标
2、确定核心指标

3、确定核心维度拆解
公式计算,业务模块分解

4、指标宣贯、存档、落地

三、知乎APP指标体系实操
问答数

Part 4 流量分析

一、背景
定义:流量是广义的流量,从哪来,经过什么,产生什么价值,如果波动了,为何波动
二、渠道分析
1)常见渠道和分类

内部渠道:产品矩阵
外部渠道:搜索引擎、APP广告、社交媒体、软件市场。
拉新,前期app靠渠道
分类:横坐标是量级、纵坐标为质量指标,划分四象限:
扩量 变现
放弃 精细化

一级渠道 二级渠道
2)渠道推广过程
外部渠道、文案展示、落地页、下载、打开、浏览、注册。。。退出
3)渠道关键指标及分析方法
关键指标:前期看有效用户数和次留,中期看次日、7日、30日留存,后期看ROI
有效用户数:主动行为的用户数,比如停留大于3秒的
分析方法:结构分析+趋势分析+对比分析+作弊分析。
结构分析:先按一级渠道来拆解,再按二级渠道来拆解
趋势分析:看每个渠道的变化趋势,包括量级和留存
对比分析:不同渠道间的趋势对比
作弊分析:用户行为分析+机器学习,python

三、转化分析
1)漏斗分析
先把漏斗的每一步拆分完整,针对需要提升的某一步,核心思想都是用户细分:基础属性和行为属性
基础:手机、地域、imei特征
行为:入口、时段、用户活跃度、用户标签
对有问题的群体进行针对性优化-----精细化
2)功能模块常规分析
功能渗透率=功能用户数/大盘用户数
功能功能留存率:第一天使用该功能同时第二天也使用该功能的用户数/第一天使用该功能的用户数
功能大盘留存率:第一天使用该功能同时第二天是大盘用户的用户数/第一天使用该功能的用户数
大盘用户=所有功能用户排重+不使用任何功能的用户

四、价值分析
1)功能核心用户数
复合某种要求,如时长、天数、具备某种行为
2)功能对大盘贡献度
比如对大盘留存提升的贡献,严格来说只有AB测试才能说明问题
3)功能带来的收入对比
每个功能每个月赚多少钱
五、波动分析
流量波动模型
1)日活
日活波动=外部影响+内部影响
外部影响=行业变化+竞品变化=常识+外部事件+竞品策略
内部影响=数据统计+用户基础属性+用户行为属性
数据统计:数有没有错,采集和统计口径
用户基础属性:从哪里来,什么方式,入口,画像
用户行为属性:进来干了什么,具体功能变化,跟版本可能有关

2)留存
留存波动=新用户留存+老用户留存
新用户留存=渠道+渠道过程有关
老用户留存=所有功能用户去重留存+大盘非功能用户留存

Part 5 路径分析

一、路径分析定义
基于用户的所有行为,去挖掘若干条重要的用户路径,通过优化界面交互让产品用起来更加流畅和符合用户习惯,产生更多价值:先有数据再验证假设

二、路径分析过程
1、所有功能用户量级查看,筛选出重要功能
2、先时间序列排序用户行为、再关联功能间数据(抽样)
3、数据标准化及路径画图
4、找出有意思的路径(启发)

三、路径分析思考

Part 6 竞品分析

一、背景
1、场景
准备进入时,看行业规模和前景;
发展处于下降时,看竞争对手,侧重头部玩家分析;
瓶颈时,看竞争对手的数据和功能迭代,监控哦对手数据,寻求突破;
上升期,一般不会做竞品分析
2、定义
1)竞品的选择
哪些才是竞品
2)分析什么点,需要知道分析背景,有针对性切入

二、步骤
1、确定分析目的
1)尝试进入某个新行业,评估可行性。行业趋势、市场规模、财务收入;
2)纯粹看竞品的功能、玩法和数据,学习优点,人无我有,人有我优。学习为主
3)揣摩竞品,预防为主
2、挑选1-2家竞品,进行对比分析
核心功能一样
1)功能体验分析:不需要大而全
2)运营手法分析:某个功能的运营手法
3)宏观微观数据分析

3、给出初步分析结论
1)进入新行业,评估可行性,SWOT分析
2)学习,学习了什么
3)预防,是否需要进行同竞品相似的尝试

三、实例
爱奇艺会员分析,学习优点,提升自家会员
1、基础数据对比
还要看用户画像
2、产品对比
选择:
功能价值:
退货:
3、运营的概念
产品:生孩子
运营:养孩子
数据分析:持续观察孩子成长阶段的各个指标,保证他健康成长。
所有运营都额可以理解为用户运营:提新增、拉留存、降流失。
往往需要产品内容和产品活动来吸引用户

Part 7 营销活动分析

一、营销活动的当前现状
活动参与人数
拉新数
用户画像
理解:
分析的连贯性:活动前、活动中、活动后
分析的对比性:活动与活动间对比,什么样的活动比较适合产品本身
分析的公正性:按标准评判

活动效果评估+活动优化建议
二、营销活动具体怎么分析
1、活动前好好准备:
和运营方定好目标
和研发沟通好埋点
搭建好指标体系和报表
定好输出格式
2、活动中好好观察
观察第1天数据
观察1-3天数据
定时输出活动战报
活动1周后数据——进行一次详细复盘,同步给管理层
3、活动后复盘——公正性
对大盘影响
短期效果——目标完成度,参与人数、拉新、品牌传播指数
长期效果——活动带来的长期用户数
存在的问题——产品设计和用户反馈
三、案例讲解-----百度app

Part 8 用户增长分析

一、用户增长模型理解
1、AARRR,拉新、**、留存、变现、推荐。看似很完美,然而很有问题,野蛮增长过去式。

2、留存—》变现—》推荐—》拉新—》**

3、未来也有可能:
变现—》推荐—》拉新—》**—》留存

不要纠结模型和概念;抱大腿;产品壁垒。

分析师的任务就是做规模和带收入

二、国内用户增长现状
看似很虎的几个用户增长方法
1、魔法数字:一个用户阅读数超过3篇,留存将大大提升
1)本身是用户的一种主动性行为;
2)让阅读篇数小于3篇的人阅读很难

2、优化渠道结构提升新增用户留存
1)用户量大、质量高的渠道总是有限的,渠道人员开始的时候就想着这件事;
2)渠道链路非常长,很多因素控制不了,反馈周期很久
3、流失用户召回
1)手段除了push,还有啥?
2)与其精力放在召回,不如放在流失分析上

实际很好的2个增长思维
1、北极星指标:一定要找到最核心的指标
对北极星指标进行不断拆解,拆解后的指标跟每个团队的kpi挂钩起来
MAU=新增+老=本月新增+上月新增留存+上月老留存+上月老回流
2、AB测试:公正性和快速反馈性
1)基于数据分析做ab
2)看过程数据,排坑

三、摩拜和滴滴的用户增长案例

part 9 专题报告

一、找到本质问题和逻辑树拆解
1、举例
数据分析思维案例实战学习笔记
二、SQL提数和分析
1、前期准备
写SQL前准备,准备
哪张表、哪份日志
筛选条件
之前有什么坑
现在是否有坑
2、报告
白话、结论先行、落地。

三、彩妆行业分析

part 10 AB测试

一、AB测试介绍
数据分析思维案例实战学习笔记
数据分析思维案例实战学习笔记
常见的AB测试:UI界面型、算法测量型

二、AB测试注意事项
数据分析思维案例实战学习笔记

三、AB测试案例

part 11 行业分析

一、背景
进入某行业;业务发展遇到瓶颈

抓住主要,切忌求全,数数支持
数据分析思维案例实战学习笔记

part 12 数据仓库

数据分析思维案例实战学习笔记