一、数据分析概况
(一)、数据分析是“神马”?
1.数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将他们进行汇总、理解并消化, 以求最大化的开发数据的功能 ,发回数据的作用。
2.数据分析目的在于把隐藏在一大堆看似杂乱无章的数据背后的信息集中和提炼出来,总结出内在对象的研究规律。
(二)、数据分析分类
数据分析特性:描述性、探索性、验证性
初级数据分析:对比分析法、分组分析法、交叉分析法
高级数据分析:相关分析、因子分析、回归分析
(三)、菜鸟与数据分析师的区别
菜鸟会想 分析师会想 |
折线图真好看,怎么画? 数据变化背后真相是什么? |
这些数据怎么做分析 ? 这些数据怎么分析才体系? |
高级分析方法在这能有用吗? 用什么分析方法最有效? |
要做多少张图标? 图标能否表达出有效观点 |
添加文字说明还需要说什么? 数据分析目的达到了吗? |
....... ...... |
(四)、数据分析师的基本素质
■ 态度严谨负责
■ 好奇心强烈
■ 逻辑思维清晰
■ 擅长模仿
■ 勇于创新
(五)、数据分析六步曲
明确目的与思路(先决条件,提供方向) -> 数据收集(数据库、其它媒介) -> 数据处理(清洗、转化、提取、计算)->数据展现(统计分析,数据挖掘) -> 数据分析(图标→表格→文字) -> 撰写报告(框架清晰,明确结论,提出建议)
(六)、数据分析的误区
■ 目的不明确,为了分析而分析
■ 缺乏业务知识,分析结果偏离实际
■ 追求高级分析方法,热衷分析模型
二、常用指标和术语
平均数:
绝对数:统计中常用的总量指标。是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合指标
相对数:反应客观现象间数量反映程度。一类是有名数,一类是无名数。如倍数、成数、百分数等
百分比、百分点:不同时期以百分数形式表示的相对指标变动。一个百分点=1%。
频数:一组数据中个别数据出现的次数(抛硬币10次,4次出现头像。头像的出现频数是4次)
频率:每组类别的次数与总次数的比值(头像出现的频率是40%)
比例:一个总体中各个部分的数量占总体数量的比重
比率:两数相比所得值
倍数、番数:都是相对数,番数是指2的N次倍
同比:今年第n月与去年第n月相比
环比:同一年的第n月与第n-1月相比
三、数据分析思路
数据分析方法论
方法论 说明 适用范围 |
PEST Political, Economic,Social,Technological 行业分析 |
4P Product,Price,Place,Promotion 公司整体运营情况分析 |
逻辑树 将问题分层罗列,逐步向下展开 业务问题专题分析 |
用户使用行为 认知→熟悉→试用→使用→忠诚 用户行为研究 |
5W2H Why,What,Who,When,Where,How, How much 用途广泛 |
PEST
PEST是指对政治(Political),经济(Economic),技术(Technological)和社会(Social)这四类影响企业的主要外部环境因素进行分析。一般用于宏观环境的分析。
互联网行业分析示例
5W2H
5W2H是从回答中发现解决问题线索的方法既何因(Why),何事(What),何人(Who),何时(When),何地(Where),如何做(How),何价(How much)。这就构成了5W2H的总框架。
用户购买行为分析示例
逻辑树
逻辑树是将一个已知问题当成树干,然后考虑这些问题和哪些问题有关,每想到一点,就给这个问题所在的树干加一个树枝,并标明树枝代表什么问题。逻辑树方法又称为问题树、演绎树或分解树。
利润示例分析
4P
4P营销理论产生于20世纪60年代的美国,它随着营销组合理论的提出而出现。它将营销组合概括为四类:产品(Product),价格(Price),渠道(Place),营销(Promotion)
公司业务分析示例
用户行为理论
用户行为是指用户为获取、使用物品或服务所采用的各种行动,一般按照以下过程:对产品有一个认知、熟悉的过程,然后试用,再决定是否继续消费使用,最后成为忠实用户。
四、数据分析方法
(一)、对比分析方法
对比分析方法是将两个或两个以上的数据进行比较,分析其中的差异,从而揭示这些事务所代表的的发展变化情况和规律性。
特点
指标的口径范围,计算方法计量单位要一致。
对比的对象要有可比性。
对比的指标类型必须一致。
分类
1、与目标对比:实际完成值与目标值进行对比,属于横比。
2、不同时期对比:选择不同时期的指标数值作为标准对比,属于纵比。如同比,环比。
3.同级单位,部门,地区对比。
4、行业内对比:对比找出自身发展方向,属于横比。
5、活动效果对比:对比营销活动前后效果,属于纵比。
(二)、分组数据分析方法
根据数据分析对象特征,按照一定指标,把分析数据对象划分为不同部分或类型进行比较研究
组距=(最大值-最小值)/ 组数
(三)、结构分析方法
结构分析方法是指被分析研究总体内各部分与总体之间进行对比的方法,即总体内各部分所占比例。属于相对指标。
结构相对指标(比率) = 总体内某部分数值 / 总体数值 * 100%
(四)、平均分析法
运用计算平均数的方法来反应总体在某一时间、地点、条件下某一数量特征的一般水平。
算数平均数 = 总体各单位数值的总和 / 总单位数量
(五)、交叉分析法
同时将两个有一定联系的变量及其值交叉排列在一张表中,使各变量成为不同变量的交叉节点。一般使用二维分析交叉表。
(六)、综合评价分析法
将多个指标转化成一个能够反映综合情况的指标来进行分析评价,用于解决负责的分析对象。
过程
1、确定综合评价指标体系
2、搜集数据,对不同计量单位的指标进行标准化处理
3、确定指标体系中各指标的权重
4、对处理后的指标进行加权计算出综合评价指标
5、根据综合评价指数对参评单位排序,并得出结论
(七)、杜邦分析法
利用各财务指标之间的联系,对企业财务状况及经济效益进行综合分析评价的方法。
(八)、漏斗分析方法
漏斗分析图是一个适合业务流程比较规范、周期比较长、各环节流程涉及复杂业务比较多的分析。
(九)、矩阵关联分析法
将事物(产品、服务等)的两个重要属性(指标)作为分析的依据,进行关联,并找到解决问题的方法。
矩阵关联分析法示例
五、数据展现方法
(一)、数据展现的作用:
表达形象化、体现专业化、突出重点。
(二)、常用图标类型与作用
(三)图标制作五个步骤
1、确定你要表达的主题
2、确定那种图标适合你
3、选择数据制作图标
4、检查是否真实反应数据
5、检查是否反应你的观点
(四)、饼图制作原则
1、尽量不要使用3D效果,如果要用尽量薄一些。
2、饼图的结构中最多包含5种数据。
3、标注写在图中,不要写在一边。
4、边界线使用白色,突出边缘感。
5、让数据从12点钟的为值开始排列,最重要的成分紧靠12点钟的位置。
(五)、柱状图制作原则
1.同一数据序列使用相同颜色。
2.不要使用倾斜的标签,不要让读者歪着脑袋看。
3.纵坐标轴一般刻度从0开始。
(六)、条形图制作原则
1、同一数据序列使用相同颜色;
2.尽量让数据从大到小排列,方便阅读;
3.不要使用倾斜的标签;
4.最好添加数据标签值。
(七)折线图制作原则
1.折线选用的线型要相对粗些,最好比网格线、坐标轴等要突出;
2.线条一般不超过5条;
3.不要使用倾斜的标签;
4.纵坐标轴一般从0开始。
六、数据分析报告
数据分析报告
数据分析报告是根据数据分析原理和方法,运用数据反应、研究和分析事物现状、问题、原因、本质和规律并得出结论,提出解决办法的一种分析应用文本。
分析报告的作用
分析报告有三大作用:展示分析结果、验证分析质量、提供决策依据。
数据分析报告写作原则
数据分析报告写作四原则:规范性、重要性、谨慎性、创新性。
数据分析报告种类
■ 日常数据通报:月度数据报告、日报表
■ 专题分析报告:用户流失分析、提升用户消费分析
■ 综合分析报告:企业运营报告,世界人口发展报告
数据分析报告的结构
分析背景 → 分析目的 → 分析思路 → 正文 → 结论和建议 → 附录
分析报告注意事项
■ 结构合理,逻辑清晰
■ 实事求是,反映真相
■ 用词准确,避免含糊
■ 篇幅适宜,简介有效
■ 结合业务,分析合理
1.要有一个好的框架
跟盖房子一样,好的分析一定要有基础有层次,有基础坚实,层次明了才能让阅读者一目了然,架构清晰、层次分明才能让别人容易读懂,才让人有读下去的欲望。
2.每个分析要有结论,而且结论一定要明确如果没有明确的结论,那分析就不叫分析了,也失去了它本身的意义,因为你本来就是去寻找和验证一个结论才去分析的,所以不要忘本舍果。
3.分析结论不要太多,要精如果可以的话一个分析一个最重要结果就可以了,很多时候分析就是发现问题,如果一个分析能发现重大问题,就达到目的了,不要事事求多,精简的结论也容易让阅者接受。
4.分析结论一定要基于紧密严谨的分析推导过程不要有猜测性的结论,太主观的东西会没有说服力,如果一个结论连自己都没有肯定的把握就不要拿出来误导别人了。
5.数据分析报告尽量图表化用图标来代替大量的堆砌数字,会有助于人们更形象更直观的看清楚问题和结论,当然图标也不要太多,太多的图标容易让人无所适从。
6.好的分析报告一定要有逻辑性通常遵照:发现问题 → 总结问题原因 → 解决问题,这样一个流程,逻辑性分析强的报告也容易让人接受。
7.好的分析前提要熟悉业务好的分析一定出自于对产品和运营的透彻理解
8.好的分析报告一定有解决方案和建议方案既然做了深入的分析,那么这个过程就决定了你比别人都更清楚的发现了问题及问题产生的原因,那么在这个基础之上基于你的知识和了解,做出的建议和结论想必也更有意义,而且你的老板也肯定不希望你只是个会发现问题的人。
9.不要害怕或回避“不良结论”分析就是为发现问题和解决问题提供决策依据的,发现产品问题也是你的价值所在,在产品缺陷和问题造成重大失误前解决它,就是你分析的价值所在。
10.不要创造太多难懂的词如果你的老板在看你的报告,花10分钟叫了你三次去解释名词,那么你写报告的价值在哪里,还不如直接过去说,当然如果要不可避免的使用一些名词,最好要有让人易懂的“名词解释”。
数据分析报告常用术语
1.现状
数据显示...数据同时表名...
从图标中可以看出...
据...报告数据显示...
显然....,不难发现...
基于...我们判断...
研究发现...
值得注意的是...
综上所述...
2.对比
环比、同比增长、下降
相对较好(高)、较差(低)
相比明显增长、略微下滑
数据增幅、降幅达...
...进入高速发展期
月均增长...
与目标的差距主要体现在...
离目标进度还有...差距
排名前三的...依次为...
对比来看...增长不足...后期表现乏力...
3.构成
市场占有率达...
主要集中在...
数据呈...分布
...,其中...,主要是...
4.趋势
从上表/图可以看出、对比数据可得、趋势平缓、回落
数据...呈上升趋势
5.原因
数据上涨/下跌的原因如下...
主要原因包括:1)..2)...3)...
主要因...引起
6.预测
保守预测、估计...
如果按照...速度发展...预计(预估)...能完成(完不成)
7.建议
有分析得出,需要改善的地方...
未来需要优化/扩大的地方如下...
后期应着重...
建议一方面..另一方面...
建议...以期达到...目的,提高...改善...缓解...最终...
* 以上内容为常用术语,仅供参考。主要还是明确分析目的,只有明确目的才能知道分析报告怎么写。
七、数据分析技能提升十大建议
(一)熟悉行业、公司业务
熟悉行业、公司业务及流程,若脱离行业认知和公司业务背景,分析的结果只能是脱了线的风筝,没有太大的使用价值。
(二)明确分析目的
尝尝有朋友问我这些数据可以做什么分析?这是典型的为了分析而分析。数据分析的前提需要先明确分析目的,这样分析才有意义。
(三)运用营销、管理等理论
营销、管理理论是数据分析的指导思想,使分析思路系统化。例如4P理论,从哪几个维度去分析?考虑哪几个方面?故而是数据分析有骨有肉有脉络,真正做到理论指导实践。
(四)掌握有效数据分析方法
了解数据基本流程,掌握数据分析基本原理和方法,并灵活运用到实践中,不论简单还是复杂的分析方法,只要能解决问题的方法就是好方法。
(五)玩转数据分析工具
数据分析工具建议先玩转Excel数据透视表,有兴趣、时间、需要的话,再针对学习SPSS、SAS等统计分析工具。同样,能解决问题的工具就是好工具。
(六)学会用图表说话,玩转PPT等工具
学会如何用图标有效展现分析结果,PPT有助于分析结果展现,达人必备;水晶易表亦对分析结果的展现有很大帮助,选择性使用;思维导图可以帮助理清思路,选择性使用。
(七)勤思考、多动手、多总结
1.需要经常发问:为什么是这样的?为什么不是那样的?只有这样才有突破点;
2.光靠脑袋想是不够的,需要多动手实践,不要怕错,大不了错了重来,数据分析就是一个不断假设、验证的过程;
3、不断总结分析方法、分析思路、分析流程,在总结中前行。
(八)关注行业动态
关注数据分析行业动态,如关注业内人士微博、博客或者公众号等
(九)收藏基本分析秘籍
收藏几本实用的分析工具书,以便随时查阅。
(十)锻炼身体、享受生活
数据分析不仅是个工具,而且是门艺术,优秀的数据分析师不仅要懂业务、懂管理、懂分析,还要懂创意、懂设计、懂生活。
八、常见数据分析Q&A
Q1、成为数据分析师还需要有哪些准备?
常见的招聘网站都会有要求
Q2、如何培养对数据分析的兴趣?
A:建议如下:
1.了解数据分析是什么?
2.了解数据分析有何用?能解决什么问题?
3.可以看看啤酒与尿布等成功数据分析案例
4.关注数据分析牛人微博,听牛人谈数据分析
5.多思考,亲自动手实践,体验查找、解决问题的成就感
6.用好搜索引擎等工具,有问题就搜索,你会有惊喜发现。
Q3:是练好技能再找工作,还是找一份数据分析要求不太高的工作,在工作中提升?
A:建议在工作中进行学习实践,这才是最好的提升,光看书,没有实践都是虚的。
Q4:是否需要考证,有哪些证书可以考?
A:关键还是在数据分析工作经验的积累。当然应届生有证比没有好。如果要快速学好数据分析,关键还是要从解决问题的角度出发,采用合适的分析方法和工具,多思考、多动手,所谓实践出真知。
Q5:数据分析方面有哪些好的分析工具推荐?
A:首先是要熟悉业务及行业知识,其次是分析思路清晰,再次才是分析方法与工具。不论Excel、SPSS还是SAS,能解决问题的工具就是好工具。问题的高效解决开始于将待解决的问题结构化,然后进行系统的假设和验证。
分析框架可以帮助我们:
以完整的逻辑形式结构化问题;
把问题分解成相关联的部分并显示他们之间的联系;
理顺思路、系统描述情形/业务;
然后洞察造成我们正在解决问题的原因。
一张图告诉你如何选择工具进行学习,可以分为三条线:
Q6:从事数据分析工作,应该找什么类型的公司或实习岗位来积累经验?
A:建议是互联网、移动互联网、游戏、通讯类的企业。这类公司数据比较庞大,也较为重视数据分析工作。
要想清楚自己以后进入的行业,然后进行针对性学习,可以积累行业知识,加深对行业及业务的理解,毕竟数据分析是要熟悉业务及行业。
Q7:如何写好一份数据分析报告?
A:好的数据分析报告,首先需要有一个好的分析框架,并且图文并茂,层次清晰,能够让阅读者一目了然,结构清晰、层次分明可以使阅读者正确理解报告内容;图文并茂,可以使报告生动活泼,提升视觉冲击力,有助于阅读者更形象直观的看清楚问题和结论,从而产生思考。
Q8:怎么知道自己是否适合做数据分析?
A:1、兴趣
无论什么工作都须要兴趣,首先不能讨厌数字,如果对数字敏感,一眼能看出异常值是最好的
2、逻辑清晰
逻辑思维很重要,不然会被各种指标定义规则,与业务的联系纠结死。逻辑清晰对写好SQL等处理数据的脚本也更搞笑
3、业务理解
最简单的就是定义下网站的目标是什么,哪些指标可以作为KPI,用户从进入网站到达成网站目标的整个过程是如何实现转化的,能否画出业务流程图。
4、细心、耐心和沟通
做数据分析有时会很纠结,细心和耐心是很必要的,好的交流能够让数据师更好的阐述清楚各类问题
Q9:如何学习SQL?需要用哪个数据库来学习?
SQL是各数据库通用语言,只是在不同数据库上个别SQL语句会有不同,建议初学者使用ACCESS。因为ACCESS比Oracle等关系型数据库有一下优势:
操作界面友好,已操作;
ACCESS查询处理可直接生成SQL语句。