数据分析面试题---业务篇(1)

时间:2024-10-28 11:00:18

这里是我第一次写文章,主要目的是记录自己从事数据分析师这个行业,自己的一些思考和想法,同时更新数据分析师所需要掌握的技能和面试的一些技巧,那么这次的第一篇,就从面试题开始。

数据分析师面试题中,有一类题目叫做--费米问题,比如面试官会问你:北京有多少星巴克,一辆公交车可以装多少人?

面试官他是真的想知道问题的结论吗?

其实不是,这些问题的答案,更多的是只有上帝知道的,所以我们只能给出我们的思路,也就是估算。

这类估算题,就是费米问题----它主要考察的是面试者的逻辑能力以及数据敏感度的问题。如果你从来没有接触过这类问题,你就会一脸懵逼,但其实费米问题的回答是有套路的,我们在答题的过程中,需要不断将难获得的数据一步步拆分成能够简单易得的说句,也就是将复杂的大问题,拆成多个简单的问题,这样就能解答了。

费米问题的解题套路----需求端、供给端。

1.需求端----从用户(客户)的需求出发

eg:全中国一年要消费多少猪肉---这个问题就是典型的费米问题,我们需要拆成小问题,那么从哪里拆起呢?

这里就是我们说的需求端,消费猪肉的人 拆分起:

公式:全中国一年的猪肉消费量 = 平均一个人每天消耗多少 * 全国人数 * 一年的天数

(会有同学纠结其他客观因素,但是费米问题的本质,就是考核你的:逻辑斯文的连贯性,不是在意最终的数字有多准确)

上面的公式中:全国人数和一年天数都是已知的,接下来要知道一个人一天消耗多少猪肉。

公式:每天消费的猪肉量 = 每天吃的肉量 * 猪肉占肉类食材的占比

(大家拆解的问题的时候,要有自上而下的视角)

这里已经可以开始按自己来估算了,不用再太细了:

每天吃的肉量:自己每天大概能够吃3块牛排左右的肉量,所以每天吃肉总量是300g,再思考猪肉的占比:每天会吃:猪肉,鸡肉,牛肉,鱼肉等,考虑实际情况,50%的比例是可能的:

所以每天消费的猪肉量=300g*50% = 150g

所以这里能够得到公式3:

全中国一年的猪肉消费量

=每天消费猪肉量全国人数*一年的天数
=每天消耗的肉量猪肉在肉类食材中的占比*全国人数*一年的天数
=300G*50%*14亿*365天
=7665万吨

这个和实际的数值是否准确,其实不重要了,你拆解复杂问题的过程  才是面试官看重的。

这里用的是个人来评估全国人的吃肉习惯,其实是不准确的表达,在面试的时候,可以用:

采用问卷访谈的形式,取了xxx数值的中位数,发现xxx。

其实也可以再细分成:不同区域的肉食比例不一样,不同年龄的人肉食比例不一样,都可以。

假如按照区域的角度去细分,原本的公式可以拆解成:

全中国因爱你的猪肉消费量:

=每天消费猪肉量*全国人数*一年的填数

=(西北地区每天消耗的柔亮*西北地区猪肉在肉类食材中的占比*西北人数*365)+

(南方沿海地区每天消耗的肉量*南方沿海地区猪肉在肉类食材中的占比南方沿海人数365天)

+(其他地区每天消耗的肉量*其他地区猪肉在肉类食材中的占比其他人数365天)

然后给出各部分的估算数据,相加即可。

2.供给端

供给供给,顾名思义,就是商品的提供方:商家,市场的供应维度出发,进行预测。

这里用费米问题的经典:星巴克问题:

楼下星巴克一年卖多少咖啡?:

第一步,拆解公式:

星巴克一年营业额 = 一杯星巴克的均价 * 每天卖出去的星巴克的咖啡数 * 365 天

一杯咖啡的均价是已知的,但是每天卖出的咖啡数量是未知的,下一步计算每天卖出咖啡的数量

每天的营业分成:忙时和闲时

每天卖出的咖啡数= 忙时产能 + 闲时产能

那么假设:公司楼下的星巴克,有2台咖啡机,每台可以同时制作2杯,那么一家咖啡店可以同时制作4杯咖啡

忙时:两分钟4倍咖啡-每分钟2杯,(一天忙时4个小时,闲时8个小时)

忙时:2*60*4=480

闲时:设备利用率20%---2*60*8*0.2=192杯

一年营业额:

30*(192+480)*365 = 736w

当然,供给端还可以拆分成:

一年营业额= 咖啡一年收入+茶饮一年收入+甜点一年收入

=咖啡工作日收入+咖啡非工作日收入+xxx

=咖啡工作日的杯数*天数*单价+xx

也可以从需求端思考:

一年的营业额 = 每天咖啡的人数* 咖啡均价* 365天

重点就是每天喝咖啡的人数,最简单的:分早中晚三个时间段来观察店铺人流量,得到3个数值进行相加;也可以考虑工作日和周末,看不同日期的人流量;或者通过年龄+性别来划分,都可以,没有标准答案,面试官关注的是你的思维逻辑,和拆复杂问题的能力

比如:一辆公交车能装下多少个乒乓球:

= 公交车的体积/乒乓球体积

=公交车长宽高/乒乓球半径xxx

总结:

费米问题是笔试最常见的,关键还是拆分问题,拿到问题之后,试图拆解成一层一层的小问题,再次击破小问题,拆分的时候,维度往往集中在:地区、年龄、性别、职业、时间段、

在这里有一些常用的数据,要记住:

1.城市人口:

一线城市2000-2500w人

其余新一线:800-1000w人

2.阶层数据:

年龄阶层,学历阶层,通常在计算食物,通勤,交通问题,可能要借助年龄阶层的数据可以提现自己更细致的思考

分析外卖、出行、共享产品时候,只要考虑职业结构数据(学生+企业)

(1)年龄阶层:

0-18岁:18-30岁:30-60岁:60岁以上 =20%:20%:45%:15%

(2)年龄阶层(2)

儿童:中青年:老年:15%:70%:15%

(3)教育层次:

未上过学:小学:初中:高中:专科&大学及以上=5%:30%:45%:10%:10%

(4)网民职业结构:

学生:企业(白领):农村:工人:其他 = 25%:20%:10%:10%:35%

3.互联网数据

在面试前可以针对特定公司准备数据,比如面试快手前,准备快手的数据,时间充足的话也可以同时准备抖音的数据。

(1)总计约9.04亿网民,其中手机网民占比99%,可约等于9亿

(2)互联网不同行业用户数:网络游戏用户5.4亿,网络视频用户8.88亿,网约车用户3.4亿,外卖用户4.09亿,网购用户7.49亿。

(3)APP用户数:快手3亿+,抖音4亿+