说起来也算是第一篇面经,也算是给自己记录一下。从回国开始面试,加起来也有两周以上的面试经验了,拉勾网上投递主要还是创业公司给的面试机会更多,然后个人定位在数据挖掘这块。
腾讯这边算是内推,和HR联系的时候也是强调了数据挖掘这块,但是最后是算法工程师还是和自己意愿有点差距,自然面试过程也是被吊打
简单记录一下流程:
1. 项目方面
面试官挑选了数据挖掘的项目,我大概介绍了以后很快就进入了理论问题的阶段,因为项目里提到了特征提取,所以面试官想就PCA方面问问题,项目这块很快就过去了。
2.机器学习理论
a. PCA
为什么特征解可以描述主成分
解释一下归一化
b. 树
解释随机森林的随机性
在随机森林中,因为feature选择时候也有随机性,那么信息增益大就能说明选择哪个feature切割更好吗
c. logistic regression
简述一下过拟合这个问题以及过拟合的原因(数学理论方面,而不是表现上)
过拟合的应对措施有哪些(实际中加入噪声的方法效果好,而且比正则化简单)
L1,L2范数的理解,优缺点,应用场景
L0了解吗
d. 实时数据的处理
一般lr是在线下做的,但比如音乐推荐中,用户一直听“乡村“类型的歌曲,在搜索4、5首摇滚歌取以后,如何马上推荐摇滚类
3. 深度学习
因为自己学艺不精,就没有在这块浪费面试官时间了
在强调原创性和学术性方面,我还是离得比较远的。应届生面试还是要着重理论基础,特别是这些算法的原理。