笔试时间:2015.05.27 下午
笔试题目(回忆):
-
什么是机器学习的过拟合和欠拟合?
A: 答案在李航那本《统计学习方法》的第一章
解释什么是结构风险最小化?
A: 答案在李航那本《统计学习方法》的第一章解释梯度下降法的过程。
A:什么是产生式模型和判别式模型?他们之前的区别是什么
A: 答案在李航那本《统计学习方法》的第一章用伪代码实现一种你熟悉的聚类算法?
A: 对聚类算法不熟,我随便写了一个k-mean,但又忘了其里面的重新选择聚类中心是什么的,所以就瞎写了。深度学习有哪几种,其参数更新方法有哪些?各有什么优缺点?
A: 这个比较在行,参数更新不都是梯度下降法嘛~结合自己的研究课题,
A: 这个*发挥。- 当训练好一个模型时候,再测试数据上做分类(预测),效果很差,改怎么处理?
A: 我好像只答了两点:1. 因为过拟合(在测试数据集合上表现不好),所以需要添加约束,或者增强数据。 2. 考虑到测试数据与训练数据有可能不是相同的分布,所以可以考虑应用迁移学习的方法。
面试时间:2015.05.31
面试题目:
- 介绍一下简历上的两篇文章。
- 用过什么学习什么框架,为什么用这个。
- 能现场求导卷积层的BP过程吗?
- 有没有对用过的框架进行改进过,都改进过什么?
我的提问:
- 你们美图公司目前用深度学习都做哪些方面的应用?
A: 主要在图像分类等领域的应用,我们组其实并不局限于深度学习,像Boosting方法,随机森林方法也都在用,深度学习的框架cuda-convnet 和caffe,theano 等都有用。 - 你们公司目前的数据量有多少?
A: 在分类上,数据比较少,不想ImageNet数据那么大,主要是想验证自己的算法,用的是共用的数据,自己的数据也有,最近也在标注了一些。
一些感受:
之前没有去听宣讲会,27号到教室的时候,他们都已经在考试了,不过时候试卷还没到,等了半个多小时考试,之前听网上说美图的实习生待遇只有1500包住,出奇的低,不过今天跟同班同学一起去面试的时候听说宣讲会时候有说实习待遇为3K–5K,在厦门,这水平还算ok。
之前通知是15:30之前到,因为是跟同学打车过去,去的比较早,差不多两点就到了,在一楼大厅那边等,给人影响很不好的一点就是,在外面等的哪些同学说话特别大声,保安都多次体现他们说话小声点,还是没用,给人影响特别不好。
面试最后,面试官说,他们这边更需要动手能力强一点了(基于我没有大改过Caffe代码的结论),我就知道没戏了。本来我还想反问下你凭什么知道我的动手能力 弱,但是憋住了没说。
不过整个研究生生涯快要结束的时候,的确发现自己代码写的太少了,比本科还少,整天看一些有的没的论文,是该找时间加强一些自己的代码能力。