2011百度数据挖掘研发工程师实习生笔试面试题
发布时间:2012-04-30 11:48:45 投稿到ChinaKDD笔试题:
一、简答题30分
1. extern”C”{}的作用好应用场景;
2.写出两者你熟悉的设计模式,及应用场景,可以给出伪代码;
3.TCP中time_wait是表示那种状态,及应用场景,以及起好处和坏处;
二、算法题40分
1. 有一个任务执行机,任务数N<1000,该机器每次只能执行一个任务,而任务之间存在依赖关系,
但是任务之间没有循环依赖,请给出适当的任务执行顺序。算法、伪代码,并分析其时间复杂度和
空间复杂度。
2. 编写函数,统计在某段英文文本中完整句子的数目,文本中只包括大小写字母,空格,点好(.),逗号(,)。
完整的句子必须包含至少一个字母并以点号,结束。
要求:完整的代码,达到目标;高效;简洁;
三、系统架构30分
有一个监控系统,有大量的数据记录包括{url,用户访问ip,时间},要对这个监控系统进行维护,并提供查询。
设计一个能存储和维护1000亿条记录,实时监控,并支持一下两种查询:
1. 指定任意一个时间段(精确到分钟)和某个url,查处这个时间段内的所有url的访问总量。
2. 指定任意一个时间段(精确到分钟)和某个ip,查询这个时间段内的ip访问总量。
面试一
1.自我介绍;结合自己的简历简单地介绍一下。
2.项目介绍;结合自己做主要的项目,以及带的项目介绍资料,互动式地讲解;面试官关系的是机器学习相关的问题。
3.算法题;二叉树的非递归实现前序遍历;
4. 算法设计题;如何去掉重复页面;
面试二
1. 自我介绍;(同上)
2. 项目介绍;(同上)
3. 算法题;(略)问到了一个TTest;
4. 算法设计题;如何对Query进行分类;
1. 自我介绍;
2. 项目介绍;
3. 算法题两道;
1>一串首尾相连的珠子(m个),有N种颜色(N《=10),设计一个算法,取出其中一段,要求包含所有N中颜色,并使长度最短。并分析时间复杂度与空间复杂度。
2>从1到1亿,所有出现的数字的和(125=1 2 5),手工计算机出来;