我的研究体验--转浙大杨骏的研究心得(比较实在的)

时间:2022-03-10 00:32:33
我的研究体验
    作者:杨骏(竺可桢学院96混合班)
  

写在前面
  
  
我不奢求我的一点研究体验能够引起广泛的共鸣,但只要有一个人读了之后能有所启发,并对他今后的学习工作产生积极的影响,我就将心满意足。同时,为了让大家觉得我的感受有所参考价值,我先简要说一下我的一些研究成果,因为“不能让人致富的哲学是没有人听的” :-)
  
我在浙大计算机系读硕期间,在多媒体信息检索领域内发表了近二十篇国际期刊/会议论文,一项美国专利(申请中),曾在西门子、微软研究院短期实习,在香港城市大学担任研究助理近一年。毕业后得到了IBM Research Lab (Beijing),Carnegie Mellon Univ (CMU)的计算机系等一些学校的offer,如一切顺利将选择在CMU读Ph.D。
  
选择方向
很多人都希望找到一个“容易”的方向。我的个人感觉是的确有一些“容易写paper”的方向,但没有特别“容易”的方向。每个方向上都有一些做得很出色的人物,从这个意义上说也许所有的方向都一样好。当然,每个方向有自身的特点,有的理论化一些,对数学要求高一些(比如人工智能、计算机图形学);有的则接近应用一些(比如我做的多媒体),所以需要找到的是适合自己的方向,而不是盲目听从别人那些“xxx太容易出成果了","xxx已经做到头了"。研究领域柳暗花明的例子很多,比如人工智能技术运用于数据库后改头换面成了数据挖掘(data mining),又养活了一大帮人 :-)
  
    很多人都希望有人告诉他们一个方向。事实上,也许导师会给你指定一个大的领域,小的方向大多是要自己去寻找的,办法就是reading!!! 我在硕士期间读过超过150篇专业论文。我的感受是当你开始读别人论文的时候,很自然地就会发现许多问题和不足,有时作者自己也会谈及将来的工作,这就成为你的研究的契机。
  
    还有如何寻找paper的问题。如果你开始进入一个陌生的领域,你可以咨询那些在该领域中有经验的人(比如师哥师姐),哪些paper是值得读的。CS专业的人可以参考ResearchIndex网站(http://citeseer.nj.nec.com/),那里对CS的paper按方向进行了分类,大类下面还有小类,因此你可以选择你那个类的paper来读。另一个诀窍是在开始的时候选择综述性(overview)文章和引用次数很高文章(在CS领域,引用几十次的文章就是经典了)。当你读过一些paper之后,通过它们的参考文献(reference)就可以辐射式地找到更多的paper。对于一篇已知作者和标题的文章,大多数情况下通过Google 就可以找到电子版,
  
如果没有则可以写email问作者要。
  
关于天赋和勤奋
    关于程序员有这样一种说法:一个有天赋的人通过不断努力会成为一个伟大的程序员,一个天赋平平人通过不断努力也会成为优秀的程序员。根据我有限的观察,大多数成功的人都属于后一种类型。事实上,我几乎没有看到过天赋很高而又很勤奋的人,相反却看到过不少天赋被浪费的例子,这也是我自信的源泉。因为我知道只要我日复一日地努力,总有一天会达到目标的。
  
    我在香港城市大学做研究助理的时候,为了赶paper deadline有过不间断工作40-50个小时的经历。每次投会议的论文,我都会看看举办地,因为deadline基本上是以举办地的时区为准,一般比中国的时区都要晚一些,所以多出几个小时可以修改(有一次是Hawii的会议,比中国晚18个小时,我开心死了)。我经常在deadline之前5分钟内在网上提交我的论文,为的就是尽可能地改得好一些。我在香港的导师经常说"Good papers are always submitted in the last 5 minutes"。他晚上回家的时候车经常是停车场上的最后几辆。
我3年前在微软研究院的时候,也常常在晚上11点之后在电梯里碰到老板。
  
    看看我一个在MIT读MBA的朋友写的一天流水账,对我有很深的触动,抄在下面:
  
Last night I read case till 1am and I got up at 7:30 am this morning and went to class from 8:30 to 10:00, then rush to library to finish a homework due at 12:00 pm, then I had a teammeeting from11:30am to 1:00pm, then I had class from 1:00 pm to 4:00 pm, then I have another teammeeting, which we need to drive 40 minutes from Boston, so that last from 4:00 to 7:30, then I have a market research interview, from 7:45 to 10:00 pm,then I came back home....
  
then there's a fire alarm, which we need to go out of the building and stand in the -10°C wind and I   came back at 11:00 pm, starting reading a case for tomorrow, which is 20 pages long, and I still have a homework I   need to look at ....the case will be discussed 10:00 am tomorrow....and the homework is due 1:00 pm tomorrow. I had my dinner when I read the case. It's 00:49 am now...I will take a shower and start looking at my homework.............
  
paper!!
   首先,绝对不要一稿多投,这个很显然的问题被人在BBS上问了太多次。也许你做过很多次都没有问题,但一旦出问题可能是致命的。我们要像爱护自己的眼睛一样爱护自己的信誉。
  
    其次,态度要认真。这几年来我自己审过超过50篇英文论文,其中大约十多篇来自国内。在这十几篇中,我记得除了一篇之外我都拒了,原因不是因为他们的研究内容不够好(我甚至没能读懂他做了什么),而是语言实在是太差了。更让人痛心的是,不是主要因为作者的英语能力不够好,而是态度太不认真了,在title中竟然有拼写错误(不要说你不知道Word会自动提示拼写错误)。我甚至看到过title中的一个"the"写成了"tHe",abstract中几乎找不到一句没有语病的句子。我不相信作者的英语差到这种地步,更有可能的是作者在写完之后连读都不愿意多读一遍。再公正再有耐心的审稿人,读了这样的abstract之后也会准备开始拒了。
  
    一篇成功的paper中语言和研究内容的重要性大约各占50%,这并不意味者英语水平一般的中国学生就不能写出好论文了。论文中语言的要求是清楚、简洁、准确,同时段落组织 合理,并不要求复杂的句式和单词。在写完之后,对论文反复修改3-4次是绝对必要的,一定要打印出来一字一句地修改(对着电脑难以发现错误),每次修改之间最好隔一段较长的时间,以避免思维上的惯性。
  
   在写头一两篇论文的时候最好能有一个有经验的人帮你一起修改。我的第一篇论文有幸是在微软研究院的一位研究员指导下进行的,短短的4页纸我改了近一个星期。我至今还记得他用Word的审阅功能把我的paper改的大红大绿,面目全非的样子,很多是对用a还是the,用for还是of这些细节的修改。经过了那次痛苦的经历,我以后写paper就顺手多了,慢慢有了驾轻就熟的感觉。
  
    还有投稿要持之以恒。我尽管发表和收录近20篇论文,被拒的次数应该也差不多这个数了,也许更多。比如CS领域的*会议的接收率在10-15%之间,也就是平均投7篇才中一篇,更何况你的竞争对手可能来自Stanford。就我自己而言,大约投过6-7次*会议,投中过一次,符合统计规律:-) 所以被拒绝对不是什么丢脸的事,而是可以从中汲取很多建议的好机会。我有一篇被*期刊据的paper,三个审稿人给的评语加起来超过了11页(A4纸),快有paper本身的一半长了。
  
天外有天
    我在申请PHD的时候尽管得到了一些好学校的offer,也被很多学校拒了,比如Stanford, UC Berkeley, Cornell, MIT。一位朋友对我被很多学校拒感到吃惊,觉得凭我的简历应该是所向无敌的。我的感受恰好相反,我觉得能被CMU这样CS方面顶尖的学校选中是非常非常幸运的。因为这个世界上牛人实在是太多了 :-) 我敢说CMU再多招50个人,其优秀程度(而非合适程度)是不会有丝毫逊色的!
  
       INTEL前总裁Andy Grove说过一句话我一直用来提醒自己 "Don't take yourself tooseriously"。即便浙大也绝对是一个藏龙卧虎的地方。我所认识的一些浙大人,他们的知识绝对是上通天文地理,下晓人文历史,而他们的经历更让我只有"景仰"二字形容,而他们中的大多数为人处世都是比较低调的(这也是他们成功的秘诀之一)。一位我一直把他当作大哥的朋友,在我现在的年纪就已经创办过千万级的软件公司,在美国工作过,周游过世界,同时精通登山、摄影、自行车(7次*,曾从杭州骑车前往)、多项运动(体校出身),对历史、篆刻、书法、古典音乐也多有涉猎。此仁兄只不过是杭大(合并前)的一名普通本科毕业生,为人极其谦和低调,对朋友也是两肋插刀(他肯定不想被人提起名号,因此略去)。
  
这些真正的强人让我为BBS上许多所谓“名校研究生”、“牛人”的狂妄言语而汗颜,深感如芒在背。另一方面,也让我觉得普通人凭借坚持不懈的努力同样能够做出一番事业,因为这些强人的天资并无太多过人之处,就读的学校也很一般,他们成功的第一秘诀是勤奋。“王侯将相,宁有种乎”。我们每个人不管目前处于什么状态,只要用功总是能做出一些事情的。
  
别看不起导师和学校
     BBS上说导师坏话的贴子要远远多于赞扬的。诚然,我们的导师们确实不尽如人意,他们的研究工作未必都是第一流的,个别在师德方面也有问题。但是,导师们也可能在抱怨,他的学生中怎么就没有出几个杨致远(Yahoo创始人),S. Brin和L. Page(Google发明者),要知道他们几乎都是在课余完成大业的。牢骚太盛防肠断!我见过太多的研究生,一边抱怨实验室的东西没意思,一边每天把时间泡在88灌水、看片上,最后一事无成。这样的人即使身处条件优越的实验室也未必能有所成就。无论顺境逆境,我们每个人都没有消磨时间浪费青春的权力。
  
     我很幸运地拥有一个优秀的导师和感兴趣的方向。但是在3年前我也怀疑过我的导师,也觉得当时的方向很无趣。庆幸的是,我没有选择消磨时间,而是争取到自己比较感兴趣的课题,并通过努力取得一些成绩。现在回头看看,当初的怀疑更多出自误解和缺乏沟通,现在我为做过他的学生而自豪。
  
     还有很多人在抱怨学校,当然我也曾是其中一个。诚然,中国的大学普遍缺乏一个有效合理的system,我深信这是诸如研究水平低下、学术腐败、教师们不安心于校园的深层次原因。比如在现有制度下,国内一个教授通过做学术研究并不能保证他拥有优越的生活水平,这就导致了热门专业的教授一窝蜂地开了公司,学生成了廉价劳动力。去责怪教授的道德水平是没有实际意义的,国外那些学富五斗的教授到了这种制度下会做出同样的事!! 然而,中国特点决定了这些制度的改善在目前只能是缓慢进行的,因为每一步都会有来自许多既得利益者的阻力。所以,作为学生,我更倾向于“穷则独善其身”,做好自己该做的事情,把你的想法留到“达则兼济天下”的那一天。
  
    另一方面,就在这个离世界一流还相去尚远的浙大,也不断地产生着杰出人物,即便是在落后得多的过去。一个学校的成功最终依赖于学生的成功。过分关注学校排名,为了浙大排在第4而不是第3 而耿耿于怀者,或者以为进了浙大就是高人一等的名校生者,一般都缺乏对自身能力的信任,真正是英雄的应该是“莫问出处”的。作为我自己,最感到欣慰的成就(如果算得上成就的话)就是让浙大的名字出现在一些大陆学者没有或很少出现的学术会议和期刊上,也算对得起浙大给我带来的许多机会。最后,改了美国总统J.F. Kennedy的那句名言作为结束:
   Ask NOT what your school can do for you, ask what you can do for your school! 
  
关于coding
     计算机专业的不少学生很早就被灌输了"写程序完全是体力劳动,30岁之后还写程序就没出息"这样的思想。我所接触的一些计算机系本科和研究生coding的能力之差到了令人吃惊的地步(甚至有完全不会的)!上面的这种观点是绝对错误的。事实上,至少在CS的研究领域,年薪十几甚至几十万美元的人中许多人都自己编写程序,包括一些如雷贯耳的名字,比如Gim Gray。此君因为不喜欢Seattle的雨天,使得Bill Gates为拉他入Microsoft在San Francisco为其新建了一座研究院让他做院长。据说此君在一次学术会议上demo他的新程序,听众中有人提出界面可以如何改进,此君竟然在讲坛上就打开VC++开始改起代码来,然后给人看新效果 :-) 在这一方面,我觉得国内的导师们是比较弱的,当然这和他们 从一开始就不缺学生有很大关系。  
  
    当然,我对coding重要性的认识比有丰富工作经验的人差很多。我的经验主要是两方面:一、绝大多数CS的研究必须以实验为基础(尽管很多国内学生并不这么做),coding能力直接关系到研究的进展。二、coding可以加深我们对技术的理解,体会各种技术的优劣,使我们能更快更好开发出自己的系统。
  
结束语
就让这些文字作为我向母校默默的告别吧...... 七年的校园生活已经给我打上了浙大的烙印,我也将永远关注和祝福我的母校。
I love ZJU ! I love her so much ...