期待了很久,终于走上了机器学习&数据挖掘之路,从国内来看,这方面的研究和应用开发正在起步中,各大公司也开始想法设法在数据挖掘上赚一笔(如腾讯的KDD cuphttps://www.kddcup2012.org/ 2012知识发现与数据挖掘大赛),不少公司也都建立起了自己的数据挖掘相关团队(数据挖掘和机器学习的关系到底是什么样),但是我个人的感觉是机器学习和数据挖掘的产品相对较少,更多实在自身领域内开展了某项研究,得到了某某结论,产品经理或者是更高层的管理者阅读相关报告,对公司的主力产品作出进一步的改善,也就是说,数据哇据团队是一个类似于反馈机制的部门的存在。
但是,看过的文章都一直的认可其巨大的应用潜力,这种潜力,肯定不止于一个反馈环路,一定会有更多深入的应用。
对于我自己的问题,也是存在的,毕竟工程师、研究员、产品经理其实可以说大方向上还是有不一样的,干产品不懂技术、看不透前景,就没法儿设计一个好产品,但是工程师对于我来说需要一个更好的切入点,从零开始,掌握好这门学问的基础,毕竟计算机科学的很多相关知识还没有掌握。研究员、也是一个必然要经历和历练的东西,因为在这个过程中的思路就是怎样将研究转化为产品,什么效果好,什么简单,什么快速,都是需要知道的。
想自己做牛,首先自己的视野要宽广,要能Hold住全局,然后细节的东西才有资格、才有能力去分配给别人。
关于一些可能比较有价值的博客或者文章:
淘宝技术博客,有搜索有数据挖掘相关的文章,可以看到怎样将数据挖掘应用到提升用户上 http://www.searchtb.com/category/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98
数据挖掘研究院的《我的数据挖掘之路》
http://www.chinakdd.com/article-C7Vdmy3NO8B5p13.html
一篇06年发布的文章,数据挖掘的由来和应用等等相关知识
http://blog.csdn.net/weikunlun/article/details/663517
重头是这个,一个北航开发的“心情放大镜”,通过从微博上分析感情色彩来获取当前互联网大众的心情总体趋势,挺有意思
http://gana.nlsde.buaa.edu.cn/hourly_happy/moodlens.html
另外校内可以从水木的机器学习版获取一些学习知识
http://www.newsmth.net/nForum/#!board/MachineLearning