闵应骅
这题目有点噱头。并不是说,你成天玩游戏,就可以做出科研来;而是说,你设计一个游戏,让全世界广大人民群众去玩,可能帮你解决科研的问题。群众的智慧是任何高性能计算机都模拟不出来的。本月的CACM发表了这么一篇文章,我觉得很有意思,向大家介绍一下。
华盛顿大学的科学家企图研究一种能够帮助人类免疫病毒繁殖的蛋白质的结构,以开发攻击这种病毒的药物。搞了10年没搞出来。他们告诉了一个同事,设计了一个蛋白质折叠电子游戏Foldit,玩家们重新安排蛋白质的结构,使之成为一种最低的能量形式,很可能自然界的这种蛋白质就是这种形式。在三周时间内,有57,000多人玩了这个游戏,这些人当然并没有分子生物学的训练,但结果却发表在Nature Structural and Molecular Biology杂志上。你说神吗?
卡内基梅隆大学一位副教授开发了一个ESP游戏,已被Google接收,它同时对两位随机选择的玩家显示一副照片,要他们输入一个词来描述这幅照片;当他们选择同一个词时,他们就赢了。人们玩这个游戏实际上就是给这照片以标签。计算机科学家用机器学习的办法分析这些标签,就可以解释这幅照片。长远来看,也许计算机就能够理解人能够理解的东西。2011年底,他又推出了一个众包软件Duolingo,让大家来做机器翻译。它帮助人们学习外国语。它给出一个句子,要玩家翻译成他自己的语言,从简单的句子开始,逐渐复杂化。计算机提供单词的字典翻译,由人去理解整个句子的含义。如果有100万人参与,预计英文Wikipedia的每一页可以在80小时内翻译成西班牙文。
可以众包的另一个人类技巧是对异发事件的关注。牛津大学物理系一位研究员说:要识别太空图像,从月球火山口到椭圆星系,可以用Galaxy Zoo,一个邀请大众参与,帮助分类超过100万星系的在线天文学项目。这是一个人工协作的项目,在大众的帮助下可以加快科学研究进程。
我们所说的“人肉搜索”其实类似于英语中的“群众外包”,简称众包。众外是指征求大量群众(多是网民)的意见来解决问题。不管计算机的运行速度有多快,运行时间有多长,由计算机模拟来寻求蛋白质折叠结构或者有关连续统集合的一些问题都是非常困难的。也许是因为在可数集合里面来重现某些连续统的性质,基本上不可能。玩游戏包含了人的灵性。计算机和人合作提供了更强大的力量,来解决问题。
原文地址:点击打开链接