一、引言
做图像处理的人都知道图像领域的三大国际顶会分别是CVPR,ICCV和ECCV。同样,在数据库(也包含数据挖掘)领域同样有三大国际*会议,它们分别是SIGMOD,VLDB和ICDE。因为数据库与数据挖掘彼此有互有交叠,因此如果将数据挖掘也纳入其中,那么在某些推荐排名中类似SIGKDD也会被纳入。本文将把重点放在数据库领域,所以我们探讨的三大顶会主要是指SIGMOD,VLDB和ICDE。
从一些计算机类会议和期刊的评价推荐体系中,都不难发现上述三大顶会的绝对领导地位。首先,中国计算机学会推荐国际会议和期刊目录中(http://www.ccf.org.cn/sites/ccf/biaodan.jsp?contentId=2903940690081),SIGMOD,VLDB和ICDE都别列入Rank A行列。
此外,新加坡南洋理工大学给出的数据库领域国际会议排名(http://www3.ntu.edu.sg/home/assourav/crank.htm)也将上述三大会议列入Rank A行列。
二、SIGMOD
事实上,尽管三个会议都是Rank A行列的,但是它们的重要性和影响力并非是伯仲之间,而是处在三个不同的梯度。其中SIGMOD就是重中之重,比另外两个会议的含金量更高,被录取的难度更大。
ACM SIGMOD(Special Interest Group on Management Of Data)的论文录取率是很低的,平均录取率大约仅为15%-17%。以ACM SIGMOD 2007年在中国北京举行的那次为例,会议共收到论文480篇,录用了70篇。录用率仅为14.6%。而同为*会议的VLDB和ICDE的录取率为18%-20%。从录取率中就可以反映出论文被ACM SIGMOD会议录取的难度之大。
ACM SIGMOD数据管理国际会议是由美国计算机协会(ACM) 数据管理专业委员会(SIGMOD)发起、在数据库领域具有最高学术地位的国际性学术会议。SIGMOD的前身是SIGFIDET,SIGFIDET成立于1969年,而在1970年的9月,它转变为了SIG。4年后,于1974年,SIG决定改名为SIGMOD (Special Interest Group on Management of Data)。
SIGMOD会议于1974年在美国密西根(Michigan)首次举办,PODS会议于1982年在美国洛杉矶(Los Angeles)首次召开。这两个会议于1991年在美国丹佛(Denver)首次联合召开,这次联合举办会议的尝试取得了巨大成功,并大大鼓舞了整个数据库界理论和系统的结合。之后SIGMOD会议和PODS会议都是同时举行。
几十年来,ACM SIGMOD/PODS会议已经向世人证明了它是世界*的数据管理会议。会议的目的是在全球范围内为数据库领域的研究者、开发者以及用户提供一个探索最新学术思想和研究方法、交流开发技巧、工具以及经验的平台,引导和促进数据库学科的发展。SIGMOD会议第一次于1975年在美国加州圣何塞 (San Jose, California)召开,往后每年都在不同的地方召开,但从1975年至今的几十年里,SIGMOD会议几乎都在北美国家举办(其实主要就是美国,少数几次在加拿大)。
由于ACM SIGMOD会议是由SIGMOD/PODS两部分组成的,所以它的主体同时包含了SIGMOD 和PODS的内容。Research Session,Industrial Sessions,Tutorials,Demonstrations,Keynote Talks,Panel Sessions,Research Plenary Sessions,workshops以及PODS Sessions。它覆盖了当前数据库和信息系统研究中存在的前言问题,而数据库仍是 21 世纪的新兴应用技术的基石之一。SIGMOD会议已经成为了数据库管理领域最杰出的研究和发展成果的实时传播场所。
被SIGMOD接收的论文中,总体上看中国学者的论文还是比较少的。从中国万维网联盟(W3China.org)上的一个分析报告中可以反映出这点:该报 告指出到2006年为止,SIGMOD上共接收了1790篇论文,而其中属于*学者的就9篇,占大约0.5%。这是一个比较小的比例。但是近年来国内逐渐开始重视科学研究,理论证明和技术创新,中国学者的论文在SIGMOD上的数量也在不断增加中,质量也在不断提高中。相信经过不断地技术创新和理论 证明,中国数据库界会在SIGMOD/PODS上发表更多的好文章。
三、VLDB
VLDB (Very Large DataBase) 是数据库研究人员,供应商,参与者,应用开发者,以及用户一年一度的主要国际论坛。VLDB国际会议于1975在美国的弗雷明汉马 (Framingham MA) 成立,第一届VLDB就吸引了近100篇文章和150多个参与者,取得了巨大的成功。随着时间的推移,VLDB会议的质量逐年增加,参与者更是一年比一年多。
VLDB是由VLDB基金会赞助的,该公司成立于美国,是一个非盈利性机,它的唯一目的是促进和交换数据库和世界各地的相关的领域中的学术工作。VLDB基金会作为VLDB系列会议的指导委员会。2010年前,会议的审查工作都是由VLDB基金会单独完成的,而2010 年是第一次与PVLDB 进行合作,并且从2011年开始,会议的审查过程将完全通过 PVLDB来完成。这也从原来的一年一次的投稿变成了一年12次的投稿,为学者们提供了更多的机会和空间。
VLDB会议的主体包含有research talks,tutorials, demonstrations 以及 workshops。它覆盖了当前数据库和信息系统研究中存在的前言问题,而数据库仍是 21 世纪的新兴应用技术的基石之一。VLDB会议已经成为了数据库管理领域最杰出的研究和发展成果的实时传播场所。
VLDB主要由四个主题构成,分别为:Core Database Technology(核心数据库技术),Infrastructure forInformation Systems (基础设施信息系统),IndustrialApplications and Experience (工业应用与经验) 以及 Experiments and Analyses(实验和分析)。从09年至今的数据分析来看,VLDB的论文接受率总体是比较低,其中,核心数据库主题中的论文接受率大概为 16.7%;基础设施信息系统方面的论文接受率大约为17.9%;工业应用与经验的论文接收比例近视为18%;而实验和分析部分的为19%左右。由此可见 论文被VLDB接收不是件容易的事情,必须是创新性很高,贡献很大的论文才有机会被录用。
VLDB会议直到2004年前都是由Morgan Kaufmann Publishers 来发表的。2005年是由ACM来发表的。该会议的前23次(1975-1998)被收录到了ACM SIGMOD Anthology中。
VLDB第一届在Framingham, Massachusetts举办,往后每年都在不同的国家召开,而这些国家几乎都是发达国家,唯一一次在*举行是2014年,VLDB是在杭州举行的。被VLDB接收的论文中,总体上看中国学者的论文还是比较少的。但是这两年国内逐渐开始重视科学研究和技术创新,中国学者的论文在VLDB上的数量也在不断增加中,质量也在不断提高中。与往年相比, 中国的论文数量也在不断提升。例如在VLDB2010被录取的论文中,*学者有15人左右,香港9人,全部作者共540人左右,占大约4%。
四、ICDE
ICDE的全称是 International Conference on Data Engineering,由IEEE主办,每年一次。ICDE尽管与SIGMOD和VLDB并列数据库领域三大顶会,但是ICDE是这三个会中重要性最弱的,相对文章录取率也最高。
五、总结
随着中国科技实力的发展,中国学者在国外发布高质量研究论文的数量也越来越多。但是中国目前大多数高校的评价体系还是以SCI或EI收录为指标。相对而言,国外的学者比国内更关心论文的发表档次,武林的排名。但是,一般只有期刊才有影响因子,会议室没有影响因子的。所以在不同的学术组织和体系中,一般会根据论文的录取比率和引用量来对会议进行档次划分,就像本文最开始给出的那两个参考排名一样。
更有甚者,干脆用算法和数学工具来分析一把,再工工整整写篇论文投到SIGMOD,VLDB。这样的文章中稿率还挺高的。SIGMOD 2005 Record就有一篇研究会议的影响因子的论文。这篇论文做得很严谨,从文中可以看到,SIGMOD和VLDB的影响力远远大于我们原先的估计,根据DBLP和Google的论文统计,从94-03年的 每一篇SIGMOD文章平均被引用70次,VLDB文章平均被引用50次。即使只算期刊的引用,SIGMOD和VLDB的影响因子也大于10,此外,在被应用的文章次数上,美国占了75%,是当之无愧的世界霸主,可怜的中国没有进入十强,所占的比率连0.7%都不到。
另一方面就是,*会议,如SIGMOD和VLDB的委员会成员们非常重视会议文章的录取有效性,每年都要开会讨论审稿程序。SIGMOD 从2001年起开始双盲审稿,初衷是保护不出名的作者的权益。一篇论文做了调研,对于数据库领域最*的28位“Prolific Researcher”(超级牛人),在SIGMOD 01-05发表文章的百分比仅从40%下降到36%,双盲效果并不显著。而没有双盲审稿的VLDB,牛人文章的百分比一直在30%左右。
让人比较感兴趣的是另一个层面,数据库领域这最牛的28位研究者,平均每年发表0.8篇SIGMOD和0.7篇VLDB,也就是说,只要能够在10年内发表15篇左右的SIGMOD or VLDB,就能排进“世界数据库前30名高手”……
SIGMOD 2005首次采取了feedback机制,即作者可以在录取决定之前3天看到自己文章的评论,并与审稿人沟通,委员会认为,这样做的最大好处是,让作者有了发泄的机会,可以与审稿人argue一下,死也死得瞑目了。
从2007年开始,SIGMOD 和 VLDB 将联手合作审稿,被SIGMOD 2007据稿的文章,投稿到VLDB 2007的时候,SIGMOD 将提供其审稿意见,也就是说,如果文章没有按意见改进的话,撞运气是没有用的。这更像是期刊的审稿而非传统的会议。
另一有意思事情的就是VLDB 2005报告中提到的有关期刊的录用率:会议的平均录用率(不算Demo):SIGMOD 15%, VLDB 18% ICDE 17% SIGKDD 15% Dasfaa WAIM APWeb etc 18%—25%;而数据库两个影响因子最高的期刊,TODS和VLDB J. 平均录取率都在35%以上(VLDB J. 99和01在50%左右),不过第一次审稿意见反馈要6个月以上,整个文章的周期一般是10-20个月。而文章的长度则一般为30页以上。这些期刊都需要较长的等待时间,比较适合直博或教师投稿。
如果在Google上搜索的一些其它期刊的录用信息:Nature杂志各个领域的录取比率都差不多,为14%-15%; Cell 15-20% ;Science 也是在百分之十几左右。Physic Review Letters的录取比率,近年来“大幅下降”到34%。IEEE Transactions 不同的领域录取率不同,一般20% - 45%。计算机学报英文版 JCST 15%,软件学报中文版 13.6% ……
看来无论国内国外,计算机这一行的竞争确实很惨烈啊。
----------------------
参考文献:
本文内容部分整理自http://blog.sina.com.cn/fengshenzhu,作者表示文章系转载,但原始链接地址已经失效。