CiteSpace陈超美
在科研工作中,我们常常需要面对海量的文献,如何在这些文献当中找出值得精读、细读的关键文献,挖掘学科前沿,找到研究热点就成为了开展研究之前首先需要解决的问题。CiteSpace作为一款优秀的文献计量学软件,能够将文献之间的关系以科学知识图谱的方式可视化的展现在操作者面前,既能帮助我们梳理过去的研究轨迹,也能使得我们对未来的研究前景有一个大概的认识。
CiteSpace 又翻译为“引文空间”,是一款着眼于分析科学分析中蕴含的潜在知识,是在科学计量学、数据可视化背景下逐渐发展起来的引文可视化分析软件。由于是通过可视化的手段来呈现科学知识的结构、规律和分布情况,因此也将通过此类方法分析得到的可视化图形称为“科学知识图谱”。摘自 李杰.CiteSpace中文版指南
正如科学计量学界的权威专家刘则渊教授对CiteSpace知识图谱形态的概括一样,“一图展春秋,一览无余;一图胜万言,一目了然”。近年来,使用CiteSpace开展的研究、发表的论文呈现不断上升的趋势。根据中国知网的统计,2017年相关论文已经达到388篇;到2018年预测将达到423篇。
在如此多同质化的文章面前,我们应当如何做好自己的研究才能够不落入俗套,进而脱颖而出呢?我认为,在深入的把握CiteSpace的原理的基础上,熟稔相关操作背后的含义,对CiteSpace软件的应用达到游刃有余,这样才能知道自己的研究需要什么,做到“知己”。同时了解相关文章的研究套路,清晰他们的研究内容和研究思路,取其精华,规避其错误,做到“知彼”。下面根据我个人的一些学习的体会和实际使用的情况对CiteSpace使用过程来跟大家做一个基础性的介绍。
一、CiteSpace的下载与界面介绍
访问http://cluster.ischool.drexel.edu/~cchen/citespace/download/下载CiteSpace,一般下载最新版。当前(2018年10月14日)最新版为5.3.R4,新版本在原来版本的基础上增加了引文级联引用功能。
使用CiteSpace需要先安装JAVA 8,安装教程参考jdk 8下载和安装步骤
下载完成后解压,打开StartCiteSpace_Windows.bat。一般选择英文。
进入下一个界面,提醒使用者在使用这个软件开展研究的发表论文的时候,别忘了把软件开发者的论文引用上,不同意就用不了,那我们当然选择同意。
CiteSpace的功能区域很质朴,分为执行操作区、时间选择区、文本处理功能区和网络配置功能区等。在随后的论述中,再对这些功能区进行逐一展开。
二、CiteSpace的数据来源与下载:分析的原料在哪里
使用CiteSpace分析某一主题的研究历史与研究前沿,第一步就是要从文献数据库上下载到一定数量的文献信息。外文文献信息一般在web of science(WoS)上下载得到,中文文献信息一般在中国知网(CNKI)上下载。CiteSpace是基于WoS的数据格式进行开发的,可以根据下载得到的数据进行合作网络分析、共现分析和共被引分析,在非WoS数据库下载得到的数据都需要先转化为WoS的数据格式,根据相应数据库的数据维度各有其相对应的适用范围。就数据库的深度看,外文数据库我们一般使用WoS,中文数据库一般使用CNKI。
另外,中文的文献数据库还有CSSCI数据库、CSCD数据库等,外文的文献数据库还包括Scopus数据库、Derwent专利数据和其他专业领域的数据库等,下载方法参考《CiteSpace:科技文本挖掘及可视化》第2讲。
在数据检索时,一般有两种检索策略,分别是:
- 按照关键词检索
- 按照期刊检索
我们以按照关键词检索为例,说明如何从文献数据库中,下载得到我们所需要的文献数据。
1、在WoS上下载数据
在WoS上下载数据,访问WoS的官网http://apps.webofknowledge.com。操作的第一步是登录,假如没有账号,需要先行注册一个。没有登录的话,是无法下载数据的。
以关键词“学习成果评价”为例,键入其英文“learning outcome assessment”,数据库选择“Web of Science核心合集”,检索类型选择“主题”,时间跨度选择“所有年份”。我所在的学校购买到的数据库是从1985年开始的,时间跨度可能对有些朋友而言不够长。当前国内购买WoS数据库跨度最长的地方是中科院文献情报中心,是从20世纪初期就开始的,有需要的朋友可以到那里进行数据下载。
得到如下页面。从页面中可以看出,该主题词下的索引结果有10054条。下一步,需要对检索结果进行精炼。
文献类型选择“文章”,点击精炼。得到的最终检索结果为7050条,这些文献数据使我们最终想要的。
随后,滑到底部,将记录改成每页显示50条。
回到顶部,按照下图步骤,分别点击“选择页面”,“添加到标记结果列表”,就完成了这一页面的数据添加。最后点击“下一页”,循环这个过程。WoS最多支持500条数据保存一次。
在标记完500条数据后,选择“保存为其他文件格式”。
随后,记录内容选择“全纪录与引用的参考文献”,文件格式选择“纯文本”,点击“发送”,就可以得到刚才我们标记过的500条文献信息了。
下载得到的内容包括论文标题、作者、资助基金、关键词、来源期刊、所属领域、论文摘要、参考文献等等。对余下文献信息做相同的操作,即可以得到所需要的数据全集。
Tips:
- 关键词的翻译,例如“学习成果评价”,找出几篇以“学习成果评价”为关键词的引用率较高的文献,中外比较类(例如比较教育学)的研究最好。参考其下的英文对照翻译,综合选择即可以得到我们需要的英文关键词。
- 查看相关数据时,最好时候Notepad++、sublimetext等编辑器。格式更加醒目、清晰。
2、在CNKI上下载数据
在CNKI上,同理,访问www.cnki.net,键入检索词“学习成果评价”,每页显示选择“50”,勾选“全部选中”按钮,点击到下一页,同样以500条数据为一次下载。
在选择完毕后,点击“导出/参考文献”。
选择Refworks,点击“导出”,就完成了本次下载。
得到的数据维度比WoS得到的数据维度要少一下,仅包括作者、标题、来源期刊、关键词、摘要等。对余下数据做同样的操作,就可以得到中文的数据集。
在得到数据集后,需要将这些数据集转化为CiteSpace可以识别、读取的数据格式。参考如下tips即可完成转换。
Tips:
- CiteSpace自带有数据转换的功能,但不太好用,容易出现一些问题。推荐下载使用格式转换器。转换器下载链接
- 转换后会将原本集合在一个txt文件中的数据打散,生成一条数据一个txt的形式,txt文件过多会极大的降低了CiteSpace的运算速度。为了解决这个问题,打开命令行工具(cmd),输入下面的代码,将这些TXT合并成一个。 引自:将多个txt文件合并成一个