softcite-dataset:研究出版物中提及的软件的黄金标准数据集

时间:2024-05-24 15:05:24
【文件属性】:

文件名称:softcite-dataset:研究出版物中提及的软件的黄金标准数据集

文件大小:341.39MB

文件格式:ZIP

更新时间:2024-05-24 15:05:24

dataset HTML

Softcite数据集 德克萨斯大学奥斯汀分校的Howison Lab和在基于监督学习的研究出版物中提及的软件的黄金标准数据集。 为什么创建此数据集 软件为当今无量级的研究活动奠定了至关重要的基础。 但是,研究人员通常会对冗余,不兼容或支持不佳的软件感到沮丧( )。 改进用于研究的软件的一种途径是提高软件在基于文献计量的研究影响力系统中的可视性。 为了使软件对研究的贡献能够得到充分认可,软件创造者,资助者和其他利益相关者会更有动力进行合作,并提供更完善,质量有保证的软件工作。 我们已注释了生命科学和社会科学领域的约5k种开放获取研究出版物。 结果,我们在这些出版物中确定了4,093个软件提及。 这些软件提到的大部分都没有被正式引文编入索引( )。 因此,我们筛选出了许多有助于研究的软件,但目前对学术数据库和信息检索系统不可见。 数据集内容 我们是TEI / XML语料库文件,其中包含带


网友评论