SiSOB 数据提取和编码:分析科学职业的工具-研究论文

时间:2024-06-30 03:07:55
【文件属性】:

文件名称:SiSOB 数据提取和编码:分析科学职业的工具-研究论文

文件大小:1.33MB

文件格式:PDF

更新时间:2024-06-30 03:07:55

Information retrieval Extraction

本文描述了用于建立学术人员职业和生产力数据库的方法和软件工具,使用互联网上可用的公共信息,并提供对由国家研究所资助的 360 名美国科学家样本收集的数据的首次分析。卫生署 (NIH) 和由生物技术和生物科学研究委员会 (BBSRC) 资助的 291 名英国科学家。 该工具的结构化输出可用于计量经济学研究或政策分析的数据表示。 该方法和软件工具已针对美国和英国生物医学科学家的样本进行了验证,但可应用于提供英文版科学家简历的任何国家/地区。 我们概述了构建数据库的动机,以及用于将基于网页的信息和简历信息转换为关系数据库的数据爬行和数据挖掘技术。 我们描述了数据库和我们算法的有效性,并提供了进一步改进的建议。 开发的软件是在*软件 GNU 通用公共许可证下发布的; 目的是让对分析科学生产和科学职业感兴趣的社会科学家和经济学家社区可以使用它,希望他们能够进一步开发这个工具。


网友评论