文件名称:专利相似性数据和创新指标-研究论文
文件大小:2.51MB
文件格式:PDF
更新时间:2024-06-30 00:53:43
Patent Doc2Vec
我们介绍并描述了专利相似性数据集,包括美国实用专利的基于向量空间模型的相似性分数。 该数据集提供了大约 6.4 亿个预先计算的相似度分数,以及计算进一步成对相似度所需的代码和计算向量。 除了原始数据外,我们还引入了利用专利相似性的措施,以深入了解学者和政策制定者都感兴趣的创新和知识产权法问题。 随附脚本中提供了代码,以帮助研究人员获取数据集,将其与其他可用的专利数据结合起来,并在研究中使用它。