patent-harvest:收获美国专利的脚本

时间:2024-06-07 14:21:34
【文件属性】:

文件名称:patent-harvest:收获美国专利的脚本

文件大小:339KB

文件格式:ZIP

更新时间:2024-06-07 14:21:34

Java

该项目使用从美国专利商标局(USPTO)收集专利元数据和文件。 该程序收集分配给Virginia Tech的专利,这些专利将包含在Virginia Tech的DSpace机构存储库中的中。 元数据字段被交叉引用到使用的。 可以修改此程序以搜索其他受让人和/或收获其他字段。 收集元数据和文件后,脚本会对PDF执行OCR,然后将该文本添加到每个PDF中。 API中的字段列表, 有关其他详细信息, 参见 (仅限VTUL成员) 项目概述: : 执照 该软件已获得GNU通用公共许可证v2的许可。 pdfsandwich是根据。 安装 旨在在Mac OSX上使用。 如果通过本机软件包管理器安装了依赖项,则它可以在其他平台上运行。 以下所有步骤均来自Mac Terminal。 对于CSV创建和PDF收集: 安装wget下载此项目和pdfsandwich brew install wg


【文件预览】:
patent-harvest-master
----text-info-pdf.sh(150B)
----javax.json-ri-1.0.zip(79KB)
----Patents.java(22KB)
----README.md(2KB)
----pdfsandwich(696KB)
----pdfsandwich-src.tar.bz2(16KB)

网友评论