文件名称:pdfannots:从PDF文件中提取文本注释并设置其格式
文件大小:514KB
文件格式:ZIP
更新时间:2024-06-05 23:42:51
Python
关于 这是一个脚本,可从PDF文件中提取注释(突出显示,注释等),并将其格式化为markdown文本。 它旨在用于审阅会议论文。 当前,支持以下注释: 没有附件注释的突出显示首先输出,作为“突出显示”,仅包含突出显示的文本。 请注意,这些通常不适合在评论中使用,因为它们不太可能对接收者有任何意义; 它们只是为了提醒审阅者。 接下来,将输出带有注释的突出显示和文本注释(未附加到任何特定的文本/突出显示),作为“详细注释”。 通常,对审稿纸的大多数评论都是这种形式的。 下划线,删除线和弯曲的下划线注释最后输出为“ Nits”,带有或不带有附加注释。 这样做的目的是轻松地将格式或语法更正与关于文档内容的更多实质性注释区分开。 对于每个注释,将给出页码以及相关的(突出显示/带下划线的)文本(如果有)。 此外,如果文档包含轮廓(又称书签),例如由hyperref软件包生成的轮廓,则这些轮廓
【文件预览】:
pdfannots-master
----.gitignore(210B)
----README.md(3KB)
----.github()
--------workflows()
----tests()
--------hotos17.pdf(288KB)
--------issue9.pdf(24KB)
--------issue13.pdf(153KB)
--------pr24.pdf(94KB)
----tests.py(4KB)
----pdfannots.py(22KB)
----requirements.txt(101B)
----LICENSE.txt(1KB)
----setup.py(264B)