openpecha-toolkit::hammer_and_wrench:用于创建,编辑和导出文本和注释的工具

时间:2024-04-15 14:36:14
【文件属性】:

文件名称:openpecha-toolkit::hammer_and_wrench:用于创建,编辑和导出文本和注释的工具

文件大小:1.53MB

文件格式:ZIP

更新时间:2024-04-15 14:36:14

annotations corpus-tools layered-text Python

OpenPecha工具包 OpenPecha Toolkit允许在移动文本上使用最新的分布式防区外注释,在其中可以编辑基础层而不会影响注释。 该项目的动机是,对于完美的基础文本而言,没有什么大的障碍,但是当您必须能够编辑基础文本时,就会出现技术问题,这可能是对基础文本的更正或更新。 因此,现有的解决方案(如使用字符坐标)将无法正常工作。 因此,我们打算使用CCTV(字符坐标转换向量)来跟踪从源基础文本到已编辑基础文本的注释,而完全不必担心注释。 然后,用户可以使用各种文档格式(如.md , .epub , .pdf等)导出带有更新的注释的已编辑的基础文本。但是当前它仅支持markdown文件。 对于NLP,该工具包将提供一种方法,以最小的错误对corpra进行注释,并提取特定类型的注释或不同类型的注释的集合。 NLP研究人员然后可以使用这些语料库来构建语言模型,注释来构建NER模型,


网友评论