文件名称:openDiagram:从科学和其他技术业务文档中的图提取语义数据
文件大小:815.97MB
文件格式:ZIP
更新时间:2024-03-08 20:44:23
JupyterNotebook
打开图 从科学和其他技术/商业文档中的图表中提取语义数据。 概述 在许多文档中,图表是信息的关键组成部分。 数据以语义形式创建并以机器可读文件的形式输出,然后,本世纪最伟大的野蛮行为之一被丢弃到位图中,并进一步被JPEG技术降级。 这些丢失的数据导致科学无法重现,甚至在最坏的情况下人们死亡。 (临床试验通常以PDF格式发布,很难或几乎不可能提取数据。) 该项目解决了不可能的问题-为世界重建语义数据-“将汉堡包变成母牛”。 在这些主题中,我已经成功地从以下方面提取了语义数据: 系统树 化学结构与React 研究基线数据 循环伏安图 森林地块 其中许多具有通用的语义图抽象,而AMI使用启发式方法构建这些抽象。 用ami预处理 参见PREPROCESS.md 创建项目 `