splitHmdbXml:分割HMDB Metabolite数据XML文件

时间:2021-04-22 14:10:38
【文件属性】:
文件名称:splitHmdbXml:分割HMDB Metabolite数据XML文件
文件大小:3KB
文件格式:ZIP
更新时间:2021-04-22 14:10:38
Julia 拆分HMDB所有代谢物XML 乔治·L·马龙先生 2021年4月21日 概述 该存储库记录了用于拆分和存储 XML的脚本和要求。 这些操作是使用Ruby编程语言完成的。 这些操作依赖于某些经过编码的数据,例如初始XML声明以及文档的打开和关闭标签,包括名称空间声明。 由于包含所有代谢物数据的XML文档的大小,使用Ruby来利用File.foreach方法的易用性,以最大程度地提高速度并最小化RAM的使用。 该文件太大,Nokogiri无法处理-大约。 4.1 GB。 运作方式 初始设置和变量声明后,将打开文件并遍历各行。 如果该行是doctype声明或hmdb开始或结束标记,则将其跳过。 然后将行文本推送到输出对象。 如果当前代谢物的ID为nil ,则检查当前行文本中主要accession标签内的ID,并在找到该行时对其进行分配[n1] 。 如果该行是metabolite关闭标签,则使用当
【文件预览】:
splitHmdbXml-master
----split.jl(2KB)
----splitHmdbXmlMetabolitesAll.rb(2KB)
----README.md(2KB)

网友评论