splitHmdbXml:分割HMDB Metabolite数据XML文件

时间:2024-05-12 07:57:18
【文件属性】:

文件名称:splitHmdbXml:分割HMDB Metabolite数据XML文件

文件大小:3KB

文件格式:ZIP

更新时间:2024-05-12 07:57:18

Julia

拆分HMDB所有代谢物XML 乔治·L·马龙先生 2021年4月21日 概述 该存储库记录了用于拆分和存储 XML的脚本和要求。 这些操作是使用Ruby编程语言完成的。 这些操作依赖于某些经过编码的数据,例如初始XML声明以及文档的打开和关闭标签,包括名称空间声明。 由于包含所有代谢物数据的XML文档的大小,使用Ruby来利用File.foreach方法的易用性,以最大程度地提高速度并最小化RAM的使用。 该文件太大,Nokogiri无法处理-大约。 4.1 GB。 运作方式 初始设置和变量声明后,将打开文件并遍历各行。 如果该行是doctype声明或hmdb开始或结束标记,则将其跳过。 然后将行文本推送到输出对象。 如果当前代谢物的ID为nil ,则检查当前行文本中主要accession标签内的ID,并在找到该行时对其进行分配[n1] 。 如果该行是metabolite关闭标签,则使用当


【文件预览】:
splitHmdbXml-master
----split.jl(2KB)
----splitHmdbXmlMetabolitesAll.rb(2KB)
----README.md(2KB)

网友评论