文件名称:sparql-vcf:使用 SPARQL 查询 VCF 文件
文件大小:5.85MB
文件格式:ZIP
更新时间:2024-08-02 14:45:17
Java
sparql-vcf 在 biohackathon 2014 上编写的一些代码,用于探索使用 SPARQL 查询 VCF 文件中数据的方法。 这些方法基于使用专用索引来“即时”创建三元组以优化执行时间的方法。 实现 1. 基于 Jerven 的使用 Sesame API 的 sparql-bed ( ) 代码。 实现 2. 是我与 Jena 一起编写的用于了解属性函数如何工作的内容。 这里的想法是,对于特定的用例,比如通过 VCF 文件中的染色体坐标查询变体,我们可以引入一个特殊的属性来执行一些代码来运行查询。 这个想法将是一种“即时”的混合方法,其中您在常规三元组存储中拥有大部分三元组,但特殊谓词用于优化类似于现有三元组存储如何支持 lucene 搜索的查询。 不完全确定这是最好的方法,但玩它很有趣。 示例查询在 2600000:2700000 范围内获取染色体 Y 上的所有变
【文件预览】:
sparql-vcf-master
----sparql-bed()
--------.project(539B)
--------src()
--------sparql-bed.sh(119B)
--------pom.xml(8KB)
--------.classpath(1KB)
----LICENSE(11KB)
----LICENSE.md(34KB)
----README.md(1KB)