文件名称:写次数
文件大小:45.3MB
文件格式:ZIP
更新时间:2024-03-18 12:44:01
Python
写次数 版本0.1.0 Python脚本,用于从多个计数文件中编写单个基因计数表。 回购包括压缩的示例数据和参考文件。 概述 输入: 每个样本一个.hdf5文件(可以是多个样本,通过对LIMSID进行排序或其他选择的变量进行分组)。 文件名必须包含标识符的唯一组合,这些标识符也可以在元数据文件中作为列名找到。 hdf5文件包含每个基因ID的计数向量(按字典顺序对基因ID进行排序)。 输出: 每组一张表(基因x样本)。 需要元数据: 每组一张表(样本x变量)。 元数据表必须包含名称与文件名相对应的列(因为将基于元数据注释加载文件)。 需要参考基因组文件来提取基因ID: Homo_sapiens.GRCh37.dna.gencode.v26lift37.basic.with_ERCC.gff 该文件太大,无法在GitHub上进行托管而不进行压缩,因此请确保在克隆存储库后取
【文件预览】:
write-counts-main
----write_count_table.py(3KB)
----results()
--------output()
--------figures()
----requirements.txt(104B)
----data()
--------processed()
--------.DS_Store(6KB)
--------raw.zip(14.28MB)
----src()
--------.gitkeep(0B)
----LICENSE.md(1KB)
----CITATION.md(129B)
----metadata()
--------KIN3801_anno.tsv(139KB)
----README.md(2KB)
----ref()
--------Homo_sapiens.GRCh37.dna.gencode.v26lift37.basic.with_ERCC.gff.zip(32.39MB)
--------.DS_Store(6KB)
----docs()
--------manuscript()
--------reports()
--------.gitkeep(0B)