文件名称:LncRNA-ID:使用平衡随机森林的长非编码 RNA 识别
文件大小:12KB
文件格式:ZIP
更新时间:2024-07-09 11:46:26
C++
LncRNA-ID 该项目包含 Rujira Achawanantakun、Yanni Sun 和 Yuan Zhang使用平衡随机森林的论文Long non-coding RNA IDentification 的支持脚本和数据。 文件 脚本: expression.sh:计算编码区和3'utr中的表达 getSeqFromGenome.sh:从基因组序列中获取基因和 lncRNA getSequenceFromBedFile.sh:从床格式文件中获取序列 DNA2Protein.cpp:使用多帧翻译将 DNA 序列翻译成蛋白质序列 数据: 数据可在 下载。 我们实验中使用的数据文件被组织到以下四个文件夹中: H1_gencode/ : 人类 GENCODE 数据集 (H1) M1_gencode/ : 鼠标 GENCODE 数据集 (M1) H2_cpat/ : CPAT
【文件预览】:
LncRNA-ID-master
----scripts()
--------getSequenceFromBedFile.sh(689B)
--------DNA2Protein.cpp(7KB)
--------expression.sh(1KB)
--------getSeqFromGenome.sh(1KB)
----LICENSE(18KB)
----README.md(1017B)