文件名称:ML_purity
文件大小:56.38MB
文件格式:ZIP
更新时间:2024-03-25 05:57:51
JupyterNotebook
基于RNA测序的基因表达数据预测肿瘤纯度 机器学习模型可估计基于TCGA RNA测序的基因表达数据所训练的肿瘤纯度。 用于高通量分子谱分析的大块肿瘤样品通常是癌细胞和非癌细胞的混合物。 混合物中肿瘤细胞的比例称为肿瘤纯度。 混合的成分会混淆分析并影响结果的生物学解释,因此准确预测肿瘤的纯度至关重要。 下载 文件大小为25 MB或更小的机器学习模型已上载到此存储库。 其他模型可在。 资料准备 要使用这些模型,需要量化FPKM的对数转换值(log2(FPKM + 1))。 应该通过GDC的mRNA分析管道( )计算FPKM值。 此外,基因的顺序应与示例数据的顺序相同。 (基因列表已上载到GeneList目录中。) 用法 示例ipython笔记本(ipynb)文件位于示例目录中。 请参考。 必须安装scikit-learn(<= 0.23.2)才能缩放输入数据。 import pand
【文件预览】:
ML_purity-main
----models()
--------SVR()
--------KNR()
--------ElasticNet()
--------Lasso()
--------Linear()
--------RFR()
--------Ridge()
--------Scaler()
--------MLP()
----GeneList()
--------Top20.txt(498B)
--------Top40.txt(989B)
--------Top30.txt(747B)
--------Top1000.txt(25KB)
--------ALL.txt(1.56MB)
--------Top10000.txt(257KB)
--------Top10.txt(245B)
--------Top50.txt(1KB)
--------Top100.txt(2KB)
----example()
--------example_data.tsv(5.17MB)
--------example.ipynb(14KB)
--------example_result.tsv(419B)
----README.md(2KB)