文件名称:cancer-signatures
文件大小:8.51MB
文件格式:ZIP
更新时间:2024-04-24 08:46:17
JupyterNotebook
基于基因组拷贝数签名的分类器用于癌症亚型鉴定 这个回购托管了用于研究的脚本。 数据 该研究使用了来自Progenetix和TCGA的开放访问数据以及来自PCAWG的受限数据。 /data中提供了每个数据存储库中使用的示例的完整列表。 该研究中使用的开放获取数据可在。 根据ICGC的数据访问策略,研究人员需要向申请PCWAG数据访问。 有关从ICGC / PCAWG访问受限数据的说明,请访问 。 档案结构 alt-pipeline/ Scripts to generate .pkl files from the provided sample data at Progenetix. classification/ Scripts of the classification experiments. data/ The external & generated data u
【文件预览】:
cancer-signatures-master
----classification()
--------compare_smote_variants.ipynb(222KB)
--------compare_smote_classifiers.ipynb(169KB)
--------data preparation()
--------multiclass_refine_labels.ipynb(24KB)
--------classification.ipynb(219KB)
--------multipred_smote_test.ipynb(34KB)
----data()
--------cytoBand_hg38.txt(49KB)
--------sample_ids_tcga.txt(412KB)
--------sample_ids_arraymap.txt(625KB)
--------genes.tsv(904KB)
--------sample_ids_pcawg.txt(69KB)
--------protein_genes_biomart.tsv(2.1MB)
--------Census_allThu Jan 16 08_07_54 2020.tsv(149KB)
----signatures()
--------AnalyzeByType()
--------LRP()
--------AE()
----alt-pipeline()
--------gen_pickles.ipynb(17KB)
--------cytoband_data.ipynb(7KB)
--------combine_data.ipynb(2KB)
--------calibration.ipynb(4KB)
--------load_data.ipynb(5KB)
--------normalization.ipynb(3KB)
----plots()
--------hotzone.ipynb(164KB)
--------clustering.ipynb(113KB)
--------bar3d.ipynb(19KB)
--------focal_regional.ipynb(482KB)
--------categorize_feature_genes.ipynb(50KB)
--------R()
----requirements.txt(240B)
----.gitignore(3KB)
----integration()
--------gen_pickles.ipynb(37KB)
--------cytoband_data.ipynb(8KB)
--------Combine_mecaned_data.ipynb(2KB)
--------mecan_arraymap.ipynb(63KB)
--------run_mecan_for_all_data.ipynb(9KB)
--------tcga_to_db.ipynb(6KB)
--------normalize_data_all.ipynb(4KB)
--------pcwag_to_files.ipynb(6KB)
--------gen_icgc_segments.ipynb(8KB)
----README.md(5KB)