matlab如何敲代码-TCGA_RNASeq_Clinical:TCGA_RNASeq_Clinical

时间:2024-06-12 01:41:24
【文件属性】:

文件名称:matlab如何敲代码-TCGA_RNASeq_Clinical:TCGA_RNASeq_Clinical

文件大小:15.97MB

文件格式:ZIP

更新时间:2024-06-12 01:41:24

系统开源

matlab如何敲代码该存储库包含用于处理RNA-Seq FASTQ文件的代码以及The Cancer Genome Atlas的临床数据。 此外,我们在手稿中加入了用于分析数据的代码,“癌症基因组图谱中RNA测序数据的另一种预处理可以改善分析结果”(Rahman,Mumtahena等人, Bioinformatics 。 该存储库是做什么用的? 我们使用“ Rsubread” R软件包在9264个肿瘤和741个正常TCGA RNA-Seq样本的基因水平上比对和总结了读数。 我们在此处提供的R脚本也可以用于处理非TCGA的样本。 我们还包括了将这些肿瘤的可用临床数据汇编成矩阵格式,并将临床ID与RNA-Seq ID进行匹配的代码。 我们提供了代码和各种中间数据文件,这些文件和代码是我们执行手稿中描述的分析时生成的。 如何标准化原始RNA-Seq数据和处理来自TCGA的临床数据 该管道设计为在基于Unix的系统上执行。 大多数代码是用R编程语言编写的。 但这也需要在命令行执行“ bash”脚本。 安装。 我们使用版本3.1.0。 安装以下R软件包,可以使用R中的install.packa


【文件预览】:
TCGA_RNASeq_Clinical-master
----.gitignore(342B)
----TCGA_CancerType_Abbreviations.txt(1KB)
----Analysis()
--------TCGA_24_manuscript_analysis.html(6.12MB)
--------TCGA_24_manuscript_analysis.Rmd(47KB)
----LICENSE(1KB)
----TCGA_CancerType_Publishable.txt(114B)
----README.md(6KB)
----Scripts()
--------process_tcga_rsubread(815B)
--------normalize_tcga_rsubread(2KB)
--------LUSC_LUAD_discordant_analysis(2KB)
--------summarize_tcga_rsubread(1KB)
--------process_tcga_level_3(6KB)
----Codes()
--------TransposeData.py(291B)
--------Split.py(524B)
--------numZero.R(795B)
--------biological_rep.R(18KB)
--------CalcAccuracy.R(345B)
--------utilities.py(21KB)
--------CombineScalarValues.py(291B)
--------BuildMatrixFile.py(940B)
--------ProcessRnaSeqFeatureCounts.R(2KB)
--------IdentifyInconsistentPredictions.R(860B)
--------IdentifyDiscordantPredictions.R(698B)
--------CalcAUC.R(1KB)
--------PrintMatrixDimensions.py(281B)
--------Classify_luad_vs_lusc.R(3KB)
--------ParseSampleTypes.py(158B)
--------LUSC_vs_LUAD.R(6KB)
--------PeekMatrix.py(299B)
--------ProcessClinicalData.R(2KB)
--------PlotDiscordant.R(2KB)
--------ParseCgHubQueryResults.py(2KB)
--------FileContainsText.py(176B)
--------GetFileExtension.py(94B)
----Analysis_datasets()
--------5_01_predictions_raw()
--------GFP18_HER2_TCGA_Pipeline_Expected_Gene_Counts.txt(2.2MB)
--------TCGA20_clinical_data_ordered_all_clinical_variables_samples_as_columns.txt(13.49MB)
--------PANCAN12_19583_by_3380_numZeroes.txt(119KB)
--------rsubread_10_14.txt(52KB)
--------GFP18_HER2_Rsubread_TPM.txt(5.05MB)
--------.RData(2.99MB)
--------Rsem_10_14.txt(45KB)
--------.Rhistory(33KB)
--------GFP18_HER2_Rsubread_FPKM.txt(5.1MB)
--------PANCAN20_19583_by_3380_numZeroes.txt(119KB)
--------Classification_20_LUAD_LUSC_Predictions.txt(27KB)
--------Classification_12_LUAD_LUSC_Predictions.txt(28KB)
--------GFP18_HER2_Rsubread_geneCounts.txt(1.36MB)
--------10_14_predictions_raw()
--------GFP18_HER2_TCGA_Pipeline_Normalized_Genes_Results.txt(2.91MB)

网友评论