【文件属性】:
文件名称:ml-pancancer-example
文件大小:4.07MB
文件格式:ZIP
更新时间:2021-02-18 02:52:42
JupyterNotebook
ml-pancancer-example
描述
使用PANCANCER数据进行数据科学和机器学习–示例
这是对数据科学和机器学习技术的介绍,重点介绍了三个专业知识水平:
初学者
中间的
先进的
该项目假定您具有python或R的一些知识或经验,但将展示并逐步进行数据分析过程。 要访问数据,请参见 。
初学者笔记本教程
在本笔记本中,我们将研究的数据分析过程。 这是初学者还是新手笔记本,我们将专注于python中的常规数据清除,操作和分析技术。
我们专注于:
导入Python库进行数据分析
数据处理与数据处理
大熊猫
麻木
数据可视化
Matplotlib
海生
牵牛星
处理数据清理和处理
加载数据框
处理缺失或有问题的特征
子集数据
初学者数据分析技术
探索性数据分析(EDA)
生成摘要统计
在本教程结束时,您将熟悉如何处理数据以及为研究和数据分析创建图表,如下所示:
中级教程笔
【文件预览】:
ml-pancancer-example-main
----Gene_expression_altair.gif(767KB)
----Notebook 1 - Beginner.ipynb(2.44MB)
----environment.yml(5KB)
----Notebook 2 - Intermediate.ipynb(77KB)
----data()
--------data_compile.R(3KB)
--------ml-genomics.Rproj(205B)
--------data_filter.R(1KB)
--------README.md(2KB)
----gene_expression_scatter_hist.html(207KB)
----gene_expression_seaborn.png(78KB)
----Notebook 3 - Advanced.ipynb(7KB)
----.gitignore(121B)
----.ipynb_checkpoints()
--------Notebook 2 - Intermediate-checkpoint.ipynb(77KB)
--------Notebook 1 - Beginner-checkpoint.ipynb(2.44MB)
--------Notebook 3 - Advanced-checkpoint.ipynb(5KB)
----README.md(1KB)