2017我的大数据分析成长之路

时间:2021-01-11 19:17:49

2017我的大数据分析成长之路

一个在军校读书的大四医学生,喜欢用学到的技术使自己“偷懒”,并能达到高效工作的目的。我会的很多,曾经在各种数学建模比赛拿奖。即使在学校严格的制度下,我还是尝试学习着各种新技术,希望自己的思维不被*所限。本科期间去过深圳参加数学建模夏令营,去过济南开学术会议,发了一篇医学方面的SCI,目前还在做实验等待第二篇。


2017我的大数据分析成长之路

Fig.1 我的能力示意图

:分数均为和同届同学相比。

2017我的大数据分析成长之路

事实上,我很清楚,大数据在医学诊断治疗方面的作用是很局限的,原因包括临床诊断标准需要经验判别,医疗体系自身问题等等。在相当长的一段时间内,临床医生不可能被新科技所取代,新研发出来的相关产品只能用于临床辅助。但是,在接触数学建模的过程中,我发现编程可以让很多事情的整理变得高效简单,甚至在预测,评价方面有着很好的效果。那么对于未来要进入临床行业的我,最迫切的问题便是将所学知识和临床具体Case结合,不断增长经验了。然而,数据分析可以帮我加快这一进程。


举个例子,如果能有一款APP定期给已经过治疗的病人推送相关问卷,我们便可在一定时间后看到按照现有治疗标准治疗的病人是否有效果,还可很好的避免病人并发症的发生。在对病人分类,进行临床试验方面这些都可以很快速的帮我们提高工作能力。另外,我们可以对自己所管辖的病人利用现有数据实行动态监控,建立预警模型等等,虽然该方法待实践论证,但不试为一个小医生在提高自身经验方面所做的一种尝试,对病人也是百利而无一害。凡此种种好处,在提高个人工作效率方面简直是不能再棒!还有我曾见识过的基因芯片,人工耳蜗等等方面。那么,2017年,我为自己定了两个目标以学习新的数据分析知识和引用所学过的数据处理技术。

2017我的大数据分析成长之路

2017我的大数据分析成长之路

1. 在2017年7月之前掌握市场上常见的大数据分析技术,能独立完成至少一个项目。

2. 增强对数据的敏感(包括数据的搜集转化处理等等)。


【资源】

A.猴子的Live公开课 

B. 社群讨论,互联网

C. 专业书籍

《R语言实战》
《深入浅出SQL》
《利用Paython进行数据分析》
《数据挖掘导论》


【计划】 不定时更新


Time 课程 学习目标 学习效果打分
2016.11 第1讲: 零基础入门数据分析的方法论,树立正确学习观念,了解大数据基本背景。          100               
2016.12 第2讲:数据分析基础:数据结构入门 了解数据结构概念作用等
2017.1 第3讲:如何读取数据 扩充已有的数据存储概念,了解除excel外的数据存储方式
2017.2 第4讲:如何对数据进行预处理 获得整理数据的方法
2017.3 第5讲:如何对数据进行信息提取 获得抽取有价值信息的方法
2017.4 第6讲:如何对数据结果进行展示 制作图表及其余展示方法
2017.5 第7讲:项目实战:如何做一个数据分析系统 利用所学尽可能独立思考live中项目
2017.6 第8讲:如何找到数据分析工作 了解行业动态,结合自己所学把握趋势
2017.7 第9讲:红利共享:社群成员众筹一个盈利项目 独立完成任务中自己的部分

阅读《R语言实战》并实践


Part 章节 价值 Deadline 完成情况 备注
第一部分 入 门 第1 章 R 语言介绍 2000 2016.12.24
第2 章 创建数据集
第3 章 图形初阶 5000 2017.1.7
第4 章 基本数据管理
第5 章 高级数据管理 4000 2017.1.14
第二部分 基本方法 第6 章 基本图形 4000 2017.1.21
第7 章 基本统计分析 2017.1.28
第三部分 中级方法 第8 章 回归 10000 2017.2.11
第9 章 方差分析
第10 章 功效分析
第11 章 中级绘图 15000 2017.2.18
第12 章 重抽样与自助法
第四部分 高级方法 第13 章 广义线性模型
第14 章主成分和因子分析 20000 2017.2.25
第15 章 处理缺失数据的高级方法
第16 章 高级图形进阶

注:1. 在听完live后,每周实践所学知识,数据源可来自历年各大数学建模竞赛试题,并将实践过程写成报告。

       2.  如果将来在从医期间能通过各种渠道使用R语言挣外快(含科研奖励,出版书籍等),按年收入6W外快计算,那么我将每个deadline学习的              内容列出,如表中价值栏所示。

【奖励机制】

每完成一讲并实践完一本书或完成一个项目就将200元存入特定账户用于日后购买单反或请朋友们吃饭。