文件名称:fall-2014-public:Stat 157 的课程材料
文件大小:97KB
文件格式:ZIP
更新时间:2024-07-22 16:23:00
Python
统计 157:可重复和协作的数据科学 Stat 157 的课程材料:可重现和协作数据科学(2014 年秋季)。 TuTh 9:30-11AM 247 CORY Hall UC Berkeley 描述 本课程是基于项目的可重复和协作统计研究介绍。 您将获得获取、清理和整理数据的经验; 以统计方式制定科学问题; 从头开始用 Python 编写统计方法; 设计和实现新功能(特征工程); 开发适当的统计方法来分析数据; 在健壮、可测试、可重用、可扩展的软件中实现这些方法; 应用方法; 可视化结果; 解释结果; 并将结果传达给其他人。 您将以一种可计算重现的方式学习这一点,这越来越被认为是科学进步的关键。 软件工具将包括 git、Python、IPython、SQL、LaTeX、基于笔记本电脑的虚拟化和亚马逊网络服务。 将有一个合作学期项目。 讲师 Yannet Interian Depart
【文件预览】:
fall-2014-public-master
----README.md(8KB)
----code()
--------mapper_test.py(274B)
--------mapper_train.py(275B)
--------mapper_training_testing_validation.py(446B)
--------mapper_validation.py(280B)
----lec-23-lab.md(2KB)
----lec-15-lab()
--------word_count_reducer.py(1KB)
--------book_rating_lib.py(1KB)
--------Readme.md(2KB)
--------test_book_rating_lib.py(776B)
--------data()
--------word_count_mapper.py(625B)
----naive_bayes()
--------README.md(3KB)
--------ScreenShotAWS.png(78KB)
--------nb_step2_mapper.py(2KB)
----aws-recipies.md(1KB)
----assignments()
--------README.md(101B)
--------hw11()
--------hw8.md(1KB)
----spark-notes.md(368B)
----lec-17-lab.md(2KB)
----lec-19-lab()
--------README.md(3KB)
--------ctr_adid_reducer.py(796B)
--------ctr_adid_mapper.py(552B)
----lec-13-lab.md(819B)