1.requests 获取
建立pd矩阵处理数据 pd.DataFrame(),pd.read_csv()
2.Webapi获取,如豆瓣API
3.NLTK语料库获取
5.4 数据选择
通过标签或者位置
djidf.code 或者djidf[‘code’]
loc 通过标签来选择行或者列
也可以通过djidf.ix[‘a']来选择
条件选择
datesdf[(datesdf.index>='20180522') & (datesdf.index<='20180524')]
5.5 简单统计与处理简单处理
与前一天比较
相关系数
排序
计数统计
利用striptime将字符串转为time结构
5.6使用grouping
5.7 Merge
datesdf.append(a)
pd.concat([datesdf[:1],datesdf[-1:]])
join