Numpy 基本概念以及2.7版本与3.6版本间的差异
iPython环境下
Numpy
randn()函数:产生numpy数组array类型,一般若为定义则用 from numpy.random import randn,e.g. randn(7,4)产生7✖️4数组
下标:数组下标从0开始和c++一致
冒号:arr[:,1] 二维数组第一列,arr[1,:]二维数组第一行
arr[1:, 2] 索引值为1的行(第二行)到end(包含)第三列(索引值为2),arr[:3, 2]第一行到第三行(0,1,2) 即冒号后的数字不包含该数字索引
对于索引与数组匹配的问题,若arr1= [’s’,’b’,’s’] arr2 为3✖️n数组才可匹配,即判断字符是否相等从而饮用arr2 如arr2[arr1 == ‘s’]输出arr1为s的对应数组值,布尔型数组的长度必须和索引的轴长度一致
注意:Python中的and or 关键字在布尔型数组中无效
arange(15)返回0-14不包含最后一个, 15个数组
Pandas
对于标签的切片即带冒号的选择行列,其末端是包含的
sklearn
kaggle竞赛课本和实际ipython使用中的差异
from sklearn.cross_validation import train_test_split改为
from sklearn.model_selection import train_test_split