说明本实例都是经过正常运行。
环境:
Win10-64版本,python3.6
1.下载安装xgboost
在该网站下载https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost
2.在进入cmd模式
pip install xgboost-0.72-cp36-cp36m-win_amd64.whl
这样就完成安装xgboost,网上各种安装,请看官注意,反正我这是正常运行的
3.测试
import xgboost
如果不提示错误,那么安装成功了。
4.运行实例
用xgboost预测糖尿病的例子
4.1准备数据
pima-indians-diabetes.data.csv,这个数据百度搜出来,官网已经没有了。自己百度找出来。https://pan.baidu.com/s/1c24tweW#list/path=%2F
# 先导⼊入所有要⽤用的class
import numpy
import xgboost
from sklearn import cross_validation
from sklearn.metrics import accuracy_score
# load数据集
dataset = numpy.loadtxt('pima-indians-diabetes.data.csv', delimiter=",")
# 把 X Y 分开
X = dataset[:,0:8]
Y = dataset[:,8]
# 现在我们分开训练集和测试集
seed = 7
test_size = 0.33
X_train, X_test, y_train, y_test = cross_validation.train_test_split \
(X, Y, test_size=test_size, random_state=seed)
# 训练模型
model = xgboost.XGBClassifier()
# 这⾥里里参数的设置可以⻅见:http://xgboost.readthedocs.io/en/latest/python/
python_api.html#module-xgboost.sklearn
model.fit(X_train, y_train)
# 做预测
y_pred = model.predict(X_test)
predictions = [round(value) for value in y_pred]
# 显示准确率
accuracy = accuracy_score(y_test, predictions)
print("Accuracy: %.2f%%" % (accuracy * 100.0))
注意几点,文件名要看清楚,
结果是