turicreate入门系列文章目录
1,turicreate入门 - jupyter & turicreate安装
3,turicreate入门 - 优化回归模型,使得预测更准确
0,上传准备好的数据文件
1,导入模块
import turicreate as tc
2,加载数据
sf = tc.SFrame('fang_data.csv')
可能遇到文件编码格式错误,使用文本编辑工具如notepad++将文件格式转换为utf-8即可。
3,浏览数据
4,查看区域-价格基本关系
tc.visualization.box_plot(sf['zone'], sf['price'],'区域','价格','区域-价格概况')
5,面积-租赁价格散点图
tc.visualization.scatter(sf['area'], sf['price'], xlabel='面积', ylabel='租赁价格')
6,基于面积-价格的简单预测模型
1)建立训练数据和测试数据集
train_data, test_data = sf.random_split(.8,seed=0)
2)建立模型
area_price_model = tc.linear_regression.create(train_data,target='price',features=['area'])
3)使用matplotlib展示
%matplotlib inline
import matplotlib.pyplot as plt
plt.plot(test_data['area'],test_data['price'],'.',
test_data['area'],area_price_model.predict(test_data),'-')