1.案例:这个数据用针对房屋售价的结果。如下CSV档(6.Logistic_Regression.csv),两个栏位各代表面积与售价。
2.问题:现在有一面积为700,请问预估可能的售价是多少?
3.数据文档:6.Logistic_Regression.csv,内容如下。
square_feet | price |
150 | 6450 |
200 | 7450 |
250 | 8450 |
300 | 9450 |
350 | 11450 |
400 | 15450 |
600 | 18450 |
4.Sampe code:
#encoding: utf-8 import matplotlib.pyplot as plt import numpy as np import pandas as pd from sklearn import linear_model #----取得输入资料 def get_data(file_name): data = pd.read_csv(file_name) X_parameter = [] Y_parameter = [] for single_square_feet ,single_price_value in zip(data['square_feet'],data['price']): X_parameter.append([float(single_square_feet)]) Y_parameter.append(float(single_price_value)) return X_parameter,Y_parameter #----设定回归分析的函数与设定值 def linear_model_main(X_parameters,Y_parameters,predict_value): regr = linear_model.LinearRegression() regr.fit(X_parameters, Y_parameters) predict_outcome = regr.predict(predict_value) predictions = {} predictions['intercept'] = regr.intercept_ predictions['coefficient'] = regr.coef_ predictions['predicted_value'] = predict_outcome return predictions #----取得资料 X,Y = get_data("6.Logistic_Regression.csv") #----设定输入值(面积) predictvalue = 700 #----输出预测值 result = linear_model_main(X,Y,predictvalue) print u"预测的价格为: ", result['predicted_value']
5.结果:
预测的价格为: [ 21915.42553191]