ML.NET教程和API:https://docs.microsoft.com/zh-cn/dotnet/machine-learning/
现在学习机器学习这块时,基本上都是要先学习Python,还要自己去学习更多的样本数据教程,这样对于使用C#学习机器学习的基础并不容易,于是微软推出了ML.NET的开源跨平台机器学习框架。
什么是ML.NET?
ML.NET 使你能够在联机或脱机场景中将机器学习添加到 .NET 应用程序中。借助此功能,可以使用应用程序的可用数据进行自动预测,而无需连接到网络。
通过ML.NET进行的预测类型的包括:
分类/类别划分 |
自动将客户反馈划分为正面和负面类别 |
---|---|
回归/预测连续值 |
根据大小和位置预测房屋价格 |
异常情况检测 |
检测欺诈性银行交易 |
建议 |
根据在线购物者之前的购买情况向其建议可能想要购买的产品 |
ML.NET的代码工作流
以下关系图表示应用程序代码结构,以及模型开发的迭代过程:
将训练数据收集并加载到 IDataView 对象中
- 指定操作的管道,以提取特征并应用机器学习算法
- 通过在管道上调用 Fit() 来训练模型
- 评估模型并通过迭代进行改进
- 将模型保存为二进制格式,以便在应用程序中使用
- 将模型加载回 ITransformer 对象
- 通过调用 CreatePredictionEngine.Predict() 进行预测
机器学习模型
ML.NET 模型是一个对象,它包含为了获得预测输出而要对输入数据执行的转换。
Basic
最基本的模型是二维线性回归,其中一个连续数量与另一个连续数量成比例关系,如上述房价示例所示。
Price=b+Size∗w
参数 b 和 w通过根据一组 (size, price) 对拟合一根直线来进行估算。用于查找模型参数的数据称为训练数据。机器学习模型的输入称为特征。
Size是唯一的特征。用于训练机器学习模型的真值称为标签。Price值是标签。
更复杂
更复杂的模型使用事务文本描述将金融事务分类为类别。
通过删除冗余的字词和字符,以及对字词和字符组合进行计数,每个事务描述都被分解为一组特征。该特征集用于基于训练数据中的类别集训练线性模型。新描述与训练集中的描述越相似,它就越有可能被分配到同一类别。
房屋价格模型和文本分类模型均为线性模型。根据数据的性质和要解决的问题,还可以使用决策树模型、广义加性模型和其他模型。可以在任务中找到有关模型的详细信息。
ML.NET的创建与安装
ML.NET安装的几个核心注意事项
- .NET Framework的版本不能低于4.6.1
- 只能在64位的系统下运行,不支持x86和Any CPU
创建项目
我用的VS2017,接下来我们就看看怎么在VS2017中使用ML.NET
打开VS2017,新建项目,选择Windows窗体应用,输入项目名称为MLDemo,框架选择.Net Framework 4.6.1
创建好后在右侧解决方法中鼠标右键引用--管理NuGet程序包
在浏览框输入MLNET搜索,找到MLNET后进行安装
点击安装,如果此时.net framework不是4.6.1或以上,这里就会报错了
下面提示已完成代表安装成功了
我们从左侧引用处可以看到了ML.NET相关的库已经都安装加载进来
配置管理器设置
安装好ML.NET后,需要我们进行配置管理器设置,主要就是输出为64位的方案,前面提到过,ML.NET只支持X64的平台。
点击中间位置的Debug Any CPU右边的下拉按钮,选择配置管理器
点击右键活动解决方案平台的下拉按钮选择新建
按下图点击确定
我们重新看一下现在平台改为x64了,到这里ML.NET的框架就搭建完成了。