机器学习算法简单入门。
由于团队(大数据团队)技术发展需要,借对交通业务数据进行需求拓展,实现数据挖掘和数据分析技术的掌握,绕不开机器学习算法,可以说,大数据的核心价值在于算法。
如下图,当前机器学习按照任务类型可以分为有监督学习和无监督学习,这两者的区别在于你是否告诉程序一个标签,或者叫答案,一个清晰明确的判断标准。
比如训练一个程序判别图片中的动物是否是狗,训练样本输入的同时,会由人告诉程序这张图片到底是不是猫,这就是有答案的学习;
反之,如果只输入一些图片,但未告诉程序图片是否是猫,让程序自己根据图片的特征进行分类识别,那就是无答案的学习。
有监督又可以分为分类、回归。 分类又称为逻辑回归,通过一个在0~1之间的数字来定义性质,比如0.9,可以作如下假设,0.9更接近1,故如认为1。 回归通常用于预测,比如一串二维点在坐标系上可以根据算法描绘成一条线,就可以预测接下去的趋势。