数据挖掘主要包含哪些功能,带来了什么影响?

时间:2024-04-10 12:09:36

当今信息科技异常发达,因此,有许多的事务数据大量地被收集到数据库中,但这些数据如果不使用的话,那搜集这些数据又显得相当没有意义。就目前而言,数据的搜集方法已经相当成熟,而数据挖掘的技术正可以帮助分析这些数据。

利用各种技术与统计方法,对大量的历史数据进行分析、归纳与整合,找出感兴趣的特征且有意义的数据,数据挖掘不属于某一个单一领域,而是许多学科综合而成,其涉及统计学、机器学习、数据库、领域知识及模式识别等领域。

数据挖掘的功能如下:

1.数据分类,即按照分析对象的属性分门别类加以定义,建立类组,如将信用申请者风险属性,区分为高度风险申请者、中度风险申请者及低度风险申请者。

2.数据估计,即根据已有连续性数值的相关属性数据,以获取某一属性未知的值。如按照信用申请者的教育程度、行为来推估信用卡消费额。

3.数据预测,根据对象属性的过去观察值来推估该属性未来之值。如:由顾客过去的刷卡消费额预测其未来的刷卡消费额。

4.数据关联分组,即判断哪些相关对象应该放在一起,设计出吸引人的产品群组,且购买的概率将会大幅提升。如一个顾客购买了低脂奶酪和低脂酸奶,那么这个顾客同时也买低脂牛奶的概率是85%,因此将低脂牛奶放在低脂奶酪与低脂酸奶旁边。

5.数据群集,将异质总体区隔为较具同质性群组,同质分组相当于营销术语中的区隔化。但是假定事先未对于区隔加以定义,而数据中自然产生区隔。换句话说,群集与分组不同的是,你不晓得它会以何种方式或根据什么来分类,所以必须要有一个分析师来解读这些分类的意义。如:一群住在附近的人,驾驶相同的汽车,使用相同的家电,并且食用相同的食物。而另一群从事相同行业的人,家庭成员人数接近,年收入接近,出国次数也很接近。通过观察数据为何被群集在一起的,可以了解数据间的关系,以及这些关系将会如何影响预测的结果。

6.时序数据序列模式挖掘,时序数据序列模式挖掘是在时间序列的数据库中,找出数据和时间相关的行为模式,并分析此序列的状态改变,进而达到预测未来的效果。如:预测未来的股市走向、股价的波动。

数据挖掘的影响力

对于数据挖掘我们应该有正确的认知,它不是无所不能的魔法。它不是在监视数据,然后告诉你数据库里出现了某种特别的现象,也不是说有了数据挖掘,就连不了解业务、不了解数据所代表的意义,或是不了解统计原理的人,也可以做数据挖掘。其所挖掘出来的信息,也不是你可以不经确认,就可以照单全收应用到业务上。

数据挖掘是寻找隐藏在数据中的信息,如趋势、模式及关系的过程。其用来帮助业务分析人员从数据中发掘出各种假设,但是它并不验证这些假设,也不判断这些假设的价值。

现代企业经常搜集大量数据,包括市场、客户、供货商、竞争对手以及未来趋势等重要信息,如果能通过数据挖掘技术,从巨量的数据库中,挖掘出不同的信息与知识出来,作为决策支持之用,必能提高企业的竞争优势。数据挖掘应用的行业包括了零售商、金融业、电信业等。
  人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
数据统计分析和数据挖掘有何区别?
http://www.duozhishidai.com/article-11047-1.html
数据挖掘的聚类算法和优势
http://www.duozhishidai.com/article-12942-1.html
如何通过自学,成为数据挖掘“高手”?
http://www.duozhishidai.com/article-9796-1.html
数据分析与数据挖掘的区别和联系?
http://www.duozhishidai.com/article-9800-1.html
构建一个数据挖掘模型,主要分为哪几步?
http://www.duozhishidai.com/article-9719-1.html
数据挖掘主要包含哪些功能,带来了什么影响?