R语言统计分析技术研究 特征值选择技术要点

时间:2021-06-13 16:54:08

特征值选择技术要点

       

                 作者:王立敏

               文章来源:  网络

1.特征值

特征值是线性代数中的一个重要概念。在数学,物理学,化学,计算机等领域有着广泛的应用。设A是n阶方阵,如果存在数m和非零n维列向量x,使得Ax=mx成立,则称m是A的一个特征值或本征值。非零n维列向量x称为矩阵A的属于特征值m的特征向量或本征向量,简称A的特征向量或A的本征向量。

2.使用R语言的Boruta包进行特征选择

在数据分析过程中,利用各种图表进行数据探索是必要的前期工作 。描述性统计中就包括了直方图,散点图等工具来探索连续数据,则可以采用条形图,交叉分组表等工具。Excel中所谓的“数据透视表”,其实就是一个交互式的交叉分组表。

3.R语言对时间序列特征值的提取

  有一组一分钟序列的数据(一个变量),想想提取这个时间序列的特征参数,并作为聚类算法的输入,实现对这组数据的分类。

4.求矩阵的特征值和特征向量

 

函数eigen(Sm) 用来计算矩阵Sm 的特征值和特征向量。这个函数的返回值是一个

含有values 和vectors 两个分量的列表。命令

> ev <- eigen(Sm)

将把这个列表赋给ev。ev$val 表示Sm 的特征值向量,ev$vec 则是相应特征向量构成

的一个矩阵。假定我们仅仅需要特征值,我们可以采用如下的命令:

> evals <- eigen(Sm)$values

evals 现在拥有特征向量,而第二个分量则被抛弃了。如果以下面的表达式作为一个

命令,

> eigen(Sm)

这两个成分连同它们的名字都会被显示。对于大的矩阵,若无必要,最好不要用下面

的表达式计算特征向量

> evals <- eigen(Sm, only.values = TRUE)$values