R语言统计分析技术研究特征值选择技术要点

特征值选择技术要点

作者：王立敏

文章来源：网络

1.特征值

特征值是线性代数中的一个重要概念。在数学，物理学，化学，计算机等领域有着广泛的应用。设A是n阶方阵，如果存在数m和非零n维列向量x，使得Ax=mx成立，则称m是A的一个特征值或本征值。非零n维列向量x称为矩阵A的属于特征值m的特征向量或本征向量，简称A的特征向量或A的本征向量。

2.使用R语言的Boruta包进行特征选择

在数据分析过程中，利用各种图表进行数据探索是必要的前期工作。描述性统计中就包括了直方图，散点图等工具来探索连续数据，则可以采用条形图，交叉分组表等工具。Excel中所谓的“数据透视表”，其实就是一个交互式的交叉分组表。

3.R语言对时间序列特征值的提取

有一组一分钟序列的数据（一个变量），想想提取这个时间序列的特征参数，并作为聚类算法的输入，实现对这组数据的分类。

4.求矩阵的特征值和特征向量

函数eigen(Sm) 用来计算矩阵Sm 的特征值和特征向量。这个函数的返回值是一个

含有values 和vectors 两个分量的列表。命令

> ev <- eigen(Sm)

将把这个列表赋给ev。ev$val 表示Sm 的特征值向量，ev$vec 则是相应特征向量构成

的一个矩阵。假定我们仅仅需要特征值，我们可以采用如下的命令：

> evals <- eigen(Sm)$values

evals 现在拥有特征向量，而第二个分量则被抛弃了。如果以下面的表达式作为一个

命令，

> eigen(Sm)

这两个成分连同它们的名字都会被显示。对于大的矩阵，若无必要，最好不要用下面

的表达式计算特征向量

> evals <- eigen(Sm, only.values = TRUE)$values

秒客网