张量的基本概念及应用

文章目录

张量
- 张量及其表示
- - 张量的线性代数表示
  - 三阶张量
- 张量的矩阵化和向量化
- - 张量的水平展开与向量化
- 张量的基本代数运算
- - 张量的內积、范数和外积

张量

基于张量的数据分析称为张量分析（tensor analysis），属于多重线性数据分析（multilinear data analysis）。

张量及其表示

数据沿一相同方向的排列称为一路阵列。标量称为零路阵列，行向量和列向量称为沿水平和垂直方向排列的一路阵列。矩阵是数据沿水平和垂直方向排列的二路阵列。张量即为数据的多路阵列表示，一个张量就是一个多路阵列或多维阵列，它是矩阵的一种扩展。
张量的数学符号表示为花体符号如 $\mathcal{T,A,X}$ 。 $n$ 路阵列表示为 $n$ 阶张量，是定义在 $n$ 个向量空间的笛卡尔积上的多重线性函数，记为 $\mathcal{T} \in\mathbb{K}^{I_1\times I_2\times \cdots \times I_n}$ 。
其中 $\mathbb{K}$ 代表实数域 $\mathbb{R}$ 或复数域 $\mathbb{C}$ 。张量是跨越 $n$ 个向量空间的多线性映射，有：
$\mathcal{T}:\mathbb{K}^{I_1}\times\mathbb{K}^{I_2}\times\cdots\times\mathbb{K}^{I_n}\rightarrow\mathbb{K}^{I_1\times I_2\times \cdots \times I_n}$
张量在各个领域均有应用，包括医学，化学等。

张量的线性代数表示

线性代数即有限维向量空间的矩阵的代数，定义一个有限维向量空间的线性算子。多重线性代数即高阶张量代数，定义了一组有限维向量空间的多重线性算子。
矩阵 ${\bm{A}}\in\mathbb{K}^{m\times n}$ 用其元素和矩阵符号表示 $[\cdot]$ 表示为 ${\bm{A}} = [a_{ij}]_{i,j=1}^{m,n}$ 。同样地，张量的表示可以写为 $\mathcal{A} \in\mathbb{K}^{I_1\times I_2\times \cdots \times I_n}$ 使用双重矩阵符号 $\begin{Bmatrix}\cdot \end{Bmatrix}$ 表示为 $\mathcal{A}= \begin{Bmatrix}a_{i_1\cdots i_n} \end{Bmatrix}_{i_1,\cdots i_n=1}^{I_1,\cdots,I_n}$ ，其中 $a_{i_1\cdots i_n}$ 是张量第 $({i_1\cdots i_n})$ 元素。

三阶张量

最常用的是三阶张量，有时也称为三维矩阵。
三阶张量的三路阵列不以行向量、列向量等相称，改称张量纤维（tensor fiber）。纤维是只保留一个下标可变，固定其他所有下标不变的一路阵列。水平纤维、竖直纤维、纵深纤维。例如：三阶张量 $\mathcal{A}\in\mathbb{K}^{I\times J\times K}$ ，其符号表示纤维为： $a_{i:k},a_{:jk},a_{ij:}$ 。

定义1： $N$ 阶张量 $\mathcal{A}= \begin{Bmatrix}a_{i_1\cdots i_n} \end{Bmatrix}_{i_1,\cdots i_n=1}^{I_1,\cdots,I_n}\in \mathbb{K}^{I_1\times I_2\times \cdots\times I_n}$ 的模式- $n$ 向量是一个以 $i_n$ 为元素下标变量，而其他下标均固定不变的 $I_n$ 维向量，记作 ${\bf{A}}_{i_1\cdots i_n-1:i_n+1\cdots i_N}$ 。
注意张量阶数和维数的区别： $N$ 称为阶数， $I_n$ 称为第 $n$ 路阵列的维数。

高阶张量也可以使用矩阵的集合表示。如三阶张量可以使用矩阵组成水平切片、侧向切片、正面切片等，符号表示为： ${\bf{A}}_{i::},{\bf{A}}_{:j:},{\bf{A}}_{::k}$ 。
切片的数学表示：

三阶张量 $\mathcal{A}\in\mathbb{K}^{I\times J\times K}$ 有 $I$ 个水平切片
${\bf{A}}_{i::}=\begin{bmatrix}a_{i11}&\cdots & a_{i1K}\\ \vdots & \ddots & \vdots \\ a_{iJ1} & \cdots & a_{iJK}\end{bmatrix}=\begin{bmatrix}\bm{a}_{i:1},\cdots,\bm{a}_{i:K}\end{bmatrix}=\begin{bmatrix}\bm{a}_{i1:}\\\vdots\\\bm{a}_{iJ:}\end{bmatrix},i=1,\cdots,I$
三阶张量 $\mathcal{A}\in\mathbb{K}^{I\times J\times K}$ 有 $J$ 个侧向切片
${\bf{A}}_{:j:}=\begin{bmatrix}a_{1j1}&\cdots & a_{Ij1}\\ \vdots & \ddots & \vdots \\ a_{1jK} & \cdots & a_{IjK}\end{bmatrix}=\begin{bmatrix}\bm{a}_{1j:},\cdots,\bm{a}_{Ij:}\end{bmatrix}=\begin{bmatrix}\bm{a}_{:j1}\\\vdots\\\bm{a}_{:jK}\end{bmatrix},j=1,\cdots,J$
3.三阶张量 $\mathcal{A}\in\mathbb{K}^{I\times J\times K}$ 有 $K$ 个正面切片
${\bf{A}}_{::k}=\begin{bmatrix}a_{11k}&\cdots & a_{1Jk}\\ \vdots & \ddots & \vdots \\ a_{I1k} & \cdots & a_{IJk}\end{bmatrix}=\begin{bmatrix}\bm{a}_{:1k},\cdots,\bm{a}_{:Jk}\end{bmatrix}=\begin{bmatrix}\bm{a}_{1:k}\\\vdots\\\bm{a}_{I:k}\end{bmatrix},k=1,\cdots,K$

张量的矩阵化和向量化

张量的计算中希望使用矩阵代表一个三阶张量。将一个三路或 $N$ 路阵列重新组织成一个矩阵形式的变换称为张量的矩阵化（matricization or matricizing）。也称张量的展开（unfolding）或扁平化（flattening）。
向量化同理。

张量的水平展开与向量化

张量的基本代数运算

张量的內积、范数和外积

定义：张量的內积，若 $\mathcal{A,B}\in \mathcal{T}(I_1,I_2,\cdots,I_n)$ ,则 $\mathcal{A}$ 和 $\mathcal{B}$ 的內积为标量，定义为两个张量的列向量化之间的內积
$\left \langle \mathcal{A,B}\right \rangle\overset{\text{def}}{=}\left\langle vec(\mathcal{A}),vec(\mathcal{B})\right\rangle=(vec(\mathcal{A}))^Hvec(\mathcal{B})\\ =\sum_{i_1=1}^{I_1}\sum_{i_2=1}^{I_2}\cdots\sum_{i_n=1}^{I_n}a_{i_1i_2\cdots i_n}^{*}b_{i_1i_2\cdots i_n}$
其中 $*$ 表示复共轭。

根据张量內积的概念，可以得到其张量范数的定义。

定义（张量的Frobenius范数）：张量 $\mathcal{A}$ 的Frobenius范数的定义为：
$\left \| \mathcal{A} \right \|_F=\sqrt{\left \langle \mathcal{A,A}\right\rangle}\overset{\text{def}}{=}\left( \sum_{i_1=1}^{I_1}\sum_{i_2=1}^{I_2}\cdots\sum_{i_n=1}^{I_n}\left| a_{i_1i_2\cdots i_n}\right|^2\right)^{1/2}$
其內积和范数具有如下性质：
张量的范数可以转化成张量的矩阵化的范数
$\left \| \mathcal{A} \right \|=\left \| \bm{A}^{(I_n\times I_1\cdots I_{n-1}I_{n+1}\cdots I_N)} \right \|=\left \| \bm{A}^{(I_1\cdots I_{n-1}I_{n+1}\cdots I_N\times I_n)} \right \|$
张量的范数可以改成张量的向量化函数的范数
$\left \| \mathcal{A} \right \|=\left\| \bm{a}^{(I_1I_2\cdots I_N\times 1)}\right\|=\left\| \bm{a}^{(1\times I_1I_2\cdots I_N)}\right\|$
两个张量之差的范数平方
$\left \| \mathcal{A-B} \right \|^2=\left \| \mathcal{A} \right \|^2-2\left \langle \mathcal{A,B}\right\rangle+\left \| \mathcal{B} \right \|^2$
若 $Q\in\mathbb{K}^{J\times I_n}$ 为标准正交矩阵，即 $QQ^H=I_{J\times J}$ 或 $Q^HQ=I_{I_n\times I_N}$ ，则有
$\left \| \mathcal{A}{\times_n} Q \right \|=\left \| \mathcal{A} \right \|$
令 $\mathcal{A,B}\in \mathbb{K}^{I_1\times I_2 \times \cdots \times I_N},\bm{a}_n,\bm{b}_n\in \mathbb{K}^{J\times I_n}$ ，其 $\mathcal{A}=\bm{a_1}\circ\bm{a_2}\circ\cdots \bm{a_N}$ 和 $\mathcal{B}=\bm{b_1}\circ\bm{b_2}\circ\cdots \bm{b_N}$ ，则
$\left \langle \mathcal{A,B}\right\rangle=\prod_{=1}^{N}\left \langle \mathcal{\bm{a}_n,\bm{b}_n}\right\rangle$

向量的外积（output product）为一个矩阵，有 $\bf{X}=\bm{uv}^T$ 多个向量的外积给出一张量。使用 $\circ$ 表示多个向量的外积。

定义（向量外积） $n$ 个向量 $a^{(i)}\in \mathbb{K}^{i\times 1},i=1,\cdots ,n$ 的外积记为 $a^{(1)}\circ a^{(2)}\circ \cdots \times a^{(n)}$ ，其中为一个张量，有
$\mathcal{A}=\bm{a^{(1)}}\circ\bm{a^{(2)}}\circ\cdots \bm{a^{(n)}}$
使用元素形式定义为
$a_{i_1i_2\cdots i_n}=a_{i_1}^{(1)}a_{i_2}^{(2)}\cdots a_{i_1}^{(1)}$
式中 $a_{j}^{(i)}$ 是模式 $- n$ 的第 $j$ 个元素。

向量的外积可以推广到张量的外积，有

定义：（张量外积）两个张量 $\mathcal{A}\in \mathbb{K}^{I_1\times I_2 \times \cdots \times I_N}$ 和 $\mathcal{B}\in \mathbb{K}^{J_1\times J_2 \times \cdots \times J_N}$ 的外积仍为张量，记作 $\mathcal{A\circ B}\in \mathbb{K}^{I_1\times \cdots \times I_P\times J_1 \times \cdots\times J_Q}$
$(\mathcal{A\circ B})_{i_1\cdots i_Pj_1\cdots j_Q}=a_{i_1\cdots i_P}b_{j_1\cdots j_Q}$

《矩阵分析与应用（第2版）》第10章张量分析——张贤达

秒客网