关于群论在量子力学中的应用

时间:2024-02-24 19:39:23

基本上还是接着上一篇总结来写的,上一篇总结了连续群的基本概念,\(SU(2),SO(3)\)群及其表示,角动量理论,物理涉及的不是很多。

这篇总结大概涉及到平移与旋转变换、简并微扰的群伦解释和各向同性谐振子、氢原子的例子。参考书还是那几本。

\(\def\vec#1{\boldsymbol{#1}}\) \(\def\bra#1{\langle#1|}\) \(\def\ket#1{|#1\rangle}\) \(\def\dirac#1#2{\langle#1|#2\rangle}\)

抽象希尔伯特空间和函数空间

量子态\(|\psi\rangle\)是抽象希尔伯特(Hilbert)空间中的一个矢量,函数空间是一种希尔伯特空间,里面的元素都是满足构成希尔伯特空间的函数。这两个空间同构

位形空间的变换算符\(\{Q\}\)通过对三维矢量的变换而实现了对函数空间中各个函数的变换,相应的对函数的变换算符为\(\{\hat{D}(Q)\}\)。前面已经证明,如果\(\{Q\}\)构成群,则\(\{\hat{D}(Q)\}\)也构成群,与前者同态。因为抽象希尔伯特空间与函数希尔伯特空间同构,所以相应的作用在抽象态矢量\(|\psi\rangle\)上的算符记为\(\{D(Q)\}\),它与\(\{\hat{D}(Q)\}\)同构。

空间平移群

设三维位形空间中,平移群为\(\{Q\}\),其中元素的作用是\(\boldsymbol{r\'}=Q(\boldsymbol{\lambda})\boldsymbol{r}=\boldsymbol{r+\lambda}\),为了简洁,直接把\(\hat{D}(Q(\boldsymbol{\lambda}))\)\({D}(Q(\boldsymbol{\lambda}))\)记为\(\hat{D}(\boldsymbol{\lambda})\)\(D(\boldsymbol{\lambda})\). 从而有$$\hat{D}(\boldsymbol{\lambda})\psi(\boldsymbol{r})=\psi(\vec{r-\lambda})$$由上式根据定义,生成元满足(就不分三分量处理了,统一用矢量符号代替)$$\hat{I}\psi(\vec{r})=\lim_{\vec{\lambda}\to0}\frac{1}{i\vec{\lambda}}[\psi(\vec{r-\lambda})-\psi(\vec{r})]=i\nabla\psi(\vec{r})$$可得该群生成元为$$\hat{I}=i\nabla=-\hbar\hat{\vec{P}}$$由此,群元素的一般表达式为$$\hat{D}(\vec{\lambda})=\exp[-i\hbar\hat{\vec{P}}\cdot\vec{\lambda}]$$

空间反演群

在位形空间中把对矢量进行操作\(\vec{r\'}=P\vec{r}=-\vec{r}\)的算符\(P\)称为空间反演算符,有时候也用\(J\)表示。简便起见,也把函数空间和抽象希尔伯特空间对应的变换算符也记为\(P\),其作用如下:\(\hat{P}\psi(\vec{r})=\psi(-\vec{r})\)以及\(P\ket{\vec{r}}=\ket{-r}\),由上式可得\(P^2=1\),所以设其本征矢量为\(\ket{\psi}\),则有\(\ket{\psi}=P^2\ket{\psi}=p^2\ket{\psi}\)从而本征值取\(\pm1\),分别对应偶宇称和奇宇称。不是其本征态的叫做无确切宇称。

空间转动

前一个总结说了位形空间的转动群\(SO(3)\)的定义和表示,并类比\(SO(2)\)群推广得到了它的生成元,这里重新推导一次。
对于无限小转动算符,其作用是\(Q(\vec{n},d\varphi)\vec{r}=\vec{r}+d\varphi\vec{n}\times\vec{r}\),也把\(\hat{D}(Q(\vec{n},\varphi))\)直接记为\(\hat{D}(\vec{n},\varphi)\)则对于函数有$$\begin{align}\hat{D}(\vec{n},d\varphi)\psi(\vec{r})&=\psi(\vec{r}-d\varphi\vec{n}\times\vec{r})\&=
\psi(\vec{r})-d\varphi\vec{n}\times\vec{r}\cdot\nabla\psi(\vec{r})\&=(1-id\varphi \vec{n}\times\hat{\vec{R}}\cdot\hat{\vec{P}}/\hbar)\psi(\vec{r})\end{align}$$从而$$\hat{D}(\vec{n},d\varphi)=1-\frac{i}{\hbar}d\varphi\vec{n}\cdot\vec{L}$$
对于有限转动,分解为无穷多无穷小转动的乘积$$\hat{D}(\vec{n},\varphi)=\lim_{m\to\infty}\left(1-\frac{i}{\hbar}\frac{\varphi}{m}\vec{n}\cdot\vec{L}\right)^m=\exp\left[-\frac{i}{\hbar}\varphi\vec{n}\cdot\vec{L}\right]$$

算符的分类

算符分为两类:标量算符满足在空间转动下保持不变;矢量算符在空间转动下发生变化,变化就好三维位形空间中矢量的变化一般。
具体来说就是标量算符满足

\[D(\vec{n},\varphi)SD^{-1}(\vec{n},\varphi)=S \]

矢量算符满足

\[D(\vec{n},\varphi)\vec{V}D^{-1}(\vec{n},\varphi)=Q^{-1}(\vec{n},\varphi)\vec{V} \]

矢量算符再按在空间反演变换下变不变号而分为真矢量和轴矢量(赝矢量)。

可见量子力学中,矢量算符的定义要借助于空间转动,又因为角动量算符是空间转动群的生成元,所以矢量算符的定义和角动量算符关系密切。甚至可以证明得出对于任何矢量算符\(\vec{V}\),都有\([L_i,V_j]=\sum_k\varepsilon_{ijk}i\hbar V_k\). 从另一方面也反映出角动量算符根本上完全是一个数学概念——转动群的生成元。

对称性和守恒率

不像一个三维形状,不变性是指它在某个变换下不变,对一个量子态\(\ket{\psi}\)而言,其不变性是指它的演化规律不变。量子态总按照薛定谔方程演化$$i\hbar\frac{\partial}{\partial t}\ket{\psi(t)}=H\ket{\psi(t)}$$为求得在施加变换\(Q\)以后的演化规律,给上面方程从左边乘以\(D(Q)\)有$$i\hbar\frac{\partial}{\partial t} D({Q})\ket{\psi(t)}=D({Q})HD^{-1}({Q})D({Q})\ket{\psi(t)}$$把\(D(Q)\ket{\psi(t)}\)记为新状态\(\ket{\psi\'(t)}\)则方程变为$$i\hbar\frac{\partial}{\partial t}\ket{\psi\'(t)}=H\'\ket{\psi\'(t)}$$其中\(H\'=D(Q)HD^{-1}(Q)\)对比原始的薛定谔方程,如果要求演化规律不变,则必然有$$H=D(Q)HD^{-1}(Q)\Leftrightarrow[H,D(Q)]=0$$即系统的哈密顿在变换下保持不变,或者哈密顿和变换算符对易这就是系统在某变换\(Q\)下保持不变的数学表达式。

如果哈密顿存在某个对称性群\(\{Q\}\)则群里每个元素都和\(H\)对易。
如果系统哈密顿不显含时间,则可以研究守恒量,其定义为:海森伯绘景下,物理量算符\(A^H(t)\)不显含时间,则物理量\(A\)守恒。

如果\([H,A]=0\)则$$A^H(t)=\exp[\frac{i}{\hbar}tH]A\exp[-\frac{i}{\hbar}tH]=A$$显然满足守恒的条件。所以如果一个算符与\(H\)对易,则该物理量是守恒量。

对于平移群,如果哈密顿在平移变换下不变,即\([H,\exp(-i\hbar\vec{P}\cdot\vec{\lambda})]=0\)对任意矢量\(\vec{\lambda}\)成立,这就是说动量守恒:$$[H,\vec{P}]=0$$

对于空间旋转群,如果哈密顿在旋转下保持不变,则类似地有\([H,\vec{L}]=0\),即\(\vec{L}\)是守恒量。

微扰简并的群论解释

使得系统哈密顿\(H\)保持不变的所有空间变换的集合构成一个群\(\{Q\}\)称之为系统对称性群。按照上面的分析,对称性群的每个元素都和哈密顿对易\([D(Q),H]=0\).

\(E_n\)为哈密顿本征值,设\(\ket{\psi_{i}^{(n)}}\)为哈密顿本征态满足\(H\ket{\psi_{i}^{(n)}}=E_n\ket{\psi_{i}^{(n)}}\)其中\(i=1,2,\cdots,d_n\)\(d_n\)为第\(n\)能级的简并度。由于算符群元素\(D(Q)\)\(H\)对易,所以

\[HD(Q)\ket{\psi_{i}^{(n)}}=D(Q)H\ket{\psi_{i}^{(n)}}=E_nD(Q)\ket{\psi_{i}^{(n)}} \]

上式表明态矢量\(D(Q)\ket{\psi_{i}^{(n)}}\)也是\(H\)的本征态,且属于本征值\(E_n\),所以它还处于第\(n\)个简并子空间之中。于是算符\(D(Q)\)对其的作用可以写成$$D(Q)\ket{\psi_{i}{(n)}}=\sum_j\ket{\psi_{j}{(n)}}D_{ji}(Q)$$
上式表明态矢量\(\{\ket{\psi_{i}^{(n)}}\}\)可以生成哈密顿对称性群\(\{Q\}\)的一个\(d_n\)维表示,选取其中的\(d_n\)个正交的态矢量出来作为基矢,生成的表示就是幺正的。

这里有一个问题:某\(E_n\)的本征子空间所生成的表示,可约不可约?有一个结论:只要对称性群找全了,属于一个本征值的本征矢量所生成的表示就是对称性群\(\{Q\}\)的不可约表示。这个结论无法给出一般性的证明。

总结一下,对\(H\)的诸本征矢量重新排序,把同属于一个简并子空间的本征矢量聚在一起,\(H\)在自己的表象下,矩阵元为\(\dirac{\psi^{(m)}_i}{H\psi^{(n)}_j}=E_{\beta,q}\dirac{\psi^{(m)}_i}{\psi^{(n)}_j}\),很明显对于不同本征值,是正交的,所以\(H\)是分块对角的,每个对角块的基矢量属于一个本征子空间(表示空间),且它们生成对称性群的一个不可约表示。

设原哈密顿为\(H_0\),当引入微扰\(H\'\)时,对称性群发生改变,只会减小不会增大,从而新对称性群\(\{Q\}\)是原对称性群\(\{Q_0\}\)的一个子群。这时候原本的表示空间(本征子空间)可能就会因为缺少了某几个群元素而分裂成若干个互不沟通的不变子空间,也就是说,表示变得可约了。对这个原来的表示空间进行约化,得到若干个不变子空间,每个不变子空间都对应着新哈密顿\(H=H_0+H\'\)的一个本征子空间。因此微扰可以解除或部分解除简并。这就是简并因微扰而解除的群论解释。

从这个观点来看,简并微扰中所谓的零级近似波函数可以这么理解:设哈密顿为\(H=H_0+\lambda H\'\),当参数\(\lambda\to0\)时,可以认为诸简并的定态波函数\(\{\psi_i\}\)几乎没有改变,但是系统的对称性群立刻改变了,变得更小,从而本征子空间已经分裂成若干不变子空间。但是可能存在若干个定态波函数横跨两个或多个不变子空间,但是随着参数\(\lambda\)逐渐增大到\(1\),每个定态波函数必须收敛于某个确定的不变子空间中,所以原始的若干个横跨多个不变子空间的态函数不是一个好的“起点”。为此,在\(\lambda\)增大之前,就事先把诸定态波函数进行重组,使得每个波函数都只处于一个子空间中,这样的波函数就是零级近似波函数。反过来也可以把零级近似波函数理解为含微扰哈密顿的精确波函数在\(\lambda\to0\)时的极限。(但是喀兴林的书上反对这种说法,并给出了一个反例。)

在求解简并微扰问题时,手续就是在\(H_0\)表象写出简并子空间中的\(H\'\)的矩阵,然后把它对角化,对角化的基函数就是零级近似波函数。直观意义是什么呢?前面说的属于\(H\)同一个本征值的本征矢量生成群的一个不可约表示,如果在这个简并子空间中对\(H\'\)进行对角化处理,发现其本征值不相同,比如(\(V\)是小量)

\[S^{-1}H\'S=\begin{pmatrix} V&0&0\\ 0&2V&0\\ 0&0&2V \end{pmatrix}\]

则表明引入微扰\(H\'\)以后,本征子空间要分裂为两个不变子空间,一个是一维的,另一个是二维的。按照幺正矩阵\(S\)写出来的新基矢,就分别张成两个不变子空间。两个不变子空间的基函数就是零级近似波函数。

需要注意的是,这里仅考虑了\(H\'\)的对角化和本征值,因为在此简并子空间中,任意原基矢量的线性组合都是\(H_0\)的属于同一个本征值的本征矢量,只要新基矢们相互正交,\(H_0\)就一直保持对角阵形式,且对角元相等,所以只需研究\(H\'\)的对角化就够了。但这一切都只是在原\(H_0\)的某个简并子空间中进行的,而真正的含微扰精确解有可能含有\(H_0\)的这个简并子空间以外的分量,所以这就是称为“近似”的原因。

氢原子的\(SO(4)\)对称性

上面说的是如果加入微扰,使得对称性群变小了所带来的影响:原来的不可约表示空间变成了可约的。反过来的话,如果对称性没有找全,而加入了新找到的对称操作,使得对称性群变大了,则原来的可约表示空间变得不可约

原因如下:对称性没有找全,从而把某个本征子空间(表示空间)生成的表示约化了,就是说在这个表示空间内找到了两个互不侵犯的不变子空间,每个不变子空间对应一个不可约表示。如果这时候把没找到的对称变换\(Q_x\)加入原对称性群,则这个很可能沟通了两个原先的不变子空间,使得其中的元素互相转化,而不变子空间就不存在了,这时候这个表示就是不可约表示了。

对氢原子而言,其能级简并度为\(n^2\),但是\(SO(3)\)的不可约表示是\((2l+1)\)维的。例如对于\(n=3\)来说,\(l=0,1,2\)分别给出三个\(SO(3)\)的不可约表示,分别是\(1,3,5\)维的,如果氢原子的对称性群是\(SO(3)\)\(n=3\)这个\(9\)维简并子空间是可约的。另一方面,哈密顿的相同的本征值对应的本征矢量必然生成其对称性群的一个不可约表示,也就是说\(n=3\)的这个\(9\)维的简并子空间的\(9\)个基函数必然生成对称性群的一个不可约表示。出现了矛盾。唯一的解释是氢原子的对称性群没有找全,必然存在着一个更大的对称性群,对那个群而言,这\(9\)维简并子空间是不可约的。

在经典力学中,除了能量和角动量,平方反比场中还有一个隆格楞次(Runge-Lenz)矢量也守恒。\(\vec{M}=\frac{1}{ma}\vec{p}\times\vec{L}-\frac{\vec{r}}{r}\),哈密顿为\(H=\frac{p^2}{2m}-\frac{a}{r}\). 前面说到,对称性和守恒量之间有对应关系,动量守恒对应空间平移对称性,角动量守恒对应空间旋转对称性,那么这个隆格楞次矢量对应何种对称性?作为守恒量的角动量算符\(\vec{L}\)是其对应的群的生成元,所以可以先看一下如果把这个\(\vec{M}\)矢量看做某个群的生成元会发生什么

它对应的量子力学算符(Bohm规则)为

\[\vec{M}=\frac{1}{2ma}(\vec{P}\times\vec{L}-\vec{L}\times\vec{P})-\frac{\vec{R}}{R} \]

可以证明它确实和氢原子哈密顿对易\([\vec{M},H]=0\),而且\(\vec{L}\cdot\vec{M}=\vec{M}\cdot\vec{L}=0\),还可以计算得到其对易关系如下

\[[M_i,L_j]=i\hbar\sum_k\varepsilon_{ijk}M_k\\ [M_i,M_j]=-i\hbar\sum_k\varepsilon_{ijk}\frac{2}{m}HL_k \]

再加上

\[[L_i,L_j]=i\hbar\sum_k\varepsilon_{ijk}L_k \]

希望得到一个封闭的李代数,以此来生成一个李群。但是这个代数并不封闭,因为对易式中出现了\(H\).

为解决出现了哈密顿算符\(H\)的问题,可以只对束缚态的某个简并子空间考虑,这时\(H=E_n\)可以作为一个数,而不是算符。这样一来,上面的代数就封闭了,为了对称起见,可以重新标定矢量算符:

\[\vec{N}=a\sqrt{-\frac{m}{2E_n}}\vec{M} \]

这样可以得到

\[[L_i,L_j]=i\hbar \sum_k\varepsilon_{ijk}L_k\\ [N_i,L_j]=i\hbar \sum_k\varepsilon_{ijk}N_k\\ [N_i,N_j]=i\hbar \sum_k\varepsilon_{ijk}L_k \]

上面确实构成一个李代数,把它们这些算符作为生成元,可以生成一个李群。但是其结构常数似乎比较复杂,很难一眼看出来这个是什么群的结构常数。

为了使其结构常数更明显,再次作代换(生成元并非唯一的,可以取合适的线性组合,此时结构常数跟着变化)

\[\vec{J}^{(1)}=\frac{\vec{L}+\vec{N}}{2}\\ \vec{J}^{(2)}=\frac{\vec{L}-\vec{N}}{2} \]

这时候上面的三个对易关系变成

\[[J^{(1)}_i,J^{(1)}_j]=i\hbar \sum_k\varepsilon_{ijk}J^{(1)}_k\\ [J^{(2)}_i,J^{(2)}_j]=i\hbar \sum_k\varepsilon_{ijk}J^{(2)}_k\\ [J^{(1)}_i,J^{(2)}_j]=0 \]

这样\(\vec{J}^{(1)}\)\(\vec{J}^{(2)}\)各自构成独立的李代数,且互相对易。对于每个独立的李代数,观察其结构常数,发现正是\(SU(2)\)的结构常数。于是每个独立的李代数都生成一个独立的\(SU(2)\)群。又因为两组生成元对易,从而两个\(SU(2)\)群的群元相互对易,满足直积群的概念,所以上面六个生成元构成的整个李代数所得到的李群是直积群\(SU(2)\otimes SU(2)\),它和\(SO(4)\)同构。

因为\(\vec{J}^{(i)}\)独自构成一个“角动量”,所以\({J^{(i)}}^2\)的本征值也为\(j_i(j_i+1)\hbar^2\)的形式(\(j_i\)取正整数或半整数),利用\(\vec{L}\cdot\vec{N}=0\)可以得到

\[{J^{(1)}}^2={J^{(2)}}^2=\frac{1}{4}(L^2+N^2) \]

所以\(j_1=j_2=j\). 这里,李群的阶为\(2\),因为互相对易的生成元最多有两个。从而卡塞米尔算符也有两个,它们就是上面的\(N^2,L^2\).

由于直积群的所有不可约表示都是小群的不可约表示的直积,所以群\(SU(2)\otimes SU(2)\)的不可约表示是

\[D^{(j_1)}(a_1,b_1)\otimes D^{(j_2)}(a_2,b_2)=D^{(j)}(a_1,b_1)\otimes D^{(j)}(a_2,b_2) \]

维数是\((2j+1)^2\),把\((2j+1)\)记为\(n\)\(n\)取遍全体正整数,且不可约表示的维数是\(n^2\),恰好是氢原子的能级简并度。而氢原子的对称性是两个算符\(\vec{L}\)\(\vec{N}\)的“转动”对称性。

\(\ast\)对于算符\(\vec{M}\)还有一个公式

\[M^2=\frac{2}{ma^2}H(L^2+\hbar^2)+1 \]

利用这个公式,结合上面导出的

\[{J^{(1)}}^2+{J^{(2)}}^2=\frac{1}{2}(L^2+N^2)=\frac{1}{2}(L^2-\frac{ma^2}{2E}M^2) \]

可以得到

\[{J^{(1)}}^2+{J^{(2)}}^2=\frac{1}{2}\left[L^2-\frac{1}{E}H(L^2+\hbar^2)-\frac{ma^2}{2E}\right] \]

把上式作用在\(H\)的本征矢量\(\ket{\psi_n}\)上得到

\[2j(j+1)\hbar^2=-\frac{1}{2}\left(\hbar^2+\frac{ma^2}{2E}\right) \]

反解出

\[E=-\frac{m}{2a^2\hbar^2}\frac{1}{(2j+1)^2} \]

\((2j+1)\)记为\(n\)则正好是氢原子能级公式

布洛赫定理

群论在固体物理中有很多应用,简单总结一下最基础的部分。

晶体点群和空间群

晶体点群是有限群。不同的晶格具有不同的对称性,对于一种晶格,把其旋转对称操作全部收集起来就构成这个晶格的对称性群。不同种类的晶格有不同的旋转对称性,从而对应不同的点群,共有\(32\)中晶体点群,用\(G\)表示。所有的点群都是\(SO(3)\)的子群。

另外我们知道晶格具有平移对称性(晶格平移群\(T\)),所以晶格的全部对称性应该是平移群和点群的某种结合。

把晶格的全体对称操作收集起来的群叫做空间群\(S\),共有\(230\)种空间群。需要注意的是点群可能并非空间群的子群,因为有这样一个事实:对于某些晶格来说,单个的点群旋转操作并非晶格的对称操作,而单个点群操作紧接着一个平移操作却是晶格的对称操作。但是商群\(S/T\)同构于点群\(G\).

如果点群是空间群的子群,则称为同型群\(73\)个);否则称为非同型群\(157\)个)。一般把空间群的元素记为\(\{A|\vec{\tau}\}\)满足

\[\{A|\vec{\tau}\}\vec{r}=A\vec{r}-\vec{\tau} \]

于是就有

\[\{A|\vec{\tau}\}^{-1}=\{A^{-1}|-A^{-1}\vec{\tau}\} \]

\[\{B|\vec{\tau}_2\}\{A|\vec{\tau}_1\}=\{BA|B\vec{\tau}_1+\vec{\tau}_2\} \]

当且仅当所有\(\vec{\tau}\)都等于晶格平移矢量\(\vec{t}\)空间群才是同型群。

给定一个空间群,每个点群操作\(A\)都有一个特征最小平移矢量\(\vec{\delta}\),满足\(\vec{\delta}=\xi\vec{a}_1+\eta\vec{a}_2+\zeta\vec{a}_3\)而其中\(\xi,\eta,\zeta\in[0,1)\),所有空间群元素都可以表达为\(\{A|\vec{\delta}+\vec{t}\}\)其中\(\vec{t}\)是晶格平移矢量。

布洛赫定理

\(T(n_1,n_2,n_3)\)把矢量\(\vec{r}\)平移\(n_1\vec{a}_1+n_2\vec{a}_2+n_3\vec{a}_3\),其中\(\vec{a}_i\)是晶格基矢$$T(n_1,n_2,n_3)\vec{r}=\vec{r}+n_1\vec{a}_1+n_2\vec{a}_2+n_3\vec{a}_3$$
为了方便,也把作用在\(\psi(\vec{r})\)上的与\(T\)同构的算符群记为\(T(n_1,n_2,n_3)\),把作用在\(\psi(\vec{r})\)上的与\(S\)同构的算符群记为\(D(A|\vec{\tau})\).

引入周期边界条件

\[\psi(\vec{r}+N_i\vec{a}_i)=\psi(r) \]

这样一来,就有

\[T(\cdots,n_i+N_i,\cdots)=T(\cdots,n_i,\cdots) \]

从而晶格平移群就是一个有限群,阶等于原胞个数\(N=N_1N_2N_3\).

因为晶格平移群是阿贝尔群,从而每个元素自成一类,再因为类数等于不等价不可约表示数,且各个不可约表示的维数平方和等于有限群的阶,所以晶格平移群的所有不可约表示都是一维的

因为哈密顿和空间群对易,空间群\(S\)是晶格哈密顿的对称性群,所以属于同一哈密顿本征值的本征函数生成空间群的一个不可约表示。对于晶格平移群(空间群的子群)来说,这个表示应该是可约的,又因为晶格平移群只有一维不可约表示,所以其完全约化形式必然是严格对角阵。把此对角阵的基函数(对称化基函数)记为\(\psi(\vec{r})\).

因为\(\psi(\vec{r})\)生成晶格平移群的一维不可约表示,所以有$$T(n_1,n_2,n_3)\psi(\vec{r})=C(n_1,n_2,n_3)\psi(\vec{r})$$其中\(C\)是某常数列。

为求出\(C\),考虑

\[T^{N_1}(1,0,0)\psi(\vec{r})=C^{N_1}(1,0,0)\psi(\vec{r})=\psi(\vec{r}) \]

从而有

\[C(1,0,0)=\exp(2\pi im_1/N_1) \]

而其中\(m_1\)是整数。对另外两个维度如法炮制可得

\[C(n_1,n_2,n_3)=\exp\left[2\pi i\left(\frac{m_1n_1}{N_1}+\frac{m_2n_2}{N_2}+\frac{m_3n_3}{N_3}\right)\right] \]

这个形式略显复杂,引入倒空间可以简化。

引入倒空间,其中倒空间基矢定义为$$\vec{a}_i\cdot\vec{b}j=2\pi\delta{ij}$$由此可以求得

\[\begin{align} \vec{b}_1&=\frac{2\pi}{V}\vec{a}_2\times\vec{a}_3\\ \vec{b}_2&=\frac{2\pi}{V}\vec{a}_3\times\vec{a}_1\\ \vec{b}_3&=\frac{2\pi}{V}\vec{a}_1\times\vec{a}_2 \end{align}\]

其中\(V\)是原胞体积\(\vec{a}_1\cdot(\vec{a}_2\times\vec{a}_3)\),而倒空间一般矢量定义为

\[\vec{k}=\frac{m_1}{N_1}\vec{b}_1+\frac{m_2}{N_2}\vec{b}_2+\frac{m_3}{N_3}\vec{b}_3 \]

其中\(m_i\)是整数,如果\(m_i\)\(N_i\)的整数倍,则矢量\(\vec{k}\)记为\(\vec{G}\)称之为倒格矢

\[\vec{G}=h\vec{b}_1+k\vec{b}_2+l\vec{b}_3 \]

其中\(h,k,l\)是整数。

倒空间有一个重要的性质:倒空间具有和正空间相同的晶格点群对称性,因此倒空间晶格和正空间晶格属于同一晶系。

引入倒空间以后就有

\[\begin{align} \vec{k}\cdot\vec{t}(n_1,n_2,n_3)&=2\pi\left(\frac{n_1m_1}{N_1}+\frac{n_2m_2}{N_2}+\frac{n_3m_3}{N_3}\right)\\ \vec{G}\cdot\vec{t}(n_1,n_2,n_3)&=2\pi M \end{align}\]

其中\(M\)是整数,\(\vec{t}(n_1,n_2,n_3)=n_1\vec{a_1}+n_2\vec{a}_2+n_3\vec{a}_3\)是晶格平移矢量。

从而

\[C(n_1,n_2,n_3)=\exp[i\vec{k}\cdot\vec{t}(n_1,n_2,n_3)] \]

这样前面的式子就简化为

\[\psi(\vec{r}+\vec{t})=\exp(i\vec{k}\cdot\vec{t})\psi(\vec{r}) \]

此即布洛赫(Bloch)定理。矢量\(\vec{k}\)标志着不同的晶格平移群的不可约表示,满足不同的\(\vec{k}\)的上式的\(\psi(\vec{r})\)生成晶格平移群的不同的不可约表示,所以为区别各不同\(\psi(\vec{r})\),需要给\(\psi(\vec{r})\)加上下标\(\vec{k}\)如下

\[\psi_\vec{k}(\vec{r}+\vec{t})=\exp(i\vec{k}\cdot\vec{t})\psi_\vec{k}(\vec{r}) \]

布洛赫定理说的是,周期势场中的生成晶格平移群的不可约表示的波函数必然有上面的性质,换句话说,满足布洛赫定理是\(\psi(\vec{r})\)满足周期势场薛定谔方程且生成晶格平移群不可约表示的一个必要条件,而非充分条件。

布洛赫定理还有一个等价的叙述(称为叙述2)如下:
周期势场中的生成晶格平移群的不可约表示的波函数必然有下面的形式

\[\psi_\vec{k}(\vec{r})=\exp(i\vec{k}\cdot\vec{r})u_\vec{k}(\vec{r}) \]

其中\(u_\vec{k}(\vec{r})\)是晶格的周期函数。

把叙述2代入叙述1,两边相等,所以1$\Rightarrow\(2,把叙述2中的\)\vec{r}\rightarrow\vec{r}+\vec{t}\(利用\)u_\vec{k}(\vec{r})\(的周期性可得1,所以2\)\Rightarrow$1.

因为布洛赫定理只是必要条件,所以叙述2中的\(u_\vec{k}(\vec{r})\)并非任意函数。把叙述2代入薛定谔方程,可得\(u_\vec{k}(\vec{r})\)满足的微分方程,对于每一个固定\(\vec{k}\),微分方程有一组解,不妨编号为\(n\)。也就是说,能量\(E\)和波函数\(\psi(\vec{r})\)应该有两个下标编号,分别是\(E_n(\vec{k})\)\(\psi_{\vec{k},n}(\vec{r})\).

总结一下,在哈密顿的某个简并子空间中,生成了空间群的一个不可约表示,把它按照晶格平移群约化成对角阵,则每个对称化基函数生成晶格平移群的一个一维不可约表示(每个不可约表示都用不同的\(\vec{k}\)标记),而所有的对称化基函数都是属于一个简并子空间中的,对应于一个能级\(E\)

\(\ast\)因为在晶体的电子碰撞过程中,\(\hbar\vec{k}\)扮演着动量的角色,所以也把\(\vec{k}\)称为波矢量。

至此,并不知道一个能级中,有多少个不同\(\vec{k}\)\(\psi_\vec{k}(\vec{r})\),也不知道对应于同一\(\vec{k}\)是不是有多个\(\psi_\vec{k}(\vec{r})\),更不知道它们到底属于哪几个能级。

布里渊区

已经知道,每个\(\vec{k}\)值对应的\(\psi_\vec{k}(\vec{r})\)提供晶格平移群的一个不可约表示,但是不可约表示的个数等于晶格平移群的阶\(N=N_1N_2N_3\),是有限的,而\(\vec{k}\)的数量是无穷个。仔细观察即可发现,相差一个倒格矢\(\vec{G}\)的两个\(\vec{k}\)给出的不可约表示是相同的,因为\(\vec{G}\cdot\vec{t}=2\pi M\),所以可以把\(\vec{k}\)限制在倒空间的一个原胞内,这样就避免了重复。可以选择倒空间中由\(\vec{b}_i\)划分出的原胞,也可以选择倒空间中的魏格纳-塞兹(Wigner-Seitz,W-S)原胞。这样,\(\vec{k}\)就有\(N_1N_2N_3\)种取值,数量和晶格平移群阶相同,每个\(\vec{k}\)给出不同的不可约表示

选取W-S原胞的优点是:倒空间中的W-S原胞具有晶格点群对称性布里渊区就是倒空间的W-S原胞

需要注意的是,如果\(\vec{k}\)的端点取在布里渊区的边界上,则至少存在另一个端点也位于布里渊区边界上的矢量\(\vec{k}\'\)\(\vec{k}\)相差倒格矢\(\vec{G}\),使用同一个\(\vec{k}\)表示就可以了。

空间群的不可约表示

设晶格点群元素\(A\in G\),空间群\(S\)的元素形式为\(\{A|\vec{\tau}\}\),对应的算符为\(D(A|\vec{\tau})\),而晶格平移群为其子群。对于纯的平移元素\(\{E|\vec{t}\}\),因为晶格平移群只有一维不可约表示,所以\(D(E|\vec{t})\)必然可以约化成完全对角形式。换句话说,给定任一个群\(S\)的表示,总存在一个等价表示,在此等价表示中,\(D(E|\vec{t})\)是对角的。

另一方面,晶格平移群的全体不可约表示是\(\exp(i\vec{k}\cdot\vec{t})\)形式的,所以可以进一步假设空间群的某\(n\)维不可约表示的对角元出现了\(q\)个不同的\(\exp(i\vec{k}_j\cdot\vec{t}),j=1,2,\cdots,q\),每个\(\vec{k}_k\)不一定只出现一次。可以把相同的对角元集中起来,把这个\(n\)维不可约表示写成

\[D(E|\vec{t})=\begin{pmatrix} \exp(i\vec{k}_1\cdot \vec{t})&&&\\ &\exp(i\vec{k}_2\cdot \vec{t})&&\\ &&\cdots&\\ &&&\exp(i\vec{k}_q\cdot \vec{t}) \end{pmatrix}\]

可以计算得到下面关系

\[\{A|\vec{\tau}\}^{-1}\{E|\vec{t}\}\{A|\vec{\tau}\}=\{E|A^{-1}\vec{t}\} \]

由这个关系可以得到

\[D^{-1}(A|\vec{\tau})D(E|\vec{t})D(A|\vec{\tau})=D(E|A^{-1}\vec{t}) \]

下面要计算矩阵\(D(E|A^{-1}\vec{t})\)是什么。只需要把上面矩阵中的\(\vec{t}\)换做\(A^{-1}\vec{t}\)即可。进一步,把对角元\(\exp()\)里面的也可以化简,利用等式\(\vec{k}\cdot A^{-1}\vec{t}=A\vec{k}\cdot\vec{t}\),从而得到

\[D(E|A^{-1}\vec{t})=\begin{pmatrix} \exp(iA\vec{k}_1\cdot \vec{t})&&&\\ &\exp(iA\vec{k}_2\cdot \vec{t})&&\\ &&\cdots&\\ &&&\exp(iA\vec{k}_q\cdot \vec{t}) \end{pmatrix}\]

注意观察上面两个大矩阵,它们是对角阵,且通过相似变换联系,所以它们的区别仅仅在于对角元顺序的调整。这是可以证明的。

证明:设\(A,B\)是对角阵,\(S\)是幺正矩阵,若有\(S^{-1}AS=B\)则有$$A_{ii}S_{ik}=S_{ik}B_{kk}$$对于任意\(i,k\)成立。对固定的\(i\)如果没有任何一个\(B_{kk}\)\(A_{ii}\)相等,则必有\(S_{ik}=0\)对任意\(k\)成立,也就是说幺正矩阵的某一行全零,这是不可能的。所以对于\(A\)中的任意对角元,\(B\)中必最少有一个对角元与之相等。同理可以得出,对于\(B\)中的任意一个对角元,\(A\)中也必然至少存在一个对角元与之相等。这样的话,\(A,B\)中的对角元的种类是相同的,各种类的数目未知。但是因为\(A,B\)的迹相等,而不同种类的对角元是线性独立的,所以每个种类对角元的数量也对应相等。

于是,对于任意\(A\in G\)如果\(D(E|\vec{t})\)中出现了\(d\)\(\exp(i\vec{k}_1\cdot\vec{t})\),那么在\(D(E|A^{-1}\vec{t})\)中必然出现\(d\)\(\exp(iA\vec{k}_1\cdot\vec{t})\),进一步导致\(D(E,\vec{t})\)中出现\(d\)\(\exp(iA\vec{k}_1\cdot\vec{t})\),这个论述对任意\(A\in G\)都成立。所以得出结论:只要\(D(E|\vec{t})\)中出现了\(d\)\(\exp(i\vec{k}_1\cdot\vec{t})\),则必然还出现其他\(d\)\(\exp(iA\vec{k}_i\cdot\vec{t}),\forall A\in G\).

进一步可以证明如果任意\(A\in G\)\(\vec{k}\'\)都不等于\(A\vec{k}_1\)则对角元中不会出现\(\exp(i\vec{k}\'\cdot\vec{t})\).

证明:把\(D(E|\vec{t})\)写成下面分块形式

\[D(E|\vec{t})=\begin{pmatrix} \exp(iA\vec{k}_1\cdot\vec{t})&O\\ O&\exp(i\vec{k}\'\cdot\vec{t}) \end{pmatrix}\]

左上角是诸\(\exp(iA\vec{k}_1\cdot\vec{t}),\forall A\in G\),右下角是其它不能写成这种形式的对角元。并设

\[D(A|\vec{\tau})=\begin{pmatrix} D\'(A|\vec{\tau})&X\\ Y&D\'\'(A|\vec{\tau}) \end{pmatrix}\]

按照同样的格式分块。由于$$D(A|\vec{\tau})D(E|A^{-1}\vec{t})=D(E|\vec{t})D(A|\vec{\tau})$$从而\(X=0,Y=0\),这样,表示\(D(A|\vec{\tau})\)可约,与前面假设矛盾。
综上,表示\(D(E|\vec{t})\)中只含有\(\exp(iA\vec{k}_1\cdot\vec{t}),\forall A\in G\)这种形式的对角元,且每个\(\vec{k}_i\)都出现\(d\)次,\(i=1,\cdots,q\)。而不可约表示的维数\(n=qd\).

对于给定的波矢量\(\vec{k}_1\),将\(\{A\vec{k}_1|A\in G\}\)中的不重复者组成集合\(\{\vec{k}_1,\cdots,\vec{k}_q\}=\{E\vec{k}_1,A_2\vec{k}_1,\cdots,A_q\vec{k}_1\}\)称为波矢量\(\vec{k}_1\)的星\(A_1,\cdots,A_q\)挑选出来\(q\)个点群元素。给定波矢量\(\vec{k}_1\)还可以定义波矢量的群\(K\),此群是晶格点群中,所有使得\(\vec{k}_1\)不变的操作的集合,显然构成一个群。

\(D(E|\vec{t})\)为晶格平移操作,所以就\(D(E|\vec{t})\)而言,布洛赫函数\(\psi_\vec{k}(\vec{r})\)可以作为其基,\(\psi_\vec{k}(\vec{r})\)对应的对角元是\(\exp(i\vec{k}\cdot\vec{r})\).设有\(d\)个正交的布洛赫函数\(\psi_{1j}\)都与波矢量\(\vec{k}\)对应,\(j=1,\cdots,d\),则可以根据这\(d\)个布洛赫函数构建出\(n\)个函数

\[\psi_{ij}=\hat{D}(A_i|\vec{\delta}_i)\psi_{1j} \]

其中\(A_i\)是挑选出来的\(q\)个点群元素,\(\vec{\delta}_i\)是其最小特征平移矢量。可以证明这\(n\)个函数就是空间群\(n\)维不可约表示\(D(A|\vec{\tau})\)的基函数。

证明:依据布洛赫定理,$$\psi_{1j}=\exp(i\vec{k}\cdot\vec{r})u^{(j)}_\vec{k}(\vec{r})$$其中\(u^{(j)}_\vec{k}(\vec{r})\)是晶格的周期函数。用\(\{A_i|\vec{\delta}_i\}\)作用之,得到

\[\begin{align} \psi_{ij}(\vec{r})&=D(A_i|\vec{\delta}_i)[\exp(i\vec{k}\cdot\vec{r})u^{(j)}_\vec{k}(\vec{r})]\\ &=\exp(i\vec{k}\cdot A_i^{-1}\vec{r})\exp(i\vec{k}\cdot A_i^{-1}\vec{\delta}_i)u_\vec{k}^{(j)}(A_i^{-1}\vec{r}+A^{-1}_i\vec{\delta}_i)\end{align}\]

对于上式,作代换\(\vec{r}\rightarrow\vec{r}+\vec{t}\)得到

\[\psi_{ij}(\vec{r}+\vec{t})=\exp[i\vec{k}\cdot A_i^{-1}(\vec{r}+\vec{t})]\exp(i\vec{k}\cdot A_i^{-1}\vec{\delta}_i)u_\vec{k}^{(i)}[A_i^{-1}(\vec{r}+\vec{t})+A_i^{-1}\vec{\delta}_i] \]

因为\(A_i^{-1}\vec{t}\)也是晶格平移矢量,从而是\(u(\vec{r})\)的周期,所以上式可以进一步化简为

\[\psi_{ij}(\vec{r}+\vec{t})=\exp(i\vec{k}\cdot A_i^{-1}\vec{t})\psi_{ij}(\vec{r}) \]

因为\(\vec{k}\cdot A_i^{-1}\vec{t}=A_i\vec{k}\cdot\vec{t}\)所以上式变为

\[\psi_{ij}(\vec{r}+\vec{t})=\exp(iA_i\vec{k}\cdot\vec{t})\psi_{ij}(\vec{r}) \]

这正是布洛赫定理的形式,这表明\(\psi_{ij}(\vec{r})\)是波矢量为\(A_i\vec{k}\)的布洛赫函数。这里仅仅证明了\(\psi_{ij}(\vec{r})\)具有布洛赫定理的形式,理应再证明其确满足薛定谔方程。但是因为\(\{A_i,\vec{\delta}_i\}\)是空间群元素,而\(\psi_{1j}(\vec{r})\)满足薛定谔方程,故\(\psi_{ij}(\vec{r})\)应是同一本征子空间的波函数。
到此为止,一个表示空间对应一个本征子空间,诸\(\psi_{ij}(\vec{r})\)简并于一个能级,所以有\(E(A\vec{k})=E(\vec{k})\),等能面具有晶格点群对称性。

设空间群的一个\(n=qd\)维的不可约表示

\[D(A|\vec{\tau})=\begin{pmatrix} D_{11}&\cdots&D_{1q}\\ \cdots&&\cdots\\ D_{q1}&\cdots&D_{qq} \end{pmatrix}\]

其中每个块都是\(d\times d\)维的,基函数共\(qd\)个,前\(d\)个是对应于\(\vec{k}_1=\vec{k}\)的,往后面\(d\)个是对应于\(\vec{k}_2=A_2\vec{k}\)的,等等。把这种形式称为标准型。

标准型具有一个性质:每一行只有一个不为零的\(d\times d\)的块,如果有\(A\vec{k}_l=\vec{k}_m\)\(l,m=1,\cdots,q\)则第\(l\)行第\(m\)块不为零

\[D_{lj}(A,\vec{\tau})=D_{lm}(A,\vec{\tau})\delta_{jm} \]

而非零块\(D_{lm}(A|\vec{\tau})\)可以根据波矢量\(\vec{k}\)的群\(K\)的不可约表示得出。

得出方式:有两种情况,一种是空间群为同型群且\(\vec{k}\)取自布里渊区内部和边界或者空间群为非同型群且\(\vec{k}\)取自布里渊区内部,另一种情况是空间群为非同型群而\(\vec{k}\)取自布里渊区边界。第二种情况不考虑。对于第一种情况,考虑选取出来的空间群元素\(A_l,A_m\),构造空间群元素

\[\{B|\vec{\sigma}\}=\{A_m|\vec{\delta_m}\}^{-1}\{A|\vec{\tau}\}\{A_l|\vec{\delta}_l\} \]

则可证明\(B\)是波矢量群\(K\)中的一个元素。选取\(K\)群的一个\(d\)维不可约表示\(\Gamma\),则\(D_{lm}(A|\vec{\tau})=\exp(i\vec{k}\cdot\vec{\sigma})\Gamma(B)\).

所以称:每个波矢量\(\vec{k}\)的群\(K\)的每个不可约表示,生成空间群的一个不可约表示

为求得所有\(d\times d\)小块,让\(l,m\)遍历。这只求出空间群特定元素\(\{A|\vec{\tau}\}\)的不可约表示矩阵,在此基础上,让\(\{A|\vec{\tau}\}\)遍历空间群,求出所有元素的表示矩阵。除此以外,如果选取群\(K\)的另一个\(d\'\)维表示矩阵\(\Gamma\'\),则生成空间群的另一个不可约表示。再高一层,让\(\vec{k}\)遍历布里渊区,则得到空间群所有不可约表示。但让\(\vec{k}\)遍历布里渊区的时候要注意,可能对于两个\(\vec{k}\)得出的不可约表示是等价的,因为它们俩通过晶格点群某元素\(A\)相互变换。

当矢量\(\vec{k}\)的端点在布里渊区内准连续变化时,空间群不可约表示的表示空间也在准连续地变动,其\(n=qd\)个基函数(布洛赫函数)也在准连续地变动,它们属于的能级也在准连续地变动,所以能量\(E\)\(\vec{k}\)变化而变化,称之为能带。

注意,能带有多条。让\(\vec{k}\)准连续变动这同一过程进行两次,第一次选取的群\(K\)的不可约表示是\(d\)维的,第二次选取的是\(d\'\)维的,则这个空间群的两个表示空间是不同的,从而属于不同的本征子空间,能量不同,于是就有两个能带。

这里还有一个问题,群\(K\)的不可约表示个数是有限的,是不是意味着能带数量一定有限?不是的。能带数量可以无穷多,因为对于同一个\(\vec{k}\),选群\(K\)的同一个不可约表示,这时虽然表示矩阵相同,但是可以独立地找出来两组互相正交的基函数(两个不相交的表示空间),每一组基函数都能生成这个表示矩阵。这样对于同一个\(\vec{k}\),也会有能量不同的\(\psi_\vec{k}(\vec{r})\),也就是说,能量\(E\)\(\vec{k}\)的多值函数,记为\(E_n(\vec{k})\),对于此多值函数的每一支,\(E\)都随\(\vec{k}\)准连续变化,形成一个能带。

相关文章