微分几何简介及其在广义相对论中的应用
一、集合论、拓扑空间与微分流形
1. 集合论简介
集合论是数学最基本的理论之一。它包含的主要思想有,确定地指定了的若干事物的全体叫一个集合(set),集合中的每一件事物叫一个元素(elements)或点(point)。可以用数学的语言将上述话转述为,若\(x\)是集合\(X\)的元素,则记为\(x\in X\),自然若\(x\)不是集合\(X\)的元素,则记为\(x\not\in X\)。根据ZFC公理体系的提法,我们自然还可以构造一个不含任何元 素的集合,叫做空集(empty set),记作\(\emptyset\)。我们指出,四维时空,即我们生活的世界、我们一切活动的舞台,是一堆时空点的集合,因此讨论集合对我们讨论四维时空的理论是十分有用的。在这里我们不加证明的列举集合论的一些基本概念与定理如下
定义1.1.1 若集合\(A\)的每一个元素都属于集合\(X\),则称\(A\)为\(X\)的子集(subset),记作\(A\subset X\),并规定\(\emptyset\subset X,\ \forall X\)。自然可以根据这个定义集合的相等,\(A=X\)当且仅当\(A\subset X\)且\(X\subset A\)。自然还可以定义所谓的真子集(proper subset),若\(A\subset X\)且\(A\neq X\),则称\(A\)为\(X\)的真子集,记为\(A\subsetneqq X\)。
定义1.1.2 并集(union)\(A\cup B:=\{x|x\in A或x\in B\}\);交集(intersection)\(A\cap B:=\{x|x\in A且x\in B\}\);差集(difference)\(A-B:=\{x|x\in A且x\not\in B\}\);若考虑的最大集合\(X\),则任何集合\(A\)都应该是\(X\)的子集,且\(A\)的补集(complement)定义为\(-A:=X-A\)。
自然地,我们可以利用上述定义直接证明如下定理
定理1.1.1 集合之间的运算应该满足如下的运算定律
我们在四维时空中为了具体的讨论某一个问题,都希望能将事件(event)的时空坐标确定下来,为了具体将坐标这件事情确定下来,我们必须将我们要研究的时空用一组有序实数标记具体的时空点。换句话说,我们要用几个实数集合\(\mathbb R\)构造出一个坐标系来,这就是构造卡氏积(Cartesian product)的基本动机。
定义1.1.3 非空集合\(X,\ Y\)的卡氏积\(X\times Y\)为
有限个非空集合\(X,\ Y,\ Z\)的卡氏积\(X\times Y\times Z\)自然也可以定义为
显然,它是满足结合律的,即\(X\times(Y\times Z)\equiv(X\times Y)\times Z\)。
我们自然可以作\(n\)个实数集\(\mathbb R\)的卡氏积,记为
可见\(\forall x\in\mathbb R^n\),都可以用一组有序实数\((x^1,\ x^2,\cdots,\ x^n)\)来标记,这就是元素\(x\)的自然坐标。阐述完自然坐标的概念,我们自然可以对考虑在\(\mathbb R\)的各个元素之间定义所谓的距离。
定义1.1.4 \(\mathbb R^n\)中的任意两个元素\(x=(x^1,\ x^2,\cdots,\ x^n),\ y=(y^1,\ y^2,\cdots,\ y^n)\)之间的距离定义为\(|x-y|:=\sqrt{\begin{aligned}\sum_{i=1}^n\end{aligned}(x^i-y^i)^2}\)。
这些定义都是如此的自然,下面我们还要考虑一个问题,我们该如何描述任意时空点的坐标?为了回答这个问题,我们自然要选择一个时空中的一个参考点,首先将这个这个参考点的坐标标定出来,为此我们要选取\(\mathbb R^n\)中一个特殊的元素将其与这个参考点认同起来,不失一般性,我们可以将这个元素选取成\((0,0,\cdots,0)\)。这个想法启发着我们构造一种涉及到两个不同集合之间的认同操作,这就是构造映射(map)的基本动机。
定义1.1.5 对于两个非空集合\(X,\ Y\),定义一个从\(X\)到\(Y\)的映射\(f:X\rightarrow Y\)是一个法则,它为\(X\)中的每一个元素\(x\)都指定了\(Y\)中的某一个元素\(y\)与之对应,进一步地可以写成\(y=f(x)\)。称\(y\)为\(x\)在映射\(f\)下的像(image),称\(x\)为\(y\)的原像(或逆像(inverse image))。称\(X\)为映射\(f\)的定义域(domain),\(X\)的全体元素在映射\(f\)下的集合记作\(f[X]\),称为映射\(f\)的值域(range)。自然有映射之间的相等定义为,映射\(f:X\rightarrow Y\)与映射\(f^\prime:X\rightarrow Y\)称为相等的,若\(f(x)\equiv f^\prime(x),\ \forall x\in X\)。
利用映射,我们就可以将时空中的某个点与\(\mathbb R^n\)中的某一个却元素联系起来,再利用\(\mathbb R^n\)中的元素本身有所谓的自然坐标,并将其认同为时空中该点的坐标。这样,我们就得到了一个可以在时空中确定时空点的坐标的方法。如果我们不对映射本身做任何限制,那么自然可以构造出无数种完全不同的坐标,但是这其中有很大一部分都是无用的,下面我们将讨论如何对映射提出更高的限制,以便我们筛选出真正有用的坐标来。在讨论映射的限制之前,我们有必要阐述一下一些有用的特殊映射。
定义1.1.6 映射\(f:X\rightarrow Y\)称为一一的(one-to-one),若任一\(y\in Y\)都有着不多于一个逆像(可以没有);映射\(f:X\rightarrow Y\)称为到上的(onto),若任一\(y\in Y\)都有逆像(并不要求唯一);若映射\(f:X\rightarrow Y\)即是一一的又是到上的,那么映射被称为双射(bijection);恒等映射\(f:X\rightarrow X\),若\(x=f(x),\ \forall x\in X\);若存在两个映射\(f:X\rightarrow Y,\ g:Y\rightarrow Z\),则称映射\(h:X\rightarrow Z\)为\(g,\ f\)的符合映射,其满足\(h(x)\equiv g(f(x)),\ \forall x\in X\),记作\(h=f\circ g\);常值映射(单点映射)\(f:X\rightarrow Y\),当且仅当\(f(x)\equiv f(x^\prime),\ \forall x,x^\prime\in X\)。
上述定义自然给出一些关于映射的一些结论,如:①映射\(f:X\rightarrow Y\)是到上的当且仅当\(f[X]=Y\);②映射\(f:X\rightarrow Y\)是一一的,则存在逆映射\(f^{-1}:f[X]\rightarrow X\),定义为\(f^{-1}(f(x))=x,\ \forall x\in X\),即逆映射是利用恒等映射来进行定义的。然而无论是否逆映射\(f^{-1}\)是否存在,我们都可以利用这个思想来定义任意子集\(B\subset Y\)在映射\(f:X\rightarrow Y\)的逆像\(f^{-1}[B]:=\{x|x\in X且f(x)\in B\}\subset X\)。
这就是集合论的基本内容。可以看见,为了研究时空本身的性质,我们需要将时空视作一个集合(后面我们将看到,它进一步的是一个微分流形)。又由于选定坐标的需要,我们需要构造一个具有自然坐标的集合\(\mathbb R^n\),并利用映射这个工具将时空与具有自然坐标的集合\(\mathbb R^n\)建立起联系,从而赋予时空点以坐标。但这个坐标确是存在任意性的,而且也并不是所有的坐标都是有意义的,为此我们要对映射做一些适当的限制,从而帮我们选出想要的映射并利用这个映射构造出合适的坐标。
2. 拓扑空间与映射的连续性(同胚映射)
利用分析学中构建的函数也是映射,最简单的一元实变函数正是这样一个映射\(f:\mathbb{R\rightarrow R}\)。分析学中,我们自然能够研究这个函数是否连续、是否可导等,那么自然地,我们也想问一般的映射能不能也有这些性质,以便我们去分析它的一些性质。首先考虑的便是映射的连续性,回想分析学中构造的\(\epsilon-\delta\)定义的连续性,首先我们需要一个开邻域,还要有距离的概念,在一般的集合中却没有这些概念的定义,为此我们需要引入一些在集合上额外的结构来完善我们的论证。由于\(\epsilon-\delta\)定义中强调的是一个任意大的开邻域之间的对应,实际上对距离的要求没有想象中的那么高,那么我们可以先不去定义距离(事实上定义了距离的话将是所谓的度规空间),而首先考虑开子集如何定义,事实上,这就是构造拓扑空间的动机。
回想分析学中给出的开集的性质,我们若要定义广义的开集,自然希望它能继承来源于分析学中开集的性质,那么可以做出如下定义
定义1.2.1 非空集合\(X\)的一个拓扑(topology)\(\mathscr T\)是\(X\)若干子集的集合,满足:
(a) \(X,\ \emptyset\in\mathscr T\);
(b) 若\(O_i\in\mathscr T,\ i=1,2,\cdots,n\),则有\(\begin{aligned}\bigcap_{i=1}^n\end{aligned}O_i\in\mathscr T\);
(c) 若\(O_\alpha\in\mathscr T,\ \forall\alpha\),则\(\begin{aligned}\bigcup_\alpha^{\ }\end{aligned}O_\alpha\in\mathscr T\)。
上述定义中的性质也正是分析学中的开集的性质,则自然亦有如下定义
定义1.2.2 指定了拓扑的集合\(X\)称为拓扑空间(topological space),拓扑空间\(X\)的子集\(O\)称为开子集(简称开集),若\(O\in\mathscr T\)。
定义了开集后我们终于可以对前面我们要讨论的映射下一个比较强的限制了,我们指出,这个限制给出了映射的连续性:
定义1.2.3 设\((X,\ \mathscr T)\)到\((Y,\ \mathscr S)\)为拓扑空间。映射\(f:X\rightarrow Y\)称为连续的(continuous),若\(f^{-1}[O]\in\mathscr T,\ \forall O\in\mathscr S\)。
上述定义给出了一个连续映射的定义,通过这个定义我们终于可以利用映射这个工具尝试给出时空上坐标的一个条件,那就是我们希望坐标是时空连续的。这个要求非常符合我们的直观感觉,我们从未见过跃变的时空,因此我们自然希望也希望坐标在时空各个部分都能是连续的。能做到这一点首先因为\(\mathbb R^n\)本身就是拓扑空间(其上定义的开集与分析学中定义的一致),那么我们只需要时空能够构造出合适的拓扑结构即可。除此之外,我们还希望能讨论时空的一些解析的性质,而为了研究的限制,我们自然还需要讨论一些额外地结构。第一个问题就是作为无限延展的时空,其与\(\mathbb R^n\)根据连续统假设必然能构造双射,我们要讨论的问题就是当有着双射的限制,两个拓扑空间之间是否有着怎样的关系,以及为时空赋予坐标的映射应不应该是双射。
定义1.2.4 设\((X,\ \mathscr T)\)到\((Y,\ \mathscr S)\)称为互相同胚的(homeomorphic),若存在映射\(f:X\rightarrow Y\)满足:(a)\(f\)是双射;(b)\(f\)与\(f^{-1}\)都连续。这样的\(f\)称为\((X,\ \mathscr T)\)到\((Y,\ \mathscr S)\)的同胚映射,简称同胚(homeomorphism)。
同胚是建立在连续性基础上的双射,那这对我们为时空赋予坐标这件事有什么帮助呢。回到我们最开始的出发点,我们希望能够分析时空的解析性质,最简单的办法就是能在时空中应用我们已经有的分析学中的技术。事实上,分析学本身就是在对经典物理世界性质的讨论中建立起来的一种抽象工具,既然如此,我们自然希望它能够继续应用在我们想要建立起来的描述时空几何结构中去。基于这个出发点,我们自然希望时空有着一些很好的性质,最简单地便是至少在某一时空点附近的时空能回归分析学研究的对象\(\mathbb R^n\)。但我们还未定义邻域的概念,很难描述什么叫做时空点的“附近”。但是“回归分析学研究的对象\(\mathbb R^n\)”这一点却告诉我们,在这个所谓的“时空点附近的时空”(这是时空的一个子集),我们希望它与\(\mathbb R^n\)的某个子集(需要在这两个子集子集上定义所谓的诱导拓扑以将这两个子集都构造成为拓扑空间)的性质基本是一致的。这就是同胚的意义,它告诉了我们两个拓扑空间是否是一致的,基于此我们希望同胚成为为时空赋予坐标这个操作的一个基本要求。现在我们来完善一下这段话中所需要的一些概念。
定义1.2.5 设\((X,\ \mathscr T)\)时拓扑空间,\(A\)为\(X\)的任意非空子集,定义\(A\)上的诱导拓扑(induced topology)
那么,\((A,\ \mathscr S)\)称为\((X,\ \mathscr T)\)的拓扑子空间(topological subspace)。
定义1.2.6 \(N\subset X\)称为\(x\in X\)的一个邻域(neighborhood),若\(\exists O\in\mathscr T\)使\(x\in O\subset N\)。若邻域是开集,那么它被称为开邻域。
有了这些讨论,我们终于得到了时空上至少是连续的坐标系的构建方法,但对一个好的坐标,我们自然不满足于仅仅是连续的。此外,还要强调的是,我们讨论的时空从整体上看应该和\(\mathbb R^n\)有很大的不同,尽管它们在某个局域内是同胚的(微分流形的定义可以让这个要求升格为微分同胚),否则我们直接就可以用\(\mathbb R^n\)来刻画时空,就像Newton力学所作的那样,但很显然它不符合实验规律,这才是我们发展一般的微分几何理论来阐述时空的动机。为了更进一步地讨论,我们下面将简要介绍一下微分流形的概念。
3. 微分流形简介
物理学的研究始终无法离开背景时空,但对背景时空的认识,现代物理学中采用的微分流形的方案是非常深刻的。微分流形作为\(n\)维坐标空间\(\mathbb R^n\)的一个推广而存在,下面我们首先给出它的明确定义。
定义1.3.1 拓扑空间\(M\)称为\(n\)维微分流形(n-dimensional differentiable manifold),简称\(n\)维流形,若\(M\)有开覆盖\({O_\alpha}\),即\(M=\begin{aligned}\bigcup_\alpha\end{aligned}O_\alpha\),满足(a)对每一\(O_\alpha\ \exists\)同胚\(\psi_\alpha:O_\alpha\rightarrow V_\alpha\)(\(V_\alpha\)是\(\mathbb R^n\)用通常拓扑(\(\mathbb R^n\)上自然定义的拓扑)衡量的开子集);(b)若\(O_\alpha\cap O_\beta\neq\emptyset\),那么复合映射\(\psi_\beta\circ\psi_\alpha^{-1}:\mathbb R^n\supset V_\alpha\rightarrow V_\beta\subset\mathbb R^n\)作为一个\(n\)个\(n\)元函数都是\(C^\infty\)(光滑)的。
下面我们来阐述一下微分流形这个定义对我们想要研究的对象提供了一个怎么样的性质。首先定义1.3.1中的(a)要求正是我们前面讨论的为时空赋予坐标的一个操作,而时空有了坐标,我们才能在上面利用已有的数学工具对时空的性质进一步地进行剖析,这是我们已经知道了的。只不过这里选定坐标的办法不再要求是整个拓扑空间必须以某种映射与整个\(\mathbb R^n\)同胚,而是分开成了许多有交叠的开集,且只要求它们能同胚于\(\mathbb R^n\)的某个开子集。这一点是符合常规的,因为我们总不能倾向于采用同一套坐标系,描述太阳上发生的事和地球上发生的事发生的毫不相关的事情,往往都会用不同的坐标系来分别描述它们,以方便我们的分析。但(b)要求却指出了我们这随意构造同胚应该满足的一个要求,那就是描述交叠区可以采用两套坐标,而这两套坐标之间的变换函数必须是\(C^\infty\)(光滑)的。提出这个要求后,我们才能肆无忌惮地通过变换坐标系的手段将我们研究的事物从时空的某个定义好坐标系的开子集延伸到定义了另外一个坐标系的开子集上去。为将坐标系的选定这一点明确下来,我们可以将这件事情确定为
定义1.3.2 坐标系\((O_\alpha,\ \psi_\alpha)\)在数学上又叫图(chart),满足定义1.3.1的全体图的集合\(\{(O_\alpha,\ \psi_\alpha)\}\)叫图册(atlas)。定义1.3.1中的条件(b)又叫做相容性(compatibility)条件。因此一个图册中的任意两个图都是相容的。
显然\(\mathbb R^n\)是天然就是一个可以用自身衡量微分流形,且仅需含一个图的图册就可以覆盖整个\(\mathbb R^n\),我们称这类仅需含一个图的图册就可以覆盖的微分流形为平凡(trivial)流形,显然四维Minkowski时空也是四维平凡流形。除此之外,我们的微分流形都是从拓扑空间上定义图册构造出来的,那么考虑两个在同一个拓扑空间上构造的图册记为\(\{(O_\alpha,\ \psi_\alpha)\}\)和\(\{(O_\beta^\prime,\ \psi_\beta^\prime)\}\),它们自然存在着两种可能:①这两个图册互不相容****,即\(\exists O_\alpha,\ O_\beta^\prime: O_\alpha\cap O_\beta^\prime\neq\emptyset\),但它们不满足定义1.3.1中的相容性条件(b),很显然,这是两个完全不同的微分流形,图册在这里就代表了不同的微分结构;②这两个图册是相容的,很显然,我们可以直接取这两个图册的并集构造一个全新的图册,这本质上并没有改变什么实质的东西,即这两个图册代表的微分结构完全一致,为方便起见,我们可以将所有相容的图册放在一起构造出最大的图册,以后我们研究的对象都默认为这个构造出来的最大的图册**。
微分流形上除了具有来自拓扑空间的拓扑结构还有额外定义的微分结构,因此两个流形之间的映射除了可以考虑连续性还可以谈论可微性,这件事情本质上是借助微积分中对函数的连续与可微性质来进行分类的。
定义1.3.3 \(f:M\rightarrow M^\prime\)称为\(C^r\)类映射,如果\(\forall p\in M\),映射\(\psi_\beta^\prime\circ f\circ\psi_\alpha^{-1}\)代表的\(n^\prime\)个\(n\)元函数都是\(C^r\)(\(r\)次可导)类的。流形\(M\)与\(M^\prime\)称为互相微分同胚(diffeomorphic to each other),若\(\exists f:M\rightarrow M^\prime\),满足(a)\(f\)是双射;(b)\(f\)以及\(f^{-1}\)是\(C^\infty\)的,这样的\(f\)被称为从\(M\)到\(M^\prime\)的微分同胚映射,简称微分同胚。
流形上自然还能定义函数,这是物理上的必然要求,例如我们考虑时空中的物质场分布,那么用函数来对其进行刻画是最好不过的了。
定义1.3.3 \(f:M\rightarrow\mathbb R\)称为\(M\)上的函数(function on \(M\))或\(M\)上的标量场(scalar field on \(M\))。若\(f\)为\(C^\infty\)的,则称为\(M\)上的光滑函数。\(M\)上全体光滑函数的集合记为\(\mathscr F_M\),也可以简单记为\(\mathscr F\),物理上讨论的函数一般都是指光滑函数。
微分流形还有很多有趣的东西,但是从物理的角度上讲,这是为了将我们的要研究的背景时空抽象出来并赋予其诸多优良的性质而构造出来的一个数学模型,下面我们将讨论如何将我们已有的数学工具应用到这个数学模型上,以便进一步剖析时空的性质。
二、流形上的张量分析
1. 切矢(场)与余矢(场)
既然我们要研究对流形进行分析,而流形的维数早已经在流形定义之初就已经给出了,那么最简单的就是在上面定义矢量空间这个概念。
定义2.1.1 实数域上的一个矢量空间(vector space)是一个集合\(V\),并在这个集合上定义两个映射,即\(V\times V\rightarrow V\)(加法(addition))以及\(\mathbb R\times V\rightarrow V\)(数乘(scalar multiplication)),它们满足以下条件
- (a) \(v_1+v_2=v_2+v_1,\ \forall v_1,\ v_2\in V\);
- (b) \((v_1+v_2)+v_3=v_1+(v_2+v_3),\ \forall v_1,\ v_2,\ v_3\in V\);
- (c) \(\exists\ 零元\ \underline{0}\in V:\underline{0}+v=v,\ \forall v\in V\);
- (d) \(\alpha_1(\alpha_2v)=(\alpha_1\alpha_2)v,\ \forall v\in V,\ \alpha_1,\ \alpha_2\in\mathbb R\);
- (e) \((\alpha_1+\alpha_2)v=\alpha_1v+\alpha_2v,\ \forall v\in V,\ \alpha_1,\ \alpha_2\in\mathbb R\);
- (f) \(\alpha(v_1+v_2)=\alpha v_1+\alpha v_2,\ \forall v_1,\ v_2\in V,\ \alpha\in\mathbb R\);
- (g) \(1\cdot v=v,\ 0\cdot v=0,\ \forall v\in V\)。
我们现在要做的事便是在流形上构造出某个矢量场来,这件事情是自然的,例如我们考虑最简单的时空中的电场分布,众所周知,电场是一个矢量场,且它分布在时空之中,因此描述这类物理模型自然驱动着我们取构造所谓的流形上的矢量场。我们现在已经有了流形上函数的定义,而函数正是所谓的标量场,最经典的标量场自然是电磁学中经常用的电势,而电场作为电势的梯度而存在,梯度的定义比较复杂,但是与之联系的还有所谓的方向导数的概念,我们现在要讨论的就是如何利用方向导数这个再分析学中的概念,将其抽象称为一般流形上的矢量。
定义2.1.2 映射\(v:\mathscr F_M\rightarrow\mathbb R\)称为点\(p\in M\)的一个矢量(vector),若\(\forall f,\ g\in\mathscr F_M,\ \alpha,\ \beta\in\mathbb R\)有
- (a) 线性性:\(v(\alpha f+\beta g)=\alpha v(f)+\beta g(g)\);
- (b) Leibnitz律:\(v(fg)=f\left|_g\right.v(g)+g\left|_p\right.v(f)\),其中\(f\left|_p\right.\)代表函数\(f\)在\(p\)点的值,或记作\(f(g)\)。
容易证明,这样定义的矢量满足如下定理,而这个定理说明了我们构造的矢量的确构成一个矢量空间。
定理2.1.1 以\(V_p\)代表\(M\)中\(p\)点所有矢量的集合,则\(V_p\)是\(n\)维矢量空间(\(n\)是\(M\)的维数),即\(\dim V_p=\dim M\equiv n\)。
回到定义2.1.2上,我们注意到这里定义的矢量与我们在分析学讨论过的方向导数是完全一致的,或者说,我们是将分析学中的方向导数拥有的性质自然地抽象出来,并用它的性质定义了流形上的矢量。定义了矢量,我们自然想知道它的分量,而写出矢量的分量又必须回到具体的坐标系下进行操作,而我们在定义微分流形的时候,已经完成了找寻坐标系的一系列步骤,现在我们仅需要利用这个已经定义好的坐标系将矢量的分量表达出来即可。
定义2.1.3 \(X_\mu\)是\(M\)中\(p\)点的一个矢量,其满足
其中\((O_\alpha,\ \psi_\alpha)\)为\(M\)上包含\(p\)点的坐标系,即\(p\in O_\alpha\subset M\)。因此,\(F=f\circ\psi_\alpha^{-1}\)自然构成了一个\(\mathbb R^n\rightarrow\mathbb R\)的多元函数,\(x^\mu\)自然是第\(\mu\)个坐标。
事实上定理2.1.1的证明需要用到定义2.1.3的一些性质,例如\(\{\left.X_\mu\right|\mu=1,2\cdots,n\}\)是线性无关的,以及\(v=v^\mu X_\mu,\ \forall v\in V_p\)。这些证明都是很容易的,这里不再赘述,但是利用这样一个定义,我们自然就有了矢量按分量展开的办法,先做这样一个定义
定义2.1.4 用坐标系\((O_\alpha,\ \psi_\alpha)\)刻画的任一点\(p\)的\(\{X_1,\ X_2,\cdots,\ X_n\}\)称为\(V_p\)的一个坐标基底(coordinate basis),每个\(X_\mu\)称为一个坐标基矢(coordinate basis vector),\(v\in V_p\)用\(\{X_\mu\}\)线性展开出来的系数\(v^\mu\)被称为\(v\)的坐标分量(coordinate components)。注意,\(v=v^\mu X_\mu\),这里利用了Einstein指标求和约定,即相同上下指标出现表示对此指标求和,并省略求和号\(\begin{aligned}\sum_\mu\end{aligned}\)不写。
利用微分流形上的图都是相容的,并利用坐标基矢定义中利用的偏导数存在的链式法则,我们很容易得到如下定理,这个定理正是矢量分量的坐标变换规则,某些不谈微分几何的广义相对论书籍中也直接按照这个规则定义所谓的逆变矢量。
定理2.1.2 设\(\{x^\mu\}\)和\(\{x^{\prime\nu}\}\)为两个坐标系,其坐标域的交集非空,\(p\)为交集中的一点,\(v\in V_p\),\(\{v^\mu\}\)与\(\{v^{\prime\nu}\}\)是\(v\)在这两个坐标系的坐标分量,则
其中\(x^{\prime\nu}\)是两坐标系变换函数\(x^{\prime\nu}(x^\sigma)\)的简写。
值得指出的是,我们这里定义的矢量看起来是利用函数定义的,但实际上,我们考虑的偏导数却并不是流形上定义的函数自然拥有的,更一般地,是利用\(C^1\)曲线来定义流形上某点的矢量,而所谓的\(C^1\)曲线是指\(C:\mathbb R\rightarrow M\),显然对\(M\)上任一点\(p\)总能够造出这样的曲线,所谓的\(C^1\)则是指,通过坐标系,我们总能构造出\(n\)个一元函数,对这些函数的要求非常简单,即至少一阶可导。利用这类曲线,我们自然能定义出这样一个矢量。
定义2.1.5 设\(C(t)\)是流形\(M\)上的\(C^1\)曲线,则线上\(C(t_0)\)点的切于\(C(t)\)的切矢(tangent vector)\(T\)是\(C(t_0)\)点的矢量,其对\(f\in\mathscr F_M\)作用的定义为
这也是我们称其做切矢的直接来源。定义了矢量,我们自然可以考虑在流形\(M\)上任意一点都指定一个矢量,这样就构成了一个矢量场,物理上一般还对这个矢量场有着很高的要求,于是便有如下定义。
定义2.1.5 设\(A\)为\(M\)的子集,若给\(A\)中任意一点都指定一个矢量,这样就构成了一个定义在\(A\)上的矢量场。\(M\)上的矢量场\(v\)称为\(C^\infty\)类(光滑)的,若\(v\)作用于\(C^\infty\)类函数的结果仍是\(C^\infty\)类函数,即\(v(f)\in\mathscr F_M,\ \forall f\in\mathscr F_M\),我们讨论的矢量场均指光滑矢量场。
我们已经完成了流形上的(切)矢量空间以及(切)矢量场的讨论。但是考虑另外一件事情,线性代数中我们的确会构造出一种矢量,它被称为列矢量,那列矢量自然有与之对应的行矢量,只需要对列矢量进行一次简单的转置即可。回到流形上的矢量空间,我们自然也希望能对这里的矢量能构造出类似的结构来,我们指出,这就是所谓的对偶矢量。
定义2.1.6 设\(V\)是\(\mathbb R\)上的有限维矢量空间。线性映射\(\omega:V\rightarrow\mathbb R\)称为\(V\)上的对偶矢量(dual vector)。\(V\)上全体对偶矢量的集合称为\(V\)的对偶空间,记作\(V^*\)。
根据这个定义,可以很容易证明如下定理,注意利用我们在定义矢量空间所明确写出的性质。
定理2.1.3 \(V^*\)是矢量空间,且\(\dim V^*=\dim V\)。
可以利用\(V\)中的一组基\(\{e_\mu\}\)明确地定义出\(V^*\)中的一组基\(\{e^\nu\}\)。
定义2.1.7 设\(\{e_\mu\}\)是\(V\)中的一组基,则可以定义\(V^*\)中\(n\)个特别的元素:
其中\({\delta^\mu}_\nu\)为Kronecker符号,当且仅当\(\mu=\nu\)时为\(1\),其余为\(0\)。
自然有\(\omega=\omega_\mu e^{\mu*}\),其中\(\{e^\nu\}\)自然构成了\(V^*\)中的一组基,称之为对偶基底。一般地,我们在切矢空间取了坐标基底为\(X_\mu=\frac\partial{\partial x^\mu}\),相应的对偶空间坐标基底自然可以写为\(dx^\mu\)。类似于定理2.1.2,可以得到对偶矢量的分量变换如下。
定理2.1.4 设坐标系\(\{x^\mu\}\)与\(\{x^{\prime\nu}\}\)有交,则交域中的任意一点\(p\)的对偶矢量\(\omega\)在两坐标系中的分量\(\omega_\mu\)和\(\omega_\nu^\prime\)的变换关系为
有了对偶空间,我们自然能从另外一个角度来考察矢量空间的性质,例如,我们依旧可以取对偶空间的对偶空间,记为\(V^{**}\),不妨定义\(v^{**}(\omega):=\omega(v),\ \forall\omega\in V^*\),显然这构成了一个\(V\rightarrow V^{**}\)的同构映射,从而我们可以将\(V\)与\(V^*\)认同起来,即把它们认为是同一个矢量空间。我们这里的讨论是凭借矢量空间来构造的对偶矢量空间,实际上,考虑流形上\(C^\infty\)函数的性质,也能得到对偶矢量空间,被称为余矢量空间,不再赘述。对偶矢量场的定义类似于矢量场,不再重复,但是注意对\(f\in\mathscr F_M\),\(df\)自然能诱导出\(M\)中的一个对偶矢量场,这是分析学中的微分算符的一个推广,被称为外微分算符。有了矢量与对偶矢量,我们可以考虑多个矢量空间与多个对偶矢量空间的张量积以便构造张量。
2. 张量以及张量空间
定义2.2.1 矢量空间\(V\)上的一个\((k,l)\)型张量(tensor of type \((k,l)\))是一个多重线性映射
进一步地,可以定义\(V\)上\((k,l)\)与\((k^\prime,l^\prime)\)型张量\(T\)与\(T^\prime\)的张量积(tensor product)\(T\otimes T^\prime\)是一个\((k+k^\prime,l+l^\prime)\)型张量,定义为
根据这个定义的张量,我们自然有如下定理
定理2.2.1 \(\mathscr T_V(k,l)\)是矢量空间,且\(\dim\mathscr T_V(k,l)=n^{k+l}\),其中\(n\)为流形的维数。以及\(\{e_{\mu_1}\otimes\cdots\otimes e_{\mu_k}\otimes e^{\nu_1*}\otimes\cdots\otimes e^{\nu_k*}\}\)构成这个矢量空间的一组基底,若采用坐标基底,仅需将\(e_{\mu_i}\)替换成\(\left(\frac\partial{\partial x^{\mu_i}}\right)\),\(e^{\nu_i*}\)替换成\(dx^{\nu_i}\)即可。
仿照矢量空间与对偶矢量空间中的讨论,我们自然还有张量变换率如下。
定理2.2.2 \((k,l)\)型张量在两个坐标系中的分量的关系为
其中
由张量定义张量场与矢量场的定义完全类似,不再详细讨论。现在有了张量场,我们终于可以讨论定义在时空中最重要的结构——度规张量场了。
3. 度规结构
度规是一个定义在矢量空间上的重要结构,因为我们定义的矢量空间到目前为止都是无法度量的,在这样一个矢量空间谈论距离毫无意义,而度规的定义就是我们为这个矢量空间赋予真正意义的距离的概念,而对时空而言,我们自然希望能够去度量两个时空点的距离,因此我们要考虑流形上如何定义度规结构,首先定义矢量空间上的度规。
定义2.3.1 矢量空间\(V\)上的一个度规(metric)\(g\)是\(V\)上的一个对称、非退化的的\((0,2)\)型张量。对称是指\(g(u,v)=g(v,u),\ \forall u,v\in V\),非退化是指\(g(v,u)=0\ \forall u\in V\Rightarrow v=0\in V\)。
那么在流形上定义的度规场就是在流形上任一点都指定一个度规张量,并且满足它是\(C^\infty\)的。有了度规,我们自然能定义矢量的长度如下
定义2.3.2 \(v\in V\)的长度(length)或大小(magnitude)定义为\(|v|;=\sqrt{|g(v,v)|}\)。矢量\(u,v\in V\)称为互相正交的(orthogonal),若\(g(u,v)=0\)。\(V\)的基底\(\{e_\mu\}\)叫正交归一的(orthonormal),若任意两个基矢正交且对每一基矢\(e_\mu\)都满足\(g(e_\mu,e_\mu)=\pm1\)。自然有度规\(g\)在正交归一基底的分量满足
即度规在正交归一基底的分量排成的矩阵是对角的,且对角元为\(+1\)或者\(-1\)。惯性定理指出,对角元中为\(+1\)或者\(-1\)的数目与所选的正交归一基底无关。利用这一点,我们可以定义对角元全为\(+1\)的度规叫正定度规(positive definite metric)或者Rieman度规(Riemannian metric),对角元全为\(-1\)的度规叫负定度规(negative definite metric),其余均为不定度规(indefinite metric),只有一个对角元为\(-1\)的不定度规被称为Lorentz度规(Lorentzian metric)。对角元之和叫度规的号差(signature)。相对论中常用的度规为正定度规与Lorentz度规。
在流形上定义了度规场,那么我们可以衡量曲线的长度,一般地,我们研究的都是定义了Lorentz度规的一般时空,在这个时空自然由如下几种用线长分类的曲线如下。
定义2.3.3 设存在流形\(M\)的Lorentz度规场\(g\),则\(M\)上的类空(space-like)、类光(light-like or null)及类时曲线\(C(t)\)的线长定义为
定义元线长为
则线长又可以定义为
值得一提的是,在狭义相对论所涉及的Minkowski时空之中,\(ds^2\)是Lorentz不变量,而上面区分的三种曲线,也是根据质点运动规律来区分的,其中类时线是有质量粒子(massive particle)在时空中的运动轨迹,类光线是无质量粒子(massless particle)(如光子(photon))在时空中的运动轨迹,而没有粒子能够在时空中以类空线运动。现在我们能具体对时空下一个准确的定义了,具体如下。
定义2.3.4 设流形\(M\)给定度规场\(g\),则\((M,g)\)称为广义黎曼空间,我们感兴趣的广义黎曼空间主要分为两类:一类为度规正定,则被称为黎曼空间(Riemannian space),注意,负定度规和正定度规没有本质的区别;另外一类则是Lorentz度规,被称为伪黎曼空间(pseudo-Riemannian space),即物理上的时空。对时空\((M,g)\)还应该提这两个要求,一是\(M\)为连通流形,二是\(g\)为有足够可微程度的Lorentz度规场。
最简单的时空应该是\(n\)维Minkowski时空,它是在\(\mathbb R^n\)上直接定义对角化的Lorentz度规而构造出来的,狭义相对论涉及的对象只有\(n\)维Minkowski时空,且一般\(n=4\),数学表述如下。
定义2.3.5 设\(\{x^\mu\}\)是\(\mathbb R^n\)的自然坐标,在\(\mathbb R^n\)上定义度规张量场\(\eta\)为
其中
则称\((\mathbb R^n,\eta)\)为\(n\)维Minkowski时空,\(\eta\)称为Minkowski度规。
注意到,如果考虑\(g(v,\cdot),\ v\in V\),显然这是一个映射,它的作用是\(g(v,\cdot):V\rightarrow\mathbb R\),其满足\(g(v,\cdot)(u)=g(v,u),\ \forall u\in V\)。不妨定义一个对偶矢量\(\omega\in V^*\)满足\(\omega(u)\equiv g(v,u)\),则可以用\(\omega\)来代替\(g(v,\cdot)\)。可以说,我们可以利用度规构建一个映射\(V\rightarrow V^*\),其定义正是前面的操作,这就是常说的用度规对指标进行升降的操作,我们可以构造这个映射的逆映射,并将这个逆映射称为度规\(g\)的逆,那么这个逆度规对应着映射\(V^*\rightarrow V\)。
下面我们将介绍流形一个内禀的性质——曲率,有了这个曲率,我们将更进一步对时空的一般性质有更进一步的认识,并从此出发,构造Einstein的广义相对论的基本理论框架。
4. Riemann曲率张量
在Euclid空间以及Euclid几何中定义的分析学是非常有用的数学工具,尤其是分析学中的场论中,自然存在着导数算符\(\vec\nabla\),它作用于函数(标量场)\(f\)得到的是矢量场\(\vec\nabla f\)(梯度),作用于矢量场\(\vec v\)并求缩并得到标量场\(\vec\nabla\cdot v\)(散度)。由于Euclid空间上自然定义的度规\(\delta_{ab}\)使得此空间上定义的矢量与对偶矢量没有本质的区别,这就是我们为什么在研究分析学的时候并没有对这两种不同的矢量进行区分的根本原因。现在我们为了将\(\vec\nabla\)推广到任意流形,这两个不同的矢量区分就显得重要了起来。下面,我们首先给出(无挠)导数算符的定义,最后利用它得到所谓的Riemann曲率张量。
定义2.4.1 以\(\mathscr F_M(k,l)\)代表流形\(M\)上全体\(C^\infty\)的\((k,l)\)型张量场的集合(函数\(f\)可以看作\((0,0)\)型张量场(标量场),即\(\mathscr F_M(0,0)\equiv\mathscr F_M\))。映射\(\nabla:\mathscr F_M(k,l)\rightarrow\mathscr F_M(k,l+1)\)称为\(M\)上的(无挠)导数算符,若它满足以下条件
-
(a) 线性性:
\[\nabla_a(\alpha{T^{b_1\cdots b_k}}_{c_1\cdots c_l}+\beta{S^{b_1\cdots b_k}}_{c_1\cdots c_l})=\alpha\nabla_a{T^{b_1\cdots b_k}}_{c_1\cdots c_l}+\beta\nabla_a{S^{b_1\cdots b_k}}_{c_1\cdots c_l} \\ \forall\ {T^{b_1\cdots b_k}}_{c_1\cdots c_l},\ {S^{b_1\cdots b_k}}_{c_1\cdots c_l}\in\mathscr F_M(k,l),\quad\alpha,\beta\in\mathbb R \] -
(b) Leibnitz律:
\[\begin{aligned} \nabla_a({T^{b_1\cdots b_k}}_{c_1\cdots c_l}{S^{d_1\cdots d_{k^\prime}}}_{e_1\cdots e_{l^\prime}})={T^{b_1\cdots b_k}}_{c_1\cdots c_l}\nabla_a{S^{d_1\cdots d_{k^\prime}}}_{e_1\cdots e_{l^\prime}}\\ +{S^{d_1\cdots d_{k^\prime}}}_{e_1\cdots e_{l^\prime}}\nabla_a{T^{b_1\cdots b_k}}_{c_1\cdots c_l}\\ \forall\ {T^{b_1\cdots b_k}}_{c_1\cdots c_l}\in\mathscr F_M(k,l),\quad{S^{d_1\cdots d_{k^\prime}}}_{e_1\cdots e_{l^\prime}}\in\mathscr F_M(k^\prime,l^\prime) \end{aligned} \] -
(c) 与缩并可以交换顺序;
-
(d) \(v(f)=v^a\nabla_a f,\quad\forall f\in\mathscr F,\ v\in\mathscr F_M(1,0)\);
-
(e) 具有无挠性(torsion free):\(\nabla_a\nabla_b f=\nabla_b\nabla_a f,\ \forall f\in\mathscr F_M\)。
上述定义的导数算符有很多应用,也有很多性质,我们不在这里进行详细的介绍了,下面直接通过它来构造Riemann曲率张量,并简单列举Riemann曲率张量的性质,简述其对应的几何意义与物理意义。
定义2.4.2 导数算符\(\nabla_a\)的Riemann曲率张量场\({R_{abc}}^d\)由下式定义
Riemann曲率张量反映的是导数算符的非对易性质,我们指出,导数算符实际定义了流形上矢量沿曲线平移的概念。而其非对易,则告诉我们,从某点出发的矢量绕流形上某一闭合曲线回到原点后不能与原矢量重合,简单的理解就是,我们描述的流形是“弯曲的”。由导数算符的Leibnitz律出发还可以得到导数算符对易子对矢量场\(v^c\)的作用为\((\nabla_a\nabla_b-\nabla_b\nabla_a)v^c=-{R_{abd}}^cv^d\)。Riemann曲率张量还有如下性质:
定理2.4.1 Riemann曲率张量\({R_{abc}^d}\)满足
- (1) \({R_{abc}}^d=-{R_{bac}}^d\);
- (2) \({R_{[abc]}}^d=0\)(循环恒等式(cyclic identity));
- (3) \(\nabla_{[a}{R_{bc]d}}^e=0\)(Bianchi恒等式);
若\(M\)上有度规场\(g_{ab}\)且\(\nabla_a g_{bc}=0\),则可定义\(R_{abcd}\equiv g_{de}{R_{abc}}^e\),则有
- (4) \(R_{abcd}=-R_{abdc}\);
- (5) \(R_{abcd}=R_{cdab}\)。
由对称性可知,对\(n\)维流形而言,Riemann曲率张量独立分量的数目为\(N=n^2(n^2-1)/12\)。且独立的缩并仅有一个\(R_{ab}:={R_{acb}}^c\),被称为Ricci张量,还能构造一个标量曲率\(R:=g^{ab}R_{ab}\),称为Ricci标量。我们指出,Riemann曲率张量反映了流形本身内禀的弯曲性质,而Einstein将引力解释为时空流形受到物质场分布的影响产生的弯曲,这就是我们为什么要发展微分几何,并用这套数学工具刻画广义相对论的重要原因。下面我们将简要概括广义相对论的一些基础内容。
三、广义相对论——时空作为微分流形的理论
1. Einstein场方程与广义相对论历史回顾
广义相对论是描述引力相互作用的最为成功的一个理论,其基本思想可以被概括成以下两条:(1) 四维时空是一个弯曲的赝黎曼流形,其度规号差为\((-,+,+,+)\);(2) 物质的能动张量与时空几何满足著名的Einstein场方程
其中\(R_{\mu\nu}\),被称为Ricci张量,\(R=g^{\mu\nu}R_{\mu\nu}\)为Ricci张量的迹,\(g_{\mu\nu}\)是度规张量,\(T_{\mu\nu}\)为物质的能动张量,\(G\)为Newton万有引力常数。Einstein敏锐地认识到了Bianchi恒等式与能量动量守恒的要求可以得到这样一个方程,并且在诸多物理实验中都得到了很好的验证。
广义相对论是一百年前Einstein提出的一个描述引力相互作用的理论,我们在这里简单回顾下它的历史。众所周知,Maxwell总结了大量关于电磁学的实验事实,并从这些实验事实中得到了电磁学理论一套完备的数学表述——Maxwell方程组。他进一步从这套理论中得到了对电磁波的预言,后来Hertz通过实验证实了电磁波的存在,这被视为Maxwell电磁理论最成功的预言之一。但Maxwell电磁理论与Newton的经典力学却存在着某些不可调和的冲突,最直接的一点就是由Maxwell电磁理论得到的电磁波波速似乎是与参考系的选取无关的,即其在不同的坐标系中遵循不同于经典力学中的坐标变换规则——Galileo变换。在前人工作的基础上,Einstein于1905年提出了狭义相对论,改变了人们对时空的观念,从而调和了经典电磁学与经典力学之间的矛盾。但是狭义相对论却又与Newton提出的万有引力理论存在不可调和的矛盾。在深入考量时空的性质之后,Einstein在1915年创造性地提出了广义相对论,他将引力相互作用解释成时空的弯曲,并提出了三大可以证实广义相对论的推论,分别是引力红移、水星近日点进动与引力透镜效应,这三大推论最终都得到了实验的验证,从而奠定了Einstein广义相对论的扎实基础。
Schwarzschild于广义相对论提出后的第二年(1916年)给出了一个球对称的真空解,即著名的Schwarzschild解,不久后,球对称的电磁真空解——Reissner-Nordström解也得到了。随后人们重新对Laplace曾经提出的特殊天体——“暗星”进行思考,Oppenheimer与Snyder从广义相对论出发,重新证明了这类天体的存在,并由Wheeler在1967年建议定名为黑洞。对黑洞这种极端天体的研究始于上世纪六七十年代,Bekenstein在各种黑洞的理论分析中,首先提出黑洞热力学的概念,他认为黑洞系统存在着温度、熵等热力学量,这个猜想很快得到了Hawking的数学证明并加以完善,形成了完整的黑洞热力学理论。
但是黑洞的存在一直是个谜,它所要求的极端条件在偌大的宇宙中虽然并不少见,但是由于它本身不允许任何物质逃离其视界面以及可能发出辐射的吸积盘区域发出的辐射又是如此之弱,因此我们在茫茫星河之中实在难以直接观测到黑洞存在的直接证据。直到2015年9月14日,LIGO探测到来自两个黑洞合并的引力波信号GW150914,不仅证明了引力波的存在,更加有力地证实了广义相对论的正确性,更是为黑洞的存在提供了最有力的间接证据。紧接着是北京时间2019年4月10日21:00整,全球六家天文台联合发布由事件视界望远镜(Event Horizon Telescope)观测到人类历史上首张黑洞照片,这是位于距地球5500万光年外的室女座方向的M87,其质量约有65亿个太阳质量,完全证实了黑洞*的存在。
广义相对论至今已有百余年的历史,其正确性在一个非常广阔的尺度上通过种种实验已确定无疑,但它必定不是我们希望能得到的能解释整个物质世界种种客观规律的最终理论,对广义相对论修正理论的研究方兴未艾。
2. Einstein场方程在低能下的渐进行为
粗暴地将方程列出来并不能说明这个理论是正确的,事实上,Newton力学在几百年的发展历程中早就建立了无懈可击的地位。为此,Einstein提出的场方程在我们触手可及的范围内不应该得到与Newton力学的结论违背的结果。索性,在最早得到Einstein场方程中已经考虑到了这一点,能动张量\(T_{\mu\nu}\)前面跟着的系数正是考虑了这个才得到的,具体的讨论细节不再赘述。但是若仅仅满足于这个相符,那么Einstein场方程就没有提出的必要了,事实上我们将看到,在能量稍微高一点的情况下,广义相对论得到的结果将与Newton力学有着明显的差异,而实验对它们的检验,毫无疑问地支持了广义相对论的结果!
第一个重要的实验验证便是著名的引力红移实验,广义相对论给出的引力红移量\(Z\)为
其对应着这几个实验:
- 太阳谱线引力红移
理论值为\(2.12\times10^{-6}\),观测值为\((2.12\times10^{-6})\times(1.05\pm0.05)\),可见观测值以\(5\%\)的精度验证了理论值。 - 天狼星伴星
理论值为\(2.12\times10^{-4}\),观测值为\((2.8\pm1)\times10^{-4}\)。 - 波江座\(40\)伴星\(B\)
理论值为\(5.6\times10^{-5}\),观测值为\(7\times10^{-5}\)。 - Mossbauer效应验证
这是一个地球附近的实验验证,一个实验对应的理论值为\(4.92\times10^{-15}\),观测值为\(4.92\times10^{-15}\times(0.997\pm0.008)\)。
需要指出的是,虽然这些结果看起来都符合广义相对论,但实际上Newton的万有引力理论还是都可以解释上述结果的。
第二个重要的实验验证为水星近日点进动中有每百年\(43^{\prime\prime}\)是Newton力学完全无法解释的,但是利用广义相对论可以得到正确的结果。
第三个重要的实验验证为光线偏折实验,这个实验明显地体现了广义相对论和Newton力学的区别。广义相对论给出的理论值为
而Newton力学给出的理论值为
显然它们有很大的不同,而实验上(日全食时对太阳在地面观测者看来附近恒星所在位置的测量)支持了广义相对论。
低能极限下,Einstein场方程还会给出一个相当重要的预言——引力波。引力波可以看作是平坦时空流形——Minkowski时空下的一个线性弱场扰动,对这个的讨论用到了大量的微分几何,最后得到了一套完整的描述引力波的方法,目前人们已经具体观测到了引力波的存在,再度稳固了广义相对论的实验基础。
3. 一些重要的场方程精确解概略
-
球对称真空解——Schwarzschild外部解
\[ds^2=-\left(1-\frac{2GM}r\right)dt^2+\left(1-\frac{2GM}r\right)^{-1}dr^2+r^2d\Omega_2^2\tag{3.3.1} \] -
电磁真空球对称解——Reissner-Nordström解
\[\begin{aligned} ds^2=-\left(1-\frac{2GM}r+\right.&\left.\frac{Q^2}{r^2}\right)dt^2 \\ &+\left(1-\frac{2GM}r+\frac{Q^2}{r^2}\right)^{-1}dr^2+r^2d\Omega_2^2 \end{aligned}\tag{3.3.2} \] -
轴对称带电一般解——Kerr-Newman解
\[\begin{aligned} ds^2=&-\left(1-\frac{2GMr-Q^2}{\rho^2}\right)dt^2+\frac{\rho^2}\Delta dr^2+\rho^2d\theta^2 \\ &+\left[(r^2+a^2)\sin^2\theta+\frac{(2GMr-Q^2)a^2\sin^4\theta }{\rho^2}\right]d\varphi^2 \\ &-\frac{2(2GMr-Q^2)a\sin^2\theta}{\rho^2}dtd\varphi \end{aligned}\tag{3.3.3} \]
这三个解反映了物质对时空的作用,而对时空性质的刻画我们利用了度规场\(g_{\mu\nu}\),而求解这三个解的过程,我们也大量应用了微分几何工具。除此之外,这三个解所直观描写的时空并不完备,我们通过微分几何的构造,能将上述几个解所刻画的时空区域进行延拓,构造所谓的最大延拓时空,并利用共性变换的技术绘出Penrose图来直观地描绘时空的完整结构。而在这个延拓之后,我们也能从中得到许多有趣的东西——例如黑洞以及虫洞。这些内容都可以在广义相对论的基本教材中可得到查阅,这里只做一个粗略的介绍。
四、引力相互作用与量子化展望
量子理论则是二十世纪近代物理学发展的两大支柱中的另一个重要的理论体系,其发展根源于我们对物质组成进行的深入的探索。在诸位物理学家努力下,最终完善了量子力学的基本概念,并发展了波动力学与矩阵力学两种等价的数学形式,对微观世界的物理机制有了全新的认识。但是量子力学的理论本身与相对论本身存在着内在逻辑上的矛盾,但二者都是描述自然界现象的理论,既然自然界能正常地运行,那么这两个理论就不应该存在着不可调和的矛盾,因此我们从逻辑上出发,自然而然地可以合理猜测应该由某种更为一般的万有理论,而量子力学与相对论本身不过是它的某种近似罢了。
初步对这个问题做出一个比较完善的解答的理论则是量子场论,在考虑了狭义相对论与量子力学的基本原理的结合后,人们成功地在结合电磁相互作用的基础上发展了量子电动力学,并进一步整合弱相互作用发展了电弱统一理论,在考虑强相互作用的基础上形成了完整的粒子标准模型,完善了整个量子场论的研究。
但是这套理论与广义相对论依旧无法统一,这也意味着广义相对论所描述的引力相互作用迟迟无法完成相应的量子化,我们也一直无法构建一个包含自然界四种基本相互作用的大一统模型。
目前有两条路径达到这个我们期待的终极理论,一个是相互作用几何化(即将四种相互作用都用几何的语言描述刻画,目前电磁规范理论与引力理论都已经成功),另外一个则是考虑时空的量子化(将引力相互作用量子化为一个自旋为\(2\)的规范玻色子),但无论是从相互作用几何化,还是考虑时空的量子化都遇到了极大的困难。
目前人们更加倾向于将时空量子化,弦论就是一个非常重要的尝试。人们首先通过研究强相互作用粒子的散射振幅在高能情形下的行为,发现它可以被一维弦的动力学来进行等价描述。更进一步地,人们还发现了闭弦对应的粒子中包括一个无迹对称的张量,通过研究它正对应着四维时空中自旋为2的零质量粒子。前期对引力量子化的研究指出,这个粒子应该正是用来传递引力相互作用的粒子,人们进一步发现,弦论至少应该是一个量子引力的理论。后来,在1984年到1985年间,人们又发现了五种微扰弦论,它们在量子理论的意义下是自洽的,并且在计算除引力相互作用外的三种相互作用中都给出了不同于量子场论计算中出现的无穷大结果,即它们给出的结果都直接是有限的,换句话说,超弦理论本身就应该能自然而然地将四种基本相互作用统一起来。更进一步地,第二次超弦革命将五种不同的微扰弦论统一了起来,并提出了十一维的超引力模型,并预言存在一个更大的M理论。但这些理论都还未完善,还需大量数学家和物理学家的共同努力,来完善我们对物质世界的探索。
参考文献
[1] 梁灿彬, 周彬. 微分几何入门于广义相对论(上册)[M]. 第2版. 北京: 科学出版社. 2006
[2] 陈斌. 广义相对论[M]. 第1版. 北京: 北京大学出版社, 2018.
[3] 赵柳. 相对论与引力理论导论[M]. 第1版. 北京: 科学出版社, 2017.
[4] CARROLL S M. 时空与几何[M]. 北京: 世界图书出版公司北京公司, 2012.
[5] 赵峥, 刘文彪. 广义相对论基础[M]. 北京: 清华大学出版社, 2010.