引言--不得不说的废话

   相对论无疑是大众最耳熟能详的科学概念之一。 然而,尽管科普读物多如牛毛,依然无法褪去其神秘的面纱。 大众对相对论是什么却缺乏应有的基本认识,甚至误以为相对论就是说“一切都是相对的”。 而误解的源头不是别个,正是其名称:“相对论”。这是个十分不恰当的名称。 事实上,这个名称并非爱因斯坦所创,而是来源于周围的人。 而他们发明这个名称时,并不真正理解爱因斯坦的理论。 梁灿彬教授曾打趣:相对论不应该叫“相对论”,而应该叫“绝对论”。 因为相对论的基本研究方式,是忽略那些相对的东西(比如同时性,测量长度), 而关注那些绝对的事物(譬如四维动量,固有长度)。

   笔者决心要弃用这个坏名称,而改用恰当的称呼。 事实上,所谓相对论,研究的是两个内容: 四维的时空(Space-Time)几何,与四维时空中的物理学。 我们不妨称祂们为“时空几何”、“四维物理”, 合称“时空几何与四维物理”,简称“时空物理”,以取代“相对论”一词。 以上为横向拆分,时空几何为基础,四维物理为上层建筑。 而纵向拆分,又可分为平直时空物理、弯曲时空物理, 即常说的“狭义相对论”、“广义相对论”。 笔者将一贯使用“时空几何”、“四维物理”、“时空物理”、“平直-”、“弯曲-”等称谓。

   读者或许会认为笔者总喜欢脱离主流,走偏门奇路, 或是自己生造一些未被公认的词汇, 或是选取一些与主流不同的约定(比如约定 c=i 而非主流的 c=1 )。 是的,我承认自己有些特立独行,但只在这么做有足够好处时。 如果完全遵循前人走过的路,你也将错过前人所错过的。 我所做的不是创新,而只是从别的(笔者认为更好的)角度来审视事物。 当然,这与“民科”(指不具备基本科学素养的科学爱好者)的天马行空不同, 我们必须在角度清奇的同时,时刻保持严谨的态度。 以下是我特立独行的理由:

  • “时空几何与四维物理”是比“相对论”更准确的说法,而使用这种准确称呼是避免大众误解的必由之路。
  • c=1 的时空几何必须使用更加“高等”的几何来解决问题;而约定 c=i,则可用中学生都会的初等几何深刻地讨论平直时空几何。

   此外,我也不打算重走历史上的发现之旅。 这样的书和文章数不胜数,没有再多我这一篇的必要。 我们有一百多年的时间优势,完全可以从其它角度来思考,走不同的思路。 相信一定会有新的启发。

位置-时间图的特殊性

   相对性原理说运动是相对的,不,这是个误解。相对性原理只说了静止和匀速直线运动之间是相对的。 我们决不能随意外推到加速运动上。 绝对的静止是不存在的。 让我们假想这么一个场景:你生活在一个太空城,这个太空城漂浮在广袤的宇宙中,远离任何一个星系。而我的飞船与你擦肩而过。 你认为你是静止的,而我开著飞船在匀速滑行;而我却认为我并没有踩油门,是静止的,是你在匀速向后飞去。 为了避免争论不休,我们于是开始用实验来区分谁才是静止的。望远镜目前是指望不上了,我们现在远离任何星系,而星系都在运动。 微波背景辐射也被三体人或者别的甚么生物给屏蔽了。我们只好作本地实验,从台球碰撞,到粒子对撞,还包括迈克尔逊-莫雷的光干涉实验。 最终的结果都是一样的,咱俩谁也不比谁特殊,所谓静止,不过是我们主观给自己的认定。客观上,咱俩并没有静止和匀速直线运动之分。

   在研究事物变化时,我们常常使用一种坐标图来形象描述。以时间为自变量轴,以所研究的物理量为另一条轴。 比如温度-时间关系图、位置-时间关系图、速率-时间关系图等等。 你为了研究我飞船的运动,画起了位置-时间关系图。你也是个喜欢偶尔背离主流的人,这次选择纵坐标为时间,横坐标为位置。

t x O

   如图,你认为自己是静止的,图像与 t 轴重合(红色)。而我则在匀速运动,因此图像为一条斜线,由于没有加速,因此图像至少是直线(蓝色)。 你的一段红线,由于与 t 轴重合,所以代表一段时间。由于相对性原理,我们之间是平等的。那么我的一段蓝线也应该代表一段时间。 这就有趣了。一般物理量-时间图像中的斜线,是没有特定意义的。比如温度-时间图像,斜线本身段并不代表任何物理意义, 既不是一段时间,也不是一段温度。其他诸如速度-时间图像、加速度-时间图像等等,无不如此。唯有位置-时间图像(不失一般性后文称 x-t 图像),十分特殊。 另一个竖直线段与斜线段代表相同物理意义的坐标是 x-y 坐标。 另一方面,我们也可以认为,你是选取了自己运动的轨迹为 t 轴。 而若换做我画 x‘-t’ 图像,则 t’ 轴一定是沿着我的轨迹,而你的轨迹则倾斜。 而相对性原理告诉我们你的 x-t 图和我的 x’-t’ 图,是平等的。 这应该是某种坐标变换。另一个存在坐标变换的系统是 x-y 坐标。 x-t 与 x-y,二者似乎有内在的共同点。

   这里可引出一些疑问:竖直线和像这样的斜线代表一段时间,而水平线代表一段空间, 是否所有斜线段都代表一段时间?是否也有代表一段空间的斜线段?时间和空间的分界在哪? 直线段与斜线段都是一段时间,那么它们之间如何比较长度? x-t 到 x’-t’ 的变换是什么样的呢?会不会像 x-y 到 x’-y’ 的变换? x 轴和 x’ 轴重合吗?

   读到此处,请读者停下来思考。先别急着思考这些问题的答案,而是先思考如何提出问题。 万事开头难,从现象中抽取规律,并提出好的问题,是科学发现的第一步。 爱因斯坦当年,便是从提出如果追著一束光飞行会怎么样开始,窥探到了时空几何的奥秘。 比起问题本身,笔者更想要分享的,是发现斜线与竖直线平等,以及由此提出这些问题的思维方式。 笔者的这些问题,你是否也有想到呢?此外,你是否还想到了更多问题?

反思空间的性质

   然后,我们来思考这些问题。光是盯着问题本身思考,往往很难得到答案。我们需要更开阔的视野和一些深层的洞见。 类比 x-t 与 x-y,研究其共性,应该会对我们有帮助。此外,研究时间和空间本身所具有的性质能让我们的认识更加深刻。 不要去思考“时间是甚么”这样的问题,这容易让我们陷入迷茫; 更不要随意回答这样的问题,这往往得到片面的答案,就像盲人摸象。 应该思考“时间具有什么性质”、“它与其它事物有甚么关系”这样的问题, 这才能实质性地提供建设性,并且保持不同角度看事物的可能性。 空间有什么性质?首先,它具有平移不变性:左边的一米,和右边的一米是一样的;楼上的一平方米,和楼下的一平方米是一样的。 这个平移还可以是在时间方向上:昨天的一米和今天的一米是一样的。 其次,它具有旋转不变性:东西方向的一米,和西北偏北的一米是一样的。 时间具有什么性质?它恒定流动,永不回头。永不回头这一点,在我们研究到热之前没有甚么帮助,暂时放一旁。 恒定流动,换成一个刚才用过的说法,在时间方向上平移不变性:今天的一秒和昨天的一秒是一样的。 此外,还有空间方向的平移不变性:家里的一秒和街上的一秒是一样的。 而前面,根据相对性原理,我们还发现时间还可以向空间方向倾斜,并且保持某种不变性。 倾斜,其实就是某个范围内的旋转,也许还叠加了某种程度的缩放。

   以上特点中有一个非常优美的性质--“线性”。 一个方向的空间是线性的,不同方向的空间之间是线性的,时间是线性的,时间和空间之间也是线性的。 这实在是太棒了,线性,意谓着数学上的简单性,大家都喜闻乐见。 我们回忆中学所学的平面直角坐标系变换,由于空间的线性,一定可以写为:

{x=a11x+a12y+Δxy=a21x+a22y+Δy \begin{cases} x' = a_{11}x + a_{12}y + \Delta x \\ y' = a_{21}x + a_{22}y + \Delta y \end{cases}

   Δx 和 Δy 表示两个坐标系原点的差异,如果两个坐标系原点重合,可以将它们消掉。写为:

{x=a11x+a12yy=a21x+a22y \begin{cases} x' = a_{11}x + a_{12}y \\ y' = a_{21}x + a_{22}y \end{cases}

   其中, [a11,a12a21,a22] \begin{bmatrix} a_{11}, a_{12} \\ a_{21}, a_{22} \end{bmatrix} 这四个参数构成一个变换矩阵,但是我们先不从这个角度思考, 而是着眼于两个坐标系的平等性。 考虑到这一点,逆变换也应当具有相同形式

{x=b11x+b12yy=b21x+b22y \begin{cases} x = b_{11}x' + b_{12}y' \\ y = b_{21}x' + b_{22}y' \end{cases}

并且,若我们都用相同的长度单位,还会有: a11a22a12a21=b11b22b12b21=1a11=b11=a22=b22a12=b12 a_{11}a_{22} - a_{12}a_{21} = b_{11}b_{22} - b_{12}b_{21} = 1 \\ a_{11} = b_{11} = a_{22} = b_{22} \\ a_{12} = -b_{12} 否则,将破坏平等性。 (中间的数学推导从略。对于懂得线性代数的朋友,这两个结论显而易见。 不懂线性代数的朋友,也能用简单的加减乘除推导, 加上适时使用两个坐标系的平等性得到。正好作为练习。 要体会物理的美,是绕不开数学的。)

   为了简化,我们记 α=a11 \alpha = a_{11} β=a12 \beta = a_{12} 可得:

{x=αx+βyy=α21βx+αy{x=αxβyy=α21βx+αy \begin{cases} x' = \alpha x + \beta y \\ y' = \frac{\alpha^2-1}{\beta} x + \alpha y \end{cases} \qquad \begin{cases} x = \alpha x' - \beta y' \\ y = -\frac{\alpha^2-1}{\beta} x' + \alpha y' \end{cases}

   至此,我们将八个参数简化为两个。比起 α 和 β, 我们更希望通过坐标之间的几何量作为变换式的参数。 由于两个坐标系原点的重合,又默认都是右手系, 因此它们的关系由从 x 到 x’ 的角唯一确定。 我们记这个角为 θ,需要注意,这个角是有方向的。 我们取 x’ 轴上的点 A,记其在两个坐标系下的坐标分别为 (xA,yA) (x_A,y_A) (xA,yA) (x_A',y_A') 。由于 A 点在 x’ 轴上,有: {yA=0yAxA=tan(θ) \begin{cases} y_A' = 0 \\ \frac{y_A}{x_A} = \tan(\theta) \end{cases} 将其代入 y=α21βx+αy y' = \frac{\alpha^2-1}{\beta} x + \alpha y ,并消去 A 相关的部分,可得: {α21β=αtan(θ)β=1α2αtan(θ) \begin{cases} \frac{\alpha^2-1}{\beta} = -\alpha \tan(\theta) \\ \beta = \frac{1-\alpha^2}{\alpha \tan(\theta)} \end{cases} ,于是变换式又简化为: {x=αx+1α2αtan(θ)yy=αtan(θ)x+αy{x=αx1α2αtan(θ)yy=αtan(θ)x+αy \begin{cases} x' = \alpha x + \frac{1-\alpha^2}{\alpha \tan(\theta)} y \\ y' = -\alpha \tan(\theta) x + \alpha y \end{cases} \qquad \begin{cases} x = \alpha x' - \frac{1-\alpha^2}{\alpha \tan(\theta)} y' \\ y = \alpha \tan(\theta) x' + \alpha y' \end{cases}

   再通过角的可加性,我们可以最终确定 α=cos(θ) \alpha = \cos(\theta) ,过程与本文主题无关,从略。这是我们在中学就知道的事实。 写成矩阵,就是 [cos(θ),sin(θ)sin(θ),cos(θ)] \begin{bmatrix} \cos(\theta), \sin(\theta) \\ -\sin(\theta), \cos(\theta) \end{bmatrix} ,利用矩阵的指数和对数运算,我们还能写成更漂亮的形式 e[0,θθ,0] \Large{e}^{ \small \begin{bmatrix} 0, \theta \\ -\theta, 0 \end{bmatrix} } ,这是个重要的形式,里面蕴含关于旋转的深刻原理, 对于理解弯曲时空的黎曼曲率有很大帮助, 恰当的时候,会单独开篇讨论。

类比到时间-空间平面

   回顾以上,我们使用了空间坐标系的线性和平等性,得到了包含两个待定参数的了坐标变换式。 只要确定了参数,便可以研究 x-y 平面上的各种问题。 同样地,我们也希望找到 x-t 到 x’-t’ 的变换。 根据线性,我们同样可以写出: {t=a00t+a01x+Δtx=a10t+a11x+Δx \begin{cases} t' = a_{00}t + a_{01}x + \Delta t \\ x' = a_{10}t + a_{11}x + \Delta x \end{cases} 同样,我们可以让坐标原点重合消去 Δt 和 Δx,具体操作就是以我们相互飞过时作为时间的 0 点, 交汇点为空间原点(当然,为了简化,我们把咱俩都看作是质点,并相互无限接近地飞过)。 再根据相对性原理,我们也能得到时空坐标的平等性。于是可同样简化为: {t=αt+βxx=α21βt+αx \begin{cases} t' = \alpha t + \beta x \\ x' = \frac{\alpha^2-1}{\beta} t + \alpha x \end{cases}

接着,我们也能在 t’ 轴上取一点 A,坐标分别为 (tA,xA) (t_A,x_A) (tA,xA) (t_A',x_A') 。由于 A 点在 t’ 轴上,有: {xA=0xAtA=v \begin{cases} x_A' = 0 \\ \frac{x_A}{t_A} = v \end{cases} 。其中 v 为 x’-t’ 系相对于 x-t 系的速度。 和空间的情形完全一致,只是 tan(θ) 换成了 v。通过相同的步骤,我们可将变换式简化为: {t=αt+1α2αvxx=αvt+αx{t=αt1α2αvxx=αvt+αx \begin{cases} t' = \alpha t + \frac{1-\alpha^2}{\alpha v} x \\ x' = -\alpha v t + \alpha x \end{cases} \qquad \begin{cases} t = \alpha t' - \frac{1-\alpha^2}{\alpha v} x' \\ x = \alpha v t' + \alpha x' \end{cases}

当我们局限于视野

   然后,我们需要做的,就是确定参数 α。 线性和相对性原理,只能带我们走到这里。 我们需要更多的基本原理--或者说“公设”--才能继续。 以我们的日常生活经验,和实验室中能进行的力学实验,应当有: x=xvt x' = x - v t 通过取 α=1 \alpha = 1 便可做到这一点。 代入变换式得: {t=t+0xx=vt+x \begin{cases} t' = t + 0 x \\ x' = - v t + x \end{cases} 这便是伽利略变换,在很高的精度下正确。 谁也没有见过谁的表运动著,就变快或变慢了,谁也没有见过什么东西运动著,长度就变了。

   现在,我们可以来回答之前那些问题了: 竖直线段和斜线段都代表一段时间,只有水平(至少要非常接近水平)的线段才代表一段空间。 时间与空间的分界就在于是否是水平(非常接近水平)的。 对于一个时间段,只要分别沿着其两个端点作水平线,两条水平线之间的距离即时间长度(偏差非常小)。 x-t 到 x’-t’ 的变换与 x-y 到 x’-y’ 的变换不同,参数(几乎)是常量而非变量。 它像一种斜切变换,而不像转动,因为 x 轴始终(几乎)不动。 x 轴和 x’ 轴(几乎)是重合的。 由于经验所确定的参数并不能精确地确定为 1 和 0,我们还不能把话说死,需要括号里那些有所保留的话。 如果这组参数是精确的,即伽利略变换精确成立。那么,我们将得到一幅十分怪诞的几何图景。 没有转动,而是斜切变换。水平方向和其它方向如此不同,而且是跳跃式的变化,只要稍稍有那么一点倾斜,立即从空间变为时间, 而且其长度与原来的空间长度毫无关系。虽与我们的世界的情形十分吻合,图景本身却毫无美感可言。 比起 e[0,θθ,0] \Large{e}^{ \small \begin{bmatrix} 0, \theta \\ -\theta, 0 \end{bmatrix} } 这样优美的矩阵, [1,v0,1] \begin{bmatrix} 1, v \\ 0, 1 \end{bmatrix} 就显得十分突兀,有某种无穷大在其中。 宇宙真的是这样丑陋的吗? (看问题的角度不同,审美也会不同。 牛顿和十九世纪的开尔文勋爵可不认为这丑陋。 亦或许是因为他们的年代早于爱因斯坦, 还没有机会体会真正美丽的时空几何。)

电磁场搅局,打开新的视野

   伽利略变换在很高的精度下正确,无论是我们的日常生活, 还是实验室中的各种力学实验,全都精确符合。 可偏偏有一种物质,完全不符合此变换。这个怪胎就是电磁场。 它遵循麦克斯韦方程组,那是四个优雅的方程,与伽利略变换水火不容。 一定有一个是错的,至少是不准确的。 从十九世纪末到二十世纪初的物理学家们,大都选择修改电磁场理论。 为此,他们引入以太来代替真空作为电磁场的介质。 然而,一切实验都证明了以太是莫须有的。 修改麦克斯韦理论的尝试,是失败的。看起来,只能修改伽利略变换了。 洛伦茨是第一个吃螃蟹的。他提出了著名的洛伦茨变换。 可是,他显然不知道他的变换意谓着什么。 这其中深刻的道理,还要等爱因斯坦和闵可夫斯基来解读。

   站在马后炮视角,我们看问题可就明朗多了。 麦克斯韦方程组,十分优美;而伽利略变换,则是丑陋的。 只要是按照我们上一节的思路得到伽利略变换, 我们就一定会首先想到修改伽利略变换,而非麦克斯韦理论。 我们得到伽利略变换的最后一步,是确定变换式的两个参数。 这一步,是根据片面的实验(力学实验,而无电磁学实验)所得。 我们不妨抛弃这里的公设,重新确定两个参数。 这也是对伽利略变换的最小化修改,我们保留了时空的线性(万幸万幸), 以及相对性原理。

   笔者不打算在这里讲麦克斯韦方程组,和一般的电磁场,那样需要太多篇幅。 这里,只取用真空中电磁波的速率为恒定值 c 这一个推论。如果时空变换与麦克斯韦方程组兼容, 那也必然与这个推论相容。我们可先用此推论找出变换,再回头验证麦克斯韦方程组(这也是当年爱因斯坦的做法)。 约定俗成,我们称 c 为光速(不加说明,“光速”一律指真空光速,介质中光传播的速率必须有“某某介质中的”定语,不可简称“光速”)。 根据相对性原理,所有的惯性系下,应当遵循同一个麦克斯韦方程组,于是也就有同一个光速。 光,是一种电磁波,不失一般性,我们就以光来进行讨论。

   我们回到参数确定之前: {t=αt+1α2αvxx=αvt+αx \begin{cases} t' = \alpha t + \frac{1-\alpha^2}{\alpha v} x \\ x' = -\alpha v t + \alpha x \end{cases} 如果有一束光,在时空原点向前发射。在你的参考系下,经过了 τ 时间,应到达 cτ 位置。 假设在我的参考系,是经过了 τ‘ 时间,那么也应到达 cτ’ 位置。代入变换可得: {τ=ατ+1α2αvcτcτ=αvτ+αcτ \begin{cases} \tau' = \alpha \tau + \frac{1-\alpha^2}{\alpha v} c \tau \\ c \tau' = -\alpha v \tau + \alpha c \tau \end{cases} {cτ=αcτ+βττ=α21βcτ+ατ \begin{cases} c \tau' = \alpha c \tau + \beta \tau \\ \tau' = \frac{\alpha^2-1}{\beta} c \tau + \alpha \tau \end{cases} 同时消去 τ 与 τ’,加上 α 取正数,我们得到 α=11v2c2 \alpha = \frac{1}{\sqrt{1 - \frac{v^2}{c^2}}} ,代入变换式得: {t=11v2c2tvc21v2c2xx=v1v2c2t+11v2c2x \begin{cases} t' = \frac{1}{\sqrt{1 - \frac{v^2}{c^2}}} t - \frac{v}{c^2 \sqrt{1 - \frac{v^2}{c^2}}} x \\ x' = - \frac{v}{\sqrt{1 - \frac{v^2}{c^2}}} t + \frac{1}{\sqrt{1 - \frac{v^2}{c^2}}} x \end{cases} 这便是洛伦茨变换。乍看之下,完全体现不出任何美感。问题在于我们选了速率作为参数。 速率是伽利略变换下的好参数,在伽利略变换下,速度具有可加性。 在洛伦茨变换下,则不然。可加性丢失了,意谓着它不再是一个好的参数。 对比我们推导空间变换和时空变换的过程。空间变换中,我们使用角 θ 作为参数,过程中有个关键的 tan(θ) \tan(\theta) 而到了时空变换中,我们将 tan(θ) \tan(\theta) 换成了 v。若我们在空间变换中也使用 v 代替 tan(θ) \tan(\theta) 会如何呢?我们会得到: {x=11+v2x+v1+v2yy=v1+v2x+11+v2y \begin{cases} x' = \frac{1}{\sqrt{1 + v^2}} x + \frac{v}{\sqrt{1 + v^2}} y \\ y' = - \frac{v}{\sqrt{1 + v^2}} x + \frac{1}{\sqrt{1 + v^2}} y \end{cases} 是不是像极了洛伦茨变换?若使 c2=1 c^2 = -1 ,二者将完全一致。我们仿造空间中的角,定义时空角,将 v 换为 tan(φ) \tan(\varphi)

t x O φ

这样,洛伦茨变换竟被我们化简为: {t=cos(φ)t+sin(φ)xx=sin(φ)t+cos(φ)x \begin{cases} t' = \cos(\varphi) t + \sin(\varphi) x \\ x' = - \sin(\varphi) t + \cos(\varphi) x \end{cases} 我们发现:时间与空间满足同一个几何学。如此完美!

有虚数的世界

   需要指出,以上得到的熟悉的变换式,并不像表面上看起来那么熟悉。因为选取 c2=1 c^2 = -1 ,势必要引入复数。我们不妨取 c=i c = i ,无量纲。这意谓着我们将时间和空间的量纲进行了统一,并定义了时间单位和空间单位的换算关系。 具体地,有: 1=i1s3.0i×108m... 1 光年 = i 年 \\ 1 s \approx -3.0i \times 10^8 m \\ ... 。我们看到时间与空间一虚一实,若使用时间单位,则空间为虚数,若使用空间为单位,则时间为虚数。 正切值,也就是速率,为实数与虚数之比,为虚数。于是,时空角通常也为虚数。 因此,三角函数也不再是熟悉的实变三角函数,而是复变三角函数。会有 cos(φ)>1 \cos(\varphi) > 1 sin(φ) \sin(\varphi) tan(φ) \tan(\varphi) 为虚数,失去周期性(准确地说,是在我们关注的方向上没有周期性)等等。 这个既熟悉有陌生的变换式,将会为我们开启一个既熟悉又陌生的几何世界。 后面的篇章,将带来复变三角函数的充电宝。待充电完毕,我们来游览这个有趣的几何世界。

   物理学家常常定义一个常数为无量纲数,来统一不同的量纲。 比如定义波尔茨曼常数为 1 以统一温度与能量的量纲等等。 主流做法是定义 c = 1,实际上是等价的,所有实在的结论都没有任何不同。 但那样的几何图景,远不如 c = i 来得简洁优美。 依我看,选择 c = 1 的人除了从众以外,就是为了避开虚数。 但他们避开了虚数坐标,却避不开虚数的线元和角度。 拿到了负数的线元,他们不敢开方。甚至完全避开角度不谈, 或只谈纯虚数角度的虚部(是个实数,被命名为快度)。 对实实在在的事物视而不见,看到的世界便不完整。 让我们拥抱复数,拥抱完整的世界。