-作者簡介-
何劍鋒,中國科學院理論物理研究所2023級博士研究生
導師:郭宗寬 研究員
研究方向:引力與宇宙學
從向量到抽象指標記號
“向量” 這一概念最早在高中數學及物理教學中就已被提及,其通常被描述為一個既有大小又有方向的對象,同時其加法滿足三角形法則。例如,圖1 中的向量 是向量 與 之和。
![]()
圖1. 矢量求和的三角形法則
向量在高中物理中常常被稱為 “矢量”,并且在靜力學中也常常利用三角形法則來分析力的合成與分解。通常,使用箭頭 或黑體 表示矢量,以區別于普通的數。這種寫法中,矢量被視為一種抽象的幾何對象。同時,高中的解析幾何以及立體幾何中,也常常將矢量在一組正交歸一的基底下作分解,并用分解系數來表示矢量。例如在三維空間中,可以通過如下方式定義一個矢量
這里 為一組正交歸一的基底。如果采用分解系數,那么該矢量也可被表示為
這里我特意使用的了上標 來表示分解系數。此外,在涉及矢量以及后面將要介紹的張量計算時,常常采用愛因斯坦求和約定來簡化書寫,其約定自動對重復的指標求和。例如,上面的分解可以被寫為
在矢量的基礎上可以自然地引入對偶矢量。之所以其名稱里同樣帶有 “矢量” 二字,是因為其代數性質與通常的矢量類似。首先,對偶矢量是將一個向量變為一個數的映射。例如,規定 ,那么 便滿足了這個要求;其次,該映射還必須是線性的,具體來說,對任意兩個矢量 , , 作用于它們之和時,等于分別作用在兩個矢量之上再求和,即
目前為止,僅定義了 如何作用于 ,但并沒有定義其如何作用于 以及 。為了讓 對于任意三維矢量的作用都有良好定義,可以分別定義其如何作用在每個基底 上,這樣一來再借助線性性質即可得到 作用在任意矢量上的結果。例如,若定義
那么其作用在 上的結果便可以通過如下方式計算
既然矢量可以被一組基底線性展開,那么對偶矢量是否同樣如此呢?答案是肯定的。例如,可以約定一組對偶矢量 (注意,這里的編號是上標),其作用在矢量基底上的效果為
這里的 被稱為克羅內克 (Kronecker) 符號,其如果寫為矩陣則是單位矩陣。于是通過直接計算可以驗證,以上定義的 可以被分解為
于是寫為系數則可知 。不難發現,以上定義的一系列計算規則恰好可以將對偶矢量的系數對應為線性代數中的行向量,而將矢量的系數對應為線性代數中的列向量,并且對偶矢量作用在矢量上恰好是行向量與列向量的矩陣乘積,即
在以上表示矢量時,采用了黑體或者箭頭來表示其是一個抽象的數學對象,但如此一來就沒有合適的符號來標記對偶矢量了。為了將矢量與對偶矢量同時標記為抽象的幾何對象,彭羅斯發明了抽象指標記號[1]。其用拉丁字母 , , 等來標記矢量以及對偶矢量,并約定矢量用上標表示,對偶矢量用下標表示,同時成對的抽象指標表示對偶矢量作用于矢量。于是 可利用抽象指標寫為 , 可利用抽象指標寫為 ,而 可利用抽象指標寫為 。抽象指標和通常用來編號的指標 (稱為具體指標) 最大的不同在于,對于具體指標 可以談論 是 , ,還是 ;而對于抽象指標 ,其相當于函數作用后面的那個 “括號”, ,因此不能談論其具體取值。
有了矢量以及對偶矢量的概念,再結合抽象指標,就可以很容易地理解線性代數意義下的張量了。實際上,將具有不同抽象指標的矢量或者對偶矢量 “放在一起” (嚴格來說這叫做張量積),就構成了一個張量。一般來說,張量具有多少個不成對的指標,就說該張量具有多少的階數。例如 是將兩個 放在一起構成的一個二階張量, 是將兩個 放在一起構成的二階張量, 是將 與 放在一起構成的二階張量。和對偶矢量一樣,張量可以作用在矢量或者對偶矢量上從而得到低階的張量,例如
可以發現,張量作用在矢量或者對偶矢量時,通常伴隨著抽象指標的配對,這個過程被稱為縮并。在一些比較復雜的計算中,計算張量的縮并很像是在玩連連看,其往往需要在大量指標中找到匹配的指標以判斷其縮并的結構。
從線性代數到切矢與張量
在上一節中所討論的矢量更多是在一個具有固定原點的空間中討論的,并且這些矢量可以自由地被 “平移”。但另一方面,早在高中數學中就已經提到過切線的概念,于是可自然地想到可以沿這些方向畫出一些 “箭頭”,并稱之為切矢。那么這些矢量和線性代數中的矢量相比有何特殊之處呢?
在高中數學中一個廣為熟知的結論是,函數曲線 在某點切線的斜率是其導數 ,于是與矢量 的方向與之平行。推廣到三維情形,則對于三維空間中由參數方程確定的一條曲線 ,對每個參數函數求導得到的矢量 與切線平行。于是,對于三維空間中的函數 ,其利用鏈式法則可以得到其沿該方向的導數為
這里使用了愛因斯坦求和約定。另一方面,從幾何直觀上來看,“沿某方向求導” 這一操作不應該受到坐標選取的影響,或者說求導的數值在坐標變換下應當保持不變。假設有坐標變換 ,那么由鏈式法則可知
這里的 被稱為雅可比矩陣(Jacobian matrix)。在以上表達式中可以發現, 就像是通常的三維空間矢量的分量,所以如果定義不同的 與 的依賴關系,則可以給出不同的方向導數,或者說給出不同的切線方向以及 “步長”。另一方面,不論 如何選取,偏導數部分的形式以及在坐標變換下的結構總是不變的,因此偏導數的部分就像是通常的三維空間矢量的基底。綜合以上兩點可以發現,將偏導數算符進行線性組合并作用到函數上便可得到所有可能的方向導數,并且其滿足我們所要求的坐標變換關系。因此,那些曲線上的 “箭頭” 可以使用偏導數的線性組合來表達,此時它們被稱為 “切矢”。可以發現,其與普通的矢量的第一個不同點在于切矢的分量在坐標變換下必須通過雅可比矩陣進行變化,而普通的矢量分量則沒有坐標依賴關系。基于這個原因,切矢有時也被稱為協變矢量 (covariant vector)。另一方面,通常在微分幾何中直接將微分算符稱為切矢,因此其可作用在普通的函數上從而得到方向導數,并且滿足萊布尼茲律。如果用抽象指標來表述以上結論,則一般的切矢可被寫為
并且其在坐標變換后其分量將進行如下變換
和通常線性代數意義下的矢量類似,切矢也有對偶矢量的概念,中文教材中有時將之稱為余切矢 (cotangent vector). 通過要求余切矢和切矢的縮并 在坐標變換下不變,可知其分量在坐標變換下的變換性質是和切矢恰好 “相反” 的
余切矢有時也被稱為逆變矢量 (contravariant vector). 同時,由于余切矢的基底的變化形式也和切矢相反,并且注意到微分和偏導的變化形式相反,因此通常使用微分記號 來標記余切矢的基底,從而余切矢的分解表達式為
和線性代數的情形類似,將切矢和余切矢 “放在一起” 便可以得到微分幾何意義下的張量。其中上標按照切矢進行變化,下標按照余切矢進行變化,在此便不進行贅述。
盡管在大部分情況下抽象指標和具體指標在形式上差別不大,其在在一些需要直接描述幾何對象的場合其仍有獨特優勢。例如,廣義相對論中有 “四速度” 的概念,其被定義為時空中觀測者世界線的切矢。在宇宙學中,通常用到的坐標系統為宇宙時坐標 與共形時坐標 ,它們之間的轉化關系為 ,其中 被稱為尺度因子,通常為關于時間的增函數。在宇宙學中討論四速度時往往考慮的是宇宙時 對應的四速度,即 ,而不是共形時 對應的四速度 。于是, 在宇宙時坐標下的非零為 ,但其在共形時下的非零分量為 。不借助抽象指標時,會容易混淆 與 ,從而得到錯誤的分量結果。
度規張量,張量場,以及測地線
在以上的討論中,只涉及了矢量的分解,但并沒有涉及其長度。在高中數學中,矢量的長度是由勾股定理確定的
如果定義一個張量 ,那么上面的表達式可以被改寫為
一般地,可以允許 為任意的矩陣。不過由于希望矢量的每個分量都被用到,且長度不應該依賴于 和 的順序,所以要求 可逆且對稱。可以看出, 就像是一把測量距離的尺子,因此 被稱為度規張量 (metric),并且 的度規被稱為歐式度規。若將 取為如下形式
則 的長度為
同時,兩個矢量之間的內積也可通過和度規的縮并來定義。例如,矢量 和 的內積可以被定義為 。
當在討論切矢時,由于空間中的每個點都有一個由切矢構成的空間,因此一般來說,度規張量也可以隨空間點不同取不同的形式,這就好比在空間中的每個點都采用不同的尺子來衡量距離。這樣在空間每一個點都指定一個張量,就構成了一個張量場。可以說,在廣義相對論所用到的微分幾何中,絕大多數時候都是在使用張量場而非單一的張量。除了寫為矩陣外,在理論物理中還常常借用線段長度的形式來表述度規張量。例如,通常的長度公式為
這里的 表示有限變化。當轉向微積分時,長度坐標變化及長度變化都變為無限小,于是
寫為度規張量則變為
這一步把距離表達為局域關系。在理解了度規的概念之后可以發現,工科中常用的張量分析其實對應于全局度規為歐式的微分幾何。由于空間中每一點的度規均相同,因此許多表達式可以在固定坐標系下進行處理。另一個例子來自宇宙學。在宇宙學中常用的Friedmann‐Lema?tre‐Robertson-Walker (FLRW) 度規,其空間部分可以寫為
這個度規表明,宇宙就像一個正在膨脹的氣球表面,任意兩點之間的距離隨時間不斷增加。同時這也能解釋為何宇宙中遙遠兩點之間的速度可以超過光速而不違背相對論。因為相對論只要求當一個物體飛過另一個物體時它們之間的速度不超過光速。從幾何觀點來看,其相當于物體的世界線切矢的長度。但由于遙遠兩點之間相互遠離的速度只是一個由度規中的尺度因子 決定的具有速度量綱的量,它并不是相對論中所談的局域測量的速度。
在給定度規場之后,就可以通過一種自然的方式定義如何將矢量沿給定曲線 “平移”。在通常的歐式空間中,當我們所將矢量沿某一條直線平移時,實際是希望該矢量與該直線的夾角不變。若用 表示被平移的矢量,用 表示直線的方向,則 “平移” 實際相當于要求在每點上 與 的內積 保持不變。換而言之,這里所希望的 “平移” 實際是要求平移后對應的矢量之間的內積不變。從幾何直觀上來看,如果將矢量沿曲線平移,由于曲線的切線方向一直在改變,因此為了維持矢量和切線的夾角不變,矢量在平移過程中要進行適當的 “旋轉” (見圖2)。
![]()
圖2. 矢量在沿曲線平移時會發生旋轉
若在求導時考慮了矢量平移時的旋轉效果,則稱這種導數為協變導數 (covariant derivative),用 來表示。和普通的偏導數相比,對矢量或對偶矢量求協變導數會多出額外的線性組合系數,如
這里的組合系數 被稱為克里斯托弗 (Christoff) 符號。該符號的微妙之處在于,盡管其看上去和張量一樣具有上下標,但其在坐標變換下的變化性質往往和張量截然不同。限于篇幅,在此便不展開講述。此外,由于這里對平移作了保內積的要求,因此其可以由度規張量通過以下表達式直接計算
值得注意的是,在一般的微分幾何中克里斯托弗符號不一定得依賴度規。
盡管現在定義了矢量如何平移,但由于平移的路徑不唯一,因此仍然缺少比較空間上兩個矢量的方法。例如,假設地球北極和赤道上各有一座山 (見圖3),那么直接將北極上的山沿兩點連線平移,那么得到的山仍然是 “豎著的”,無法與赤道上 “橫著的” 山比高度,除非手動將其 “旋轉” 過來。但另一方面,如果沿著球上的大圓 (即圓心在球心的圓),那么由于矢量在平移時會自然發生旋轉,當這座山被挪到赤道時其已經變為 “橫著的” 了,于是可以比較它們的高度。其實,球面上大圓的軌跡屬于一類被稱為測地線 (geodesic)的特殊曲線。直觀地來看,如果一個人沿著測地線行進,那么他在每一個時刻的行進方向都是自己 “正前方”。例如,在通常的歐式空間中,始終朝正前方行進將導致軌跡為一條直線;如果一個人乘坐飛機始終向前行進,那么他將繞著一個大圓環繞地球一圈。在微分幾何中,通常將測地線上的這一特點概括為切矢沿測地線自身平移。
![]()
圖3. 將北極處的矢量沿著不同軌跡平移至赤道時會得到不同方向的矢量
最后再來談談黑洞。不少廣義相對論的科普中都會用一個漏斗狀的圖案來表示黑洞對周圍的時空的扭曲效應。盡管這個圖像比較直觀,卻也造成了相當程度的誤解。實際上,黑洞扭曲的是時空,而不是單獨的空間。在黑洞的周圍,時空度規不再是平直的閔氏度規 ,而是關于時空坐標的非線性函數。注意到這里的分量存在負號,這是閔式度規與歐式度規最大的區別。因此,“漏斗” 只是一個比喻,其更準確的含義應當是強引力場會扭曲其周圍的度規,并且改變測地線,從而測地線的空間投影由直線變為曲線。
群表示論中的張量
在前面幾節中,已經比較了線性代數與微分幾何中的矢量以及張量。然而,在旋轉群的表示論中同樣會提到 “張量” 一詞。群作為一個數學對象,其要求在其上定義有滿足結合律的
乘法;其次,其應當有單位元素,其與任意群元素 的群乘法結果仍為 ;最后,每個元素 都具有逆元素,其與 的群乘法結果為單位元素。例如,可以將整數的加法作為群乘法,從而所有整數構成一個加法群,其中單位元素為數字 0,每個元素的逆元素為其相反數。關于群乘法的一個反例是矢量叉乘。由于矢量叉乘不滿足結合律,因此其無法被作為群乘法。
在研究群時,除了直接研究抽象的群元素以外,更常用的手段是找到與其具有相同結構的矩陣群。例如,旋轉群是理論物理中常見的一種群,其是三維空間中所有保持長度與角度不變的旋轉構成的一個群,其也被稱為 SO(3) 群,一個繞 軸旋轉角度 的旋轉矩陣為
將這個矩陣作用在向量 上,就得到旋轉后的新向量,這正是 SO(3) 的最基本表示。在這個意義下,三維向量空間本身就是 SO(3) 群的一個表示空間。一般地,用 表示旋轉矩陣,則一個三維矢量 ,在旋轉變換下其分量會變為
如果將 “向量” 變為 “函數”,就會得到一個更加有趣的例子。考慮定義在球面上的函數 ,當對空間進行旋轉時,這個函數將會變為
這一步說明,旋轉不僅可以作用在向量上,也可以作用在函數上,于是這個函數空間本身也成為 SO(3) 的一個表示空間。既然這是一個線性空間,就可以嘗試尋找一組 “適合旋轉” 的基底,使得旋轉的作用盡可能簡單。球諧函數 正是這樣一組基底,它們是角動量算符的本征函數,即
這里的 是作用在函數空間上的角動量算符。球諧函數在這些算符下的性質使得其在旋轉作用下的變換具有良好結構:不同的 不會相互混合,而同一 下的不同 會線性組合。于是,設函數 可以展開為
則在旋轉作用下,這些系數 會按照某個矩陣 (即表示矩陣) 發生混合。對于固定的 ,指標 的取值為 ,因此這一組系數一共有 個,從而張成了一個維數為 的線性空間。以上變換規律可以概括為
其中 是一個 的矩陣,于是 構成旋轉群的 維表示。當 時,這是一個維數為 1 的表示,被稱為標量表示;當 時,這是一個 3 維的表示,被稱為矢量表示;當 時,這是一個 5 維表示,被稱為張量表示;更高的 則對應更高維的表示。對于 的情形,相當于將直乘表示進行了直和分解。例如,對于一個 矩陣 ,其具有 9 個分量,其首先可被分解為對稱部分與反對稱部分:
其中反對稱部分只有 3 個獨立分量,可以與一個三維向量對應;對稱部分則有 6 個獨立分量。對于對稱部分 ,還可以進一步拆分出跡的部分和無跡部分
這里 是矩陣的跡;第二項是一個標量乘以單位矩陣,對應 的部分;第一項是對稱且無跡的張量,它有 5 個獨立分量。因此,一個一般的 矩陣可以分解為
其中 對應對稱無跡部分 ( ), 對應反對稱部分( ), 對應跡 ( )。于是,SO(3) 群的張量表示實際上就是 矩陣中對稱且無跡的部分,它在旋轉變化不與其它成分混合,從而構成一個獨立的 5 維線性空間。例如,如果 是一個對稱且無跡的矩陣,那么 同樣是一個對稱且無跡的矩陣。
在這個基礎上,可以進一步推廣到量子力學中的情形。在量子力學中,系統的狀態用態矢量 表示,其是希爾伯特空間中的一個矢量。當物理空間發生旋轉 時,態矢量會通過一個希爾伯特空間中的算符 變為 。這個算符滿足 ,從而構成了 SO(3) 在量子態空間中的表示。更具體地,旋轉可以寫成
其中 為與旋轉軸平行的單位矢量, 是角動量算符。如果選取一組角動量本征態 作為基底,那么在旋轉作用下,同一 下的不同態會發生混合
可以看到,這一結構與前面的球諧展開完全一致。事實上,球諧函數正是這些量子態在坐標表象下的表現形式。換句話說,“函數的旋轉” 和 “態的旋轉” 是同一個結構在不同表示中的體現。
除了與 SO(3) 群相聯系的張量外,量子場論中還常常用到與洛侖茲群對應的張量。盡管都是與群表示相聯系的 “張量”,在談到 SO(3) 群的張量時,大多時候是特指其張量表示,其是一個 5 維的線性空間;而在物理中談到洛侖茲張量時,大多時候默認其是四維時空中的張量,并且每一指標均按照四維矢量的洛侖茲變換進行協變或者逆變。換句話說,洛侖茲張量更像是微分幾何中的張量的特殊形式,唯一的區別是將雅可比矩陣換成了洛侖茲變換對應的矩陣。相比三維旋轉,洛倫茲群的表示結構更為豐富,其有限維表示可以用兩個 “自旋指標” 來標記,通常記為 。不同表示對應于不同的量子場,或者說不同的粒子。標量場對應 表示,如希格斯粒子;旋量場對應 或 表示,如電子;四維矢量場對應 表示,如光子。
計算機語境下的張量
在前面的討論中,“張量”始終與變換性質密切相關。無論是微分幾何中的張量,還是在群表示中出現的張量,它都在特定的變換下具有明確的變化規律,從而構成一些封閉的線性子空間。然而,當把視角轉向計算機領域時,“張量” 這個詞的含義會發生一次明顯的轉變。
在機器學習或數值計算中,一個 “張量” 通常只是一個多維數組。例如,一個向量可以看作是具有一個指標的數組,一個矩陣是具有兩個指標的數組,而更高階的張量則是具有三個、四個乃至更多指標數組,這種用法可以在 NumPy、PyTorch 或 TensorFlow 等常用庫中看到。在這個語境下,“張量” 強調的是數據的存儲方式,而不是其幾何或物理意義。一個張量原則上可以存儲圖像數據、神經網絡參數,或者任意數值集合,而并不需要滿足任何關于旋轉或坐標變換的約束。這與我們前面討論的張量形成了一個鮮明對比。與之相比,在微分幾何中一個張量之所以被稱為張量,是因為它在微分同胚變換下具有特定的協變或逆變性質;在旋轉群的語境中,一個對象之所以被稱為張量,是因為它在旋轉變化下構成一個封閉的 5 維線性空間;而在計算機中,這些 “變換規則” 通常并不存在,或者至少不是定義的一部分。
當然,這并不意味著計算機中的張量與前面的理論完全無關。例如在物理仿真中往往可能會構造滿足特定變換性質的張量,從而把數學結構引入計算框架之中。但在大多數編程場景下,“張量” 更多只是一個方便的術語,用來指代多維數組這一數據結構。
總結
在高中數學及物理中,“矢量” 被描述成一個 “箭頭” 或者一組坐標;在線性代數中,其被理解為線性空間中的元素,并且可以自然地定義出對偶矢量,隨后將矢量與對偶矢量放在一起從而得到張量;在微分幾何中,矢量被重新理解為附著在點上的方向,也就是切矢,其除了具有線性代數中矢量的線性性質外,還可作用在函數上,并且在微分變換下具有特定的變換性質。
度規張量是廣義相對論研究中最常用到的一類張量,其就好比一把尺子,可以將坐標變化轉化為物理距離。如果在空間中的每一點都允許放上不同的尺子,便形成了度規張量場,并且度規張量可以幫助理解空間的膨脹以及一些看似反直覺的結果。
當把視線轉向 SO(3) 群時,“張量” 一詞又呈現出另一種含義。在這個語境中,所關心的是在旋轉變換下不變的線性子空間,而 “張量” 一詞此時特指的是對應于 的線性子空間,其維數固定為 5. 但在討論洛侖茲群時,“張量” 一詞更接近微分幾何中的張量,只是將坐標的微分變換換為了洛侖茲變換。
最后,如果把視角轉向計算機科學,“張量” 這個詞又會呈現出第三種用法。在機器學習和數值計算中,張量通常只是一個多維數組,用來存儲數據或參數,并不附帶任何關于變換性質的要求,因而其不是一個具有幾何意義的對象。雖然在某些特定應用中會重新引入對稱性約束,但在大多數使用場景中這一點往往被弱化甚至忽略。
當我們再次回看 “矢量” 一詞時,會發現它已經不再只是一個簡單的箭頭,而是通往整個現代科學的一扇門。
參考文獻
微分幾何入門與廣義相對論 (上冊)},梁燦彬,周彬,科學出版社,2007
微信號|ITP-CAS
開放 交融 求真 創新
· 中國科學院·
· 理論物理研究所·
文章轉載自“中國科學院理論物理研究所”公眾號
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.