![]()
導(dǎo)語(yǔ)
復(fù)雜系統(tǒng)可以通過無數(shù)不同的尺度進(jìn)行描述,其因果運(yùn)作機(jī)制往往具有多尺度結(jié)構(gòu)(例如,計(jì)算機(jī)可以從硬件電路的微觀尺度、機(jī)器代碼的中觀尺度,到操作系統(tǒng)的宏觀尺度進(jìn)行描述)。盡管科學(xué)家們研究和建模的系統(tǒng)涵蓋了從微觀物理到宏觀經(jīng)濟(jì)學(xué)的完整層級(jí),但關(guān)于系統(tǒng)宏觀尺度能為系統(tǒng)帶來什么超越單純壓縮的附加價(jià)值,學(xué)界仍存在爭(zhēng)議。為解決這一長(zhǎng)期存在的問題,本文提出了一種新的涌現(xiàn)理論,能夠區(qū)分哪些尺度對(duì)系統(tǒng)的因果運(yùn)作具有不可約貢獻(xiàn)。該理論在馬爾可夫鏈的粗粒度分析中的應(yīng)用,揭示了一種新興的涌現(xiàn)復(fù)雜性度量標(biāo)準(zhǔn):系統(tǒng)因果貢獻(xiàn)(causal contributions)在其層級(jí)結(jié)構(gòu)中的分布范圍有多廣。
關(guān)鍵詞:因果涌現(xiàn),復(fù)雜系統(tǒng)
Erik Hoel丨作者
羅云丨譯者
趙思怡丨審校
![]()
論文題目:Quantifying Emergent Complexity 論文地址:https://www.cell.com/patterns/fulltext/S2666-3899(25)00320-4 發(fā)表時(shí)間:2026年1月9日 發(fā)表期刊:Patterns
目錄
引言:跨尺度復(fù)雜系統(tǒng)的因果挑戰(zhàn)
因果涌現(xiàn)理論的演進(jìn):從CE1.0到CE2.0
充分性與必要性
確定性與簡(jiǎn)并性
CE 2.0中宏觀尺度因果關(guān)系的量化方法
沿微觀宏觀路徑穿越尺度層級(jí)
沿路徑的因果分配
選擇微觀宏觀路徑
涌現(xiàn)復(fù)雜性:多尺度因果貢獻(xiàn)的量化
限制和啟發(fā)
與其他涌現(xiàn)理論的比較分析
公理落地
CE 2.0涵蓋所有宏觀層面的因果關(guān)系
與其他相關(guān)涌現(xiàn)理論的比較
CE2.0的概念含義
結(jié)語(yǔ)
科學(xué)家們通常會(huì)選擇特定尺度來研究系統(tǒng)。一位神經(jīng)科學(xué)家可能追蹤突觸內(nèi)的單個(gè)鈣離子成像,而另一位神經(jīng)科學(xué)家則可能匯總整個(gè)腦區(qū)的腦活動(dòng)。系統(tǒng)建模方式的選擇差異巨大——然而科學(xué)界至今仍缺乏一套完整的理論框架來指導(dǎo)這些選擇。這個(gè)問題不僅具有現(xiàn)實(shí)意義,更是一個(gè)長(zhǎng)期存在的哲學(xué)悖論:微觀尺度如何真正重要?如果它在因果關(guān)系中無關(guān)緊要,那么科學(xué)中的絕大多數(shù)實(shí)體更像是實(shí)用的虛構(gòu)或便利的壓縮,而非真正的因果關(guān)系。
要解決這個(gè)問題,需要認(rèn)真對(duì)待因果分析的細(xì)節(jié),在不同尺度上追蹤因果影響,并建立一個(gè)正式框架來比較各宏觀尺度所能提供的信息。通過運(yùn)用以誤差校正和概率性因果測(cè)量為核心的數(shù)學(xué)工具,涌現(xiàn)理論能幫助科學(xué)家做出更明智的建模選擇,理解某些高層次解釋為何成功,并揭示即使在簡(jiǎn)單系統(tǒng)中也跨越尺度的隱藏結(jié)構(gòu)。其目標(biāo)是構(gòu)建一門關(guān)于尺度本身的科學(xué)——最終將自然界的層級(jí)關(guān)系置于堅(jiān)實(shí)的定量基礎(chǔ)之上。
引言:跨尺度復(fù)雜系統(tǒng)的因果挑戰(zhàn)
復(fù)雜系統(tǒng)跨越多個(gè)尺度運(yùn)作,因而呈現(xiàn)出海量可能的描述方式。[1] 這導(dǎo)致了諸如生物學(xué)領(lǐng)域中“不存在因果關(guān)系的特權(quán)層級(jí)”等論斷。[2] 然而,所有可能的尺度集合——以維度約簡(jiǎn)的形式呈現(xiàn)——即便對(duì)于小型系統(tǒng)也極為龐大,且其中大多數(shù)對(duì)系統(tǒng)因果機(jī)制的描述效果欠佳(例如,將計(jì)算機(jī)邏輯門隨機(jī)粗粒化處理)。
這種多重性的尷尬局面要求建立一個(gè)形式化的涌現(xiàn)數(shù)學(xué)理論。該理論應(yīng)當(dāng)解釋并量化宏觀尺度(基于維度約簡(jiǎn)的系統(tǒng)高層次描述)如何促成系統(tǒng)的因果運(yùn)作,以及哪些宏觀尺度具有因果相關(guān)性。涌現(xiàn)理論甚至可能解釋科學(xué)本身時(shí)空層次結(jié)構(gòu)的形成,超越其僅作為有用壓縮的功能。[3]
或許有人會(huì)提出異議,認(rèn)為科學(xué)中不存在涌現(xiàn)現(xiàn)象,因?yàn)槿魏谓o定系統(tǒng)的未來都可能在完全掌握其微觀尺度的情況下被預(yù)測(cè),而任何給定系統(tǒng)都可能被還原到其微觀尺度。然而,預(yù)測(cè)并不等同于因果關(guān)系。[4] 以恒溫器與房間系統(tǒng)為例說明。[5,6]盡管理論上房間內(nèi)所有單個(gè)粒子的微觀狀態(tài)都可以用來預(yù)測(cè)恒溫器的讀數(shù),但從因果理解的角度來看,這并不能很好地回答“是什么導(dǎo)致恒溫器顯示20℃?”這個(gè)問題。事實(shí)上,所有粒子的確切微觀狀態(tài)并非該讀數(shù)的因果必要條件,因?yàn)樵S多其他配置都可能導(dǎo)致相同讀數(shù)。與此同時(shí),宏觀狀態(tài)(房間溫度)與恒溫器讀數(shù)存在直接因果關(guān)系,因?yàn)槿魏谓o定數(shù)值都必須依賴于宏觀狀態(tài)。
另一個(gè)例子中,神經(jīng)元樹突接收到的輸入信號(hào)可用于預(yù)測(cè)下游動(dòng)作電位的發(fā)生。然而在因果分析中,該輸入信號(hào)不足以觸發(fā)(作為效應(yīng))某些精確的離子交換,因?yàn)檫@種交換會(huì)因布朗運(yùn)動(dòng)[7]或量子效應(yīng)[8]等噪聲因素而不可預(yù)測(cè)地演變。與此同時(shí),輸入信號(hào)仍可能確定性地足以觸發(fā)(作為效應(yīng))下游神經(jīng)元的宏觀狀態(tài)“放電”,而無需考慮其底層微觀細(xì)節(jié)。
基于這些直覺,Erik Hoel和Larissa Albantakis, Giulio Tononi于2013年提出了因果涌現(xiàn)理論。該理論采用離散因果模型(包括邏輯門網(wǎng)絡(luò)、有向無環(huán)圖和馬爾可夫鏈)以及因果性度量指標(biāo)——有效信息(EI)。該理論提供了一套工具集,通過搜索此類系統(tǒng)所有可能的維度縮減方案,尋找能使EI最大化的方案(其中EI的評(píng)估方法是:通過do(x)算子將系統(tǒng)擾動(dòng)至所有可能狀態(tài),然后計(jì)算干預(yù)措施的概率分布與其效應(yīng)概率分布之間的互信息)。將宏觀尺度與EI最大增幅等同,量化了系統(tǒng)中因果涌現(xiàn)的程度。
因果涌現(xiàn)揭示了為何系統(tǒng)宏觀尺度雖可還原為底層微觀尺度,卻能形成更強(qiáng)的因果關(guān)系:由于宏觀尺度具有多重可實(shí)現(xiàn)性,其可最小化因果關(guān)系中的不確定性,而這種不確定性正是EI等因果性度量所敏感的。從數(shù)學(xué)角度而言,這類似于通過信息通道編碼可最小化通信噪聲的原理。[3,10]
因果涌現(xiàn)理論自提出以來已催生大量研究,例如在從原胞自動(dòng)機(jī)[12]到功能磁共振成像(fMRI)數(shù)據(jù)[13]再到基因調(diào)控網(wǎng)絡(luò)[14,15]的各類數(shù)據(jù)中測(cè)量因果涌現(xiàn)現(xiàn)象,以及開發(fā)啟發(fā)式方法[16],如利用訓(xùn)練過的人工神經(jīng)網(wǎng)絡(luò)檢測(cè)因果涌現(xiàn)[17]。該理論與網(wǎng)絡(luò)理論中的無標(biāo)度性和魯棒性等現(xiàn)象相關(guān)聯(lián)[18,19],并在整合信息理論框架內(nèi)得到應(yīng)用[20,21]。此外,學(xué)界還提出了量化因果涌現(xiàn)的替代測(cè)量方法,例如利用系統(tǒng)動(dòng)力學(xué)可逆性來近似估計(jì)涌現(xiàn)指數(shù)(EI)[22]。關(guān)于該領(lǐng)域的全面綜述,可參閱Yuan等人的研究[23]。
然而,因果涌現(xiàn)理論的初始版本(以下簡(jiǎn)稱CE 1.0)因兩個(gè)懸而未決的問題而未能完善。第一個(gè)問題是是依賴于有效信息(EI)及其近似值來檢測(cè)因果涌現(xiàn)。盡管EI是因果關(guān)系相對(duì)完善的測(cè)量工具,[24}但其計(jì)算過程中存在背景假設(shè)(例如要求干預(yù)措施呈均勻分布,這一點(diǎn)已受到部分學(xué)者的質(zhì)疑)。[25–27] 此外,正如結(jié)論部分所示,使用EI實(shí)際上會(huì)低估因果涌現(xiàn)的程度。
第二個(gè)問題是,CE 1.0僅識(shí)別出單一因果相關(guān)尺度(即EI的最大值),而忽略了所有多尺度結(jié)構(gòu)。然而,許多系統(tǒng)似乎在不同尺度上運(yùn)作;一個(gè)顯著的例子是大腦的不同功能尺度,從神經(jīng)元到皮層微柱,再到整個(gè)腦區(qū)。[28] 另一個(gè)例子是計(jì)算機(jī)如何在硬件電路的微觀尺度、機(jī)器代碼軟件的中觀尺度、以及操作系統(tǒng)和應(yīng)用程序的宏觀尺度上被描述[29];事實(shí)上,甚至發(fā)生的計(jì)算也可能因描述尺度的不同而發(fā)生變化。[30,31]
為構(gòu)建一個(gè)能解決這些問題的普適性且根基扎實(shí)的因果涌現(xiàn)理論,本文提出了一種新型形式化方法:因果涌現(xiàn)2.0(CE 2.0)。CE 2.0的核心理念在于:系統(tǒng)并非受限于單一描述尺度,而應(yīng)通過所有參與系統(tǒng)因果運(yùn)作的尺度集合來全面描述。任何單一尺度(即便是微觀尺度)都如同對(duì)三維物體進(jìn)行二維截取,因此無法完整捕捉系統(tǒng)的因果關(guān)系。CE 2.0通過構(gòu)建跨尺度因果分配框架,檢測(cè)各尺度對(duì)多尺度整體的因果貢獻(xiàn)(若存在)。該理論通過定義一條自上而下的系統(tǒng)尺度路徑,沿此路徑分配系統(tǒng)運(yùn)作的因果關(guān)系。
CE 2.0理論以公理化的因果關(guān)系概念為基礎(chǔ),而非像CE 1.0中的EI(涌現(xiàn)性指數(shù))那樣作為獨(dú)立指標(biāo)。這種設(shè)計(jì)使理論能夠全面捕捉宏觀層面的所有因果關(guān)系,并以前所未有的方式揭示和量化系統(tǒng)在多尺度間的因果結(jié)構(gòu)。這種新型的跨尺度系統(tǒng)運(yùn)作分類法催生了一個(gè)創(chuàng)新指標(biāo)——涌現(xiàn)復(fù)雜性:衡量系統(tǒng)因果機(jī)制在不同尺度間的分布廣度,其中包含多個(gè)貢獻(xiàn)尺度的系統(tǒng)具有更高的復(fù)雜性。
在下文中,文章將系統(tǒng)闡述CE 2.0理論框架:首先定義一個(gè)具有公理性質(zhì)且不受背景假設(shè)影響的因果關(guān)系概念;繼而運(yùn)用該概念計(jì)算模型馬爾可夫鏈粗粒度尺度中的宏觀因果程度,從而量化其因果涌現(xiàn)程度;接著詳細(xì)說明如何通過跨越不同尺度集合的路徑分配因果貢獻(xiàn);進(jìn)一步探討該方法如何自然形成涌現(xiàn)復(fù)雜性的概念。最后,文章將CE 2.0理論與其它相關(guān)涌現(xiàn)理論進(jìn)行直接對(duì)比,既彰顯其優(yōu)勢(shì),又闡明其概念內(nèi)涵。
因果涌現(xiàn)理論的演進(jìn):從CE 1.0到CE 2.0
充分性與必要性
科學(xué)家們通過提煉和提取研究對(duì)象的因果知識(shí)來深化認(rèn)知。[32] 在因果關(guān)系的科學(xué)理解方面取得的突破性進(jìn)展包括:R·A·費(fèi)希爾對(duì)隨機(jī)對(duì)照試驗(yàn)的系統(tǒng)化構(gòu)建,[33] 以及朱迪婭·珀?duì)柦谔岢龅膁o(x)算子。[11]
許多研究者提出了特定的概率性因果度量方法,用以量化因果關(guān)系的強(qiáng)度。這類度量指標(biāo)的定義方式多樣,例如衡量特定原因的影響力、特定因果關(guān)系的強(qiáng)度、某一變量對(duì)另一變量的因果控制程度等。應(yīng)用此類因果度量時(shí),需先建立因果模型,再通過反事實(shí)假設(shè)[34]或干預(yù)措施[11]來區(qū)分因果知識(shí)與單純觀察結(jié)果。
近期一項(xiàng)針對(duì)不同學(xué)者提出的十余種概率因果性測(cè)量方法的分析研究[27]表明,在科學(xué)文獻(xiàn)中存在因果一致性:從心理學(xué)到統(tǒng)計(jì)學(xué)再到哲學(xué)[35],這些跨領(lǐng)域獨(dú)立引入的因果性測(cè)量方法,均以兩個(gè)基本術(shù)語(yǔ)為基礎(chǔ)。這些術(shù)語(yǔ)被稱為“因果基元”[27]——更常見的稱謂是充分性與必然性。這種一致性適用于從哲學(xué)家大衛(wèi)·劉易斯[34]提出的測(cè)量方法,到數(shù)學(xué)家朱迪婭·珀?duì)朳11]提出的測(cè)量方法,再到Erik Hoel研究團(tuán)隊(duì)近期對(duì)實(shí)際因果關(guān)系的定義[36]。這些原語(yǔ)被多次獨(dú)立重新發(fā)現(xiàn),構(gòu)成了任何因果性測(cè)量方法的公理基礎(chǔ),并確保不同測(cè)量方法在數(shù)學(xué)行為上具有顯著重疊。最終,每個(gè)術(shù)語(yǔ)都代表了不確定性的逆向:充分性是指在給定原因的情況下對(duì)結(jié)果的確定性,而必然性則是指在給定結(jié)果的情況下對(duì)原因的確定性。
如后文所示,充分性與必然性的因果基元在信息論層面具有更廣義的表述,即決定論與簡(jiǎn)并性。CE 2.0正是基于這些原語(yǔ)及其進(jìn)一步的廣義化而構(gòu)建的。
首先,為了形式化地定義因果基元,需要一些術(shù)語(yǔ)。對(duì)于像馬爾可夫鏈、有向無環(huán)圖或邏輯門集這樣的離散系統(tǒng),評(píng)估因果基元(以下簡(jiǎn)稱CP)涉及指定與系統(tǒng)相關(guān)的抽象空間Ω,該空間定義了納入因果分析的事件集合(例如狀態(tài)、事件、變量等)。然后,對(duì)于任何事件(如狀態(tài)轉(zhuǎn)換),我們可以定義潛在原因C?Ω和潛在影響E?Ω。
由于理論將在模擬馬爾可夫鏈中具體化,這里Ω僅指系統(tǒng)的狀態(tài)空間。事件即為狀態(tài)轉(zhuǎn)移,因?yàn)閷?duì)于馬爾可夫鏈而言,系統(tǒng)總是存在某個(gè)先前狀態(tài)c及其影響e,即下一個(gè)狀態(tài)。這些轉(zhuǎn)移各自具有一定的概率P。
給定一個(gè)事件(此處為狀態(tài)轉(zhuǎn)換),則該原因的充分性即為
suff(e; c) = P(e|c)
隨著c更可能引發(fā)e的概率增加,該值也隨之上升,并在c完全足以導(dǎo)致e時(shí)達(dá)到1。
原因的必要性是
nec(e; c) = 1 ? P(e|C; ?c)
該公式用于計(jì)算事件e在無條件事件c發(fā)生時(shí)的概率。具體而言,當(dāng)系統(tǒng)中存在一組原因C,且在該組原因中c本身未發(fā)生時(shí),事件e的概率的倒數(shù)是多少?當(dāng)存在多個(gè)共同原因時(shí),該概率較低;只有當(dāng)c是e的絕對(duì)必要條件時(shí)(即C組中其他成員均無法導(dǎo)致e的發(fā)生),該概率才為1(在馬爾可夫鏈中,這意味著下一時(shí)間步中不存在其他狀態(tài)能導(dǎo)致狀態(tài)e)。
由于研究目標(biāo)是對(duì)比整套量表間的因果關(guān)系,術(shù)語(yǔ)“充分性”與“必要性”(及其聯(lián)合描述CP)將特指所有t到t+1過渡的系統(tǒng)平均值。該平均值按各過渡概率P(e∣c)加權(quán),給定條件概率P(C)。
在因果分析中,P(C)并非刻意設(shè)定為觀測(cè)分布。[37] P(C)的選擇可理解為確定可行的反事實(shí)集合,或等效地,指明系統(tǒng)因果模型中可能的干預(yù)措施集合。[10,37] 由于后續(xù)數(shù)值將在由轉(zhuǎn)移概率矩陣(TPM)及其狀態(tài)轉(zhuǎn)移(從t到t+1)定義的馬爾可夫鏈中計(jì)算,此處P(C)表示在給定系統(tǒng)尺度下,整個(gè)狀態(tài)集合的均勻分布。
從概念上說,這僅僅意味著在評(píng)估其他狀態(tài)的因果關(guān)系時(shí),量表中的各個(gè)狀態(tài)被視為同等有效的干預(yù)措施或反事實(shí)條件。例如,對(duì)于具有p=1自循環(huán)的COPY門,這意味著在P(C)中我們同等看待0和1這兩個(gè)狀態(tài),因此可以正確地說:狀態(tài)COPY=1(在t時(shí)刻)是狀態(tài)COPY=1(在t+1時(shí)刻)的充分必要條件(需要注意的是,在觀測(cè)分布下,這樣的判斷是不可能的)。
確定性與簡(jiǎn)并性
充分性與必要性各自具有信息論的廣義表述:系統(tǒng)的確定性與簡(jiǎn)并性。[9]
具體而言,確定性是狀態(tài)轉(zhuǎn)移概率分布中噪聲(或隨機(jī)性)的逆向概念,因此可視為充分性條件在信息論層面的推廣。對(duì)于個(gè)體原因c,其可定義為基于該原因在系統(tǒng)效應(yīng)集合E上轉(zhuǎn)移概率分布熵的系數(shù)(歸一化范圍為[0,1]):
![]()
其中中心熵項(xiàng)為
![]()
下文所稱“確定性”特指系統(tǒng)整體決定系數(shù),該系數(shù)為在給定條件P(C)下,個(gè)體原因決定性平均值。當(dāng)TPM(轉(zhuǎn)移概率矩陣)僅含“獨(dú)熱”行時(shí),決定論效應(yīng)達(dá)到最大;若所有行均為均勻分布(即轉(zhuǎn)移過程隨機(jī)發(fā)生),則該系數(shù)為零。
“簡(jiǎn)并性”亦是系統(tǒng)層面的簡(jiǎn)并系數(shù),其定義為在給定先驗(yàn)分布P(C)的前提下,全效應(yīng)集合P(E)的概率分布熵的倒數(shù),該先驗(yàn)分布反映了一組干預(yù)措施或潛在反事實(shí)情況:
![]()
當(dāng)原因具有多種相似效應(yīng)時(shí),簡(jiǎn)并性較高;而當(dāng)所有原因均具有唯一效應(yīng)時(shí),簡(jiǎn)并度為零。在馬爾可夫鏈中,一個(gè)完全確定且非簡(jiǎn)并的系統(tǒng)是指每個(gè)狀態(tài)以概率p=1轉(zhuǎn)移至某個(gè)唯一下一狀態(tài)且無重疊(即置換矩陣)的系統(tǒng)。簡(jiǎn)并度作為必要性的包容逆,其作用在于:
![]()
其中P(e∣C)是必要性計(jì)算P(e∣C,?c)中心項(xiàng)的包含形式。該計(jì)算并非直接移除原因(?c),而是針對(duì)任意給定的e,從P(C)的完整集合中,計(jì)算導(dǎo)致該e的所有可能原因的總體必要性。
為避免因逆向關(guān)系導(dǎo)致的語(yǔ)言混淆(因低簡(jiǎn)并度表明更強(qiáng)的因果關(guān)系),本研究在計(jì)算過程中常將簡(jiǎn)并度逆向轉(zhuǎn)換為特異性,其數(shù)值越大表明因果關(guān)系越強(qiáng)。
specificity=1-degeneranc
綜上所述:從其由相同基本概率項(xiàng)構(gòu)成的結(jié)構(gòu)可以看出,決定論本質(zhì)上是充分條件的歸一化熵,而簡(jiǎn)并性本質(zhì)上是必要條件的歸一化熵(作為其逆向且包含計(jì)算的結(jié)果)。
因果基元及其泛化形式對(duì)因果模型中因果關(guān)系的不確定性具有敏感性,當(dāng)不確定性降低或增加時(shí),其行為表現(xiàn)相似,這使其成為檢測(cè)宏觀因果關(guān)系的合適基礎(chǔ)。在補(bǔ)充信息中的注釋S1中,通過系統(tǒng)內(nèi)概率分布的模擬,展示了其敏感性與相似性。
CE 2.0中宏觀尺度因果關(guān)系的量化方法
CE 2.0將宏觀因果關(guān)系定義為:當(dāng)系統(tǒng)宏觀尺度上的因果基元(CPs)共同增強(qiáng)時(shí),表明該宏觀尺度降低了因果關(guān)系的不確定性。需注意,并非所有維度縮減都會(huì)帶來宏觀尺度的CP增益——許多案例會(huì)導(dǎo)致增益歸零甚至下降(即因果縮減現(xiàn)象)。為識(shí)別正向增益,CE 2.0采用有序的微觀→宏觀路徑,遍歷系統(tǒng)各尺度層級(jí),揭示其多尺度結(jié)構(gòu)。系統(tǒng)中因果涌現(xiàn)的程度,即微觀→宏觀路徑上CP的總增益,代表所有尺度宏觀因果關(guān)系的總和。隨后將因果關(guān)系沿路徑分配,追蹤各尺度的正向因果貢獻(xiàn)(即其增強(qiáng)CP的程度)。
沿微觀→宏觀路徑穿越尺度層級(jí)
宏觀態(tài)在CE 2.0中被定義為系統(tǒng)經(jīng)過維度約簡(jiǎn)后的結(jié)果。對(duì)于給定的馬爾可夫鏈S及其關(guān)聯(lián)的表觀馬爾可夫過程(TPM)——后者代表微觀尺度,系統(tǒng)SM被定義為具有自身關(guān)聯(lián)TPM的新系統(tǒng),其中宏觀態(tài)替代了一組微觀態(tài),且給定宏觀態(tài)之間的轉(zhuǎn)換是底層微觀態(tài)的匯總統(tǒng)計(jì)量。
為簡(jiǎn)化說明,本文僅考慮微觀態(tài)的粗粒化降維方法。這種粗粒化處理會(huì)產(chǎn)生如(0,1,2)、(3)等宏觀尺度,這表明在某些四態(tài)系統(tǒng)中,微觀態(tài)(0,1,2)已被粗粒化為宏觀態(tài),而(3)則保持其微觀尺度特性。該方法沿襲了因果涌現(xiàn)理論的既有研究(關(guān)于如何基于微觀尺度TPM的粗粒化推導(dǎo)宏觀尺度TPM的完整方法,可參閱霍爾等人及克萊因等人的研究)。[9,18]
所有粗粒化處理均經(jīng)過驗(yàn)證,以確保其作為微觀尺度精確描述的有效性;具體而言,與Klein等人[18]的研究類似,每個(gè)宏觀尺度的動(dòng)態(tài)一致性均經(jīng)過檢查,不一致的宏觀尺度被剔除(參見補(bǔ)充信息中的注釋S2)。需注意的是,CE 2.0也可應(yīng)用于其他類型的維度約簡(jiǎn)方法,如粗粒化、黑箱化[10,38]或高階宏觀態(tài)[1
微觀到宏觀路徑是指從微觀尺度逐步提升至最終宏觀尺度的有效(即動(dòng)態(tài)一致)尺度集合,該宏觀尺度作為路徑的終點(diǎn)。從概念上說,路徑本質(zhì)上是描述系統(tǒng)中哪些粗粒度元素“正在”跨越層級(jí)結(jié)構(gòu)向其他粗粒度元素過渡。路徑中的每個(gè)步驟都是所有可能尺度集合中的一個(gè)“切片”,微觀到宏觀路徑從底層(完整維度)向頂層(最終維度縮減)遍歷這些切片。
在假設(shè)的四態(tài)系統(tǒng)中,(0,1),(2),(3)的粗粒度狀態(tài)會(huì)沿著路徑演化為低維的(0,1,2),(3)粗粒度狀態(tài)。在此演化過程中,微觀態(tài)(0)和(1)首先會(huì)被合并為單一宏觀態(tài)(0,1),隨后進(jìn)一步合并為(0,1,2)。從微觀尺度出發(fā),該系統(tǒng)完整的微觀→宏觀演化路徑可能為:(0),(1),(2),(3) → (0,1),(2),(3) → (0,1,2),(3) → (0,1,2,3),最終所有狀態(tài)均被合并為單一宏觀態(tài)。從形式上說,這可以表述為:
![]()
其中每個(gè)π(i)是原始n個(gè)微觀狀態(tài)的某個(gè)有效劃分(代表一個(gè)粗粒度),而π(i+1)則是π(i)下一個(gè)粗粒度,最終終止于終點(diǎn)劃分π(k)。
以圖1所示的8狀態(tài)馬爾可夫鏈為例,我們繪制了選定的微觀→宏觀路徑。路徑上的進(jìn)展通過顏色傳染效應(yīng)在圖1中呈現(xiàn)。從(0),(1),(2),(3),(4),(5),(6),(7)開始,路徑上經(jīng)過粗粒化處理的微觀狀態(tài)會(huì)逐步變?yōu)橄嗤伾敝两K點(diǎn)(0),(1,2,3,4,5,6,7)——此時(shí)除(0)外,所有微觀狀態(tài)均已完成粗粒化處理。
![]()
圖1:微觀→宏觀路徑路徑可視化
以一個(gè)八狀態(tài)馬爾可夫鏈為例(其轉(zhuǎn)移概率以灰度表示,TPM詳見圖2A)。該模型從(0),(1),(2),(3),(4),(5),(6),(7)的完整分區(qū)(微觀尺度)開始,各狀態(tài)通過粗粒化處理合并,每個(gè)后續(xù)分區(qū)對(duì)應(yīng)路徑中的一個(gè)步驟(即系統(tǒng)中的一個(gè)尺度),最終終止于(0),(1,2,3,4,5,6,7)。當(dāng)狀態(tài)沿選定路徑發(fā)生顏色變化時(shí)(即顏色傳染現(xiàn)象),表示微觀狀態(tài)正融入更大的宏觀狀態(tài)。
沿路徑的因果分配
通過因果分配方案,可獲得沿路徑各尺度上因降維導(dǎo)致的CP增益分布。具體而言,對(duì)于系統(tǒng)及選定的微觀→宏觀路徑,CE2.0會(huì)計(jì)算路徑中每一步相對(duì)于前一尺度的增益 ΔCP 。
具體而言,對(duì)于給定的尺度(路徑中的每個(gè)步驟),CP值是宏觀尺度(或路徑起始時(shí)的微觀尺度)的充分性與必要性的總和——隨后從該值中減去1以獲得[0,1]范圍內(nèi)的邊界值。同樣地,每個(gè)步驟的確定性與特異性CP值也通過相加后減去1進(jìn)行計(jì)算(使該值等同于CE 1.0[9]中的有效性)。
通過8狀態(tài)馬爾可夫鏈展示了路徑上的 ΔCP 計(jì)算過程,其起始微觀狀態(tài)TPM如圖2A所示。該系統(tǒng)具有直觀的宏觀狀態(tài),表現(xiàn)為微狀態(tài)(4、5、6、7)之間的等價(jià)類,這些微狀態(tài)均具有相同的轉(zhuǎn)移概率分布。其連接性(狀態(tài)轉(zhuǎn)移)與圖1所示一致,并采用相同的微→宏觀路徑。
值得注意的是,在該系統(tǒng)中,CP(連續(xù)路徑)在宏觀尺度(4,5,6,7)被粗粒化為具有自環(huán)的單一宏觀狀態(tài)(該宏觀尺度的TPM如圖2B所示,圖2C為可視化呈現(xiàn))前持續(xù)保持增益。隨后,路徑立即轉(zhuǎn)入零增益區(qū)域(如圖2D所示)。
從確定性與特異性角度分析,微觀尺度的確定性參數(shù)(CP)初始值為0.66。當(dāng)宏觀尺度進(jìn)入零增益轉(zhuǎn)變前,CP值增加0.33,最終達(dá)到最大值CP=1。這表明在該宏觀尺度下,因果關(guān)系達(dá)到最大確定性且無退化現(xiàn)象,進(jìn)一步的粗粒化處理不再帶來額外增益。因此,該系統(tǒng)的因果涌現(xiàn)程度(CE)為0.33,反映了路徑上的總增益。
選擇微觀→宏觀路徑
在分析系統(tǒng)因果涌現(xiàn)時(shí),可能存在選擇特定路徑的先驗(yàn)原因;然而,通過第一性原理方法亦可識(shí)別出合適的微觀→宏觀路徑。
具體而言,微觀尺度到宏觀尺度路徑的終點(diǎn)可選擇為能實(shí)現(xiàn)最大因果涌現(xiàn)(CP)總增益的宏觀尺度。若存在多個(gè)可能終點(diǎn)并列最高增益時(shí),代表維度降低量最小的宏觀尺度即為最優(yōu)終點(diǎn),因其表明超過該點(diǎn)后維度降低不再帶來CP增益。確定終點(diǎn)后,需分析 ΔCP 的最具信息量的微觀→宏觀路徑,即從微觀尺度到終點(diǎn)宏觀尺度(一致性定義見補(bǔ)充信息注釋S2)中跨越所有一致宏觀尺度的最長(zhǎng)路徑。
作為終點(diǎn)的宏觀尺度可通過暴力搜索法確定:首先生成所有可能的宏觀尺度,剔除不一致的,計(jì)算其CP值,最終選擇CP值與維度最高的宏觀尺度作為路徑終點(diǎn)。
實(shí)際上,這種方法對(duì)大型系統(tǒng)并不適用,因此需要采用啟發(fā)式方法。一種方法是沿路徑進(jìn)行粗粒度處理,直到達(dá)到收益遞減的臨界點(diǎn)。具體來說,路徑上的每個(gè)步驟都會(huì)產(chǎn)生增量收益序列。當(dāng)滿足(某個(gè)小閾值 ε >0)或 比值在較長(zhǎng)路徑長(zhǎng)度上持續(xù)下降時(shí),系統(tǒng)在步驟i*進(jìn)入“邊際效益遞減”狀態(tài)。
換言之,當(dāng) ΔCP 變得微不足道(低于 ε)或在路徑的相當(dāng)長(zhǎng)段持續(xù)逐步縮小時(shí),這標(biāo)志著收益遞減的轉(zhuǎn)折點(diǎn),也預(yù)示著一個(gè)不會(huì)大幅降低CP的近似終點(diǎn)。但需注意,不能僅因選擇過小的 ε 或過長(zhǎng)的路徑長(zhǎng)度就簡(jiǎn)單停留在局部最大值(參見局限性與啟發(fā)式方法),以準(zhǔn)確評(píng)估收益遞減。
在定義路徑或宏觀尺度之前,若要估算系統(tǒng)中因果涌現(xiàn)量的上限,只需在微觀尺度上測(cè)量CP值即可。該值與1的差距可直接作為因果涌現(xiàn)量的上限,無需跨尺度搜索,便于快速估算。若微觀尺度的CP值顯著低于1,很可能存在某種維度簡(jiǎn)化(如粗粒度處理)使其達(dá)到或接近最大值;因此,微觀尺度CP值與1的差值可近似反映多數(shù)系統(tǒng)的因果涌現(xiàn)量(但無法確定增益源自哪個(gè)宏觀尺度)。對(duì)于結(jié)構(gòu)足夠復(fù)雜的大型系統(tǒng),可能存在某個(gè)宏觀尺度使CP值趨近1,特別是在考慮高階宏觀態(tài)[18]等完整維度簡(jiǎn)化方案,或放寬一致性假設(shè)時(shí)。
![]()
圖 2沿微→宏路徑的因果基元
(A) 微尺度的TPM,細(xì)胞顏色根據(jù)其概率(p = 1表示深藍(lán)色)進(jìn)行著色。
(B) 宏觀時(shí)間過程的TPM, ΔCP 突然變?yōu)榱恪?/p>
(C) 同一宏觀系統(tǒng)以馬爾可夫鏈形式可視化呈現(xiàn),其中粗粒化宏觀狀態(tài)已標(biāo)注(其自環(huán)ρ=1未顯示)。
(D) 隨著維度降低程度增加,因果基元的變化情況,其中CP的總增益為0.33(以確定性加特異性表示),反映了因果涌現(xiàn)的程度。
涌現(xiàn)復(fù)雜性:多尺度因果貢獻(xiàn)的量化
傳統(tǒng)上,復(fù)雜性科學(xué)領(lǐng)域的主要?jiǎng)訖C(jī)源于一個(gè)定性概念:系統(tǒng)在微觀尺度之外存在直觀的宏觀或介觀結(jié)構(gòu)。用于檢測(cè)宏觀或介觀結(jié)構(gòu)的具體定量方法主要集中于可壓縮性或效率[39],或更近期通過評(píng)估信息論上的意外性[40]。然而,這意味著所檢測(cè)到的介觀尺度可能僅是便利的壓縮形式,且無因果相關(guān)性。
相比之下,通過分析因果貢獻(xiàn)的分布情況,CE 2.0能夠量化系統(tǒng)運(yùn)行中真正具有因果相關(guān)性的涌現(xiàn)復(fù)雜性。具體而言,路徑上每個(gè)步驟的 ΔCP 代表該尺度對(duì)總復(fù)雜度(完全決定系統(tǒng)因果運(yùn)作的總和)的因果貢獻(xiàn),因此可以評(píng)估其在路徑上的分布情況。CE 2.0因此提供了一個(gè)分類體系,用以衡量系統(tǒng)因果運(yùn)作的復(fù)雜程度:如果這些運(yùn)作主要局限于單一尺度(如微觀尺度或被“頭重腳輕”的宏觀尺度主導(dǎo)),則系統(tǒng)屬于簡(jiǎn)單系統(tǒng);而若系統(tǒng)存在具有顯著因果貢獻(xiàn)的中間尺度,則屬于復(fù)雜系統(tǒng)。
為展示CE 2.0的這一新特性,圖3分析了兩個(gè)因果涌現(xiàn)系統(tǒng):一個(gè)缺乏介觀結(jié)構(gòu),另一個(gè)雖具介觀結(jié)構(gòu)但其他方面盡可能相似(關(guān)于后續(xù)分析的算法實(shí)現(xiàn)方式,詳見補(bǔ)充信息注釋S3中的偽代碼)。
圖3A展示了由無明顯介觀結(jié)構(gòu)的直觀宏觀系統(tǒng)組成的TPM,其中(0,1,2,3)和(4,5,6,7)被粗粒化為兩個(gè)相應(yīng)的宏觀態(tài)。實(shí)際上,粗粒化為這兩個(gè)宏觀態(tài)的微觀態(tài)各自構(gòu)成一個(gè)等價(jià)類(可視化結(jié)果見圖3B)。
在微觀到宏觀路徑的每個(gè)尺度上,因果路徑(CP)的增益均被追蹤。值得注意的是,對(duì)于第一個(gè)系統(tǒng),微觀到宏觀路徑上的CP增益主要集中在路徑終點(diǎn)(見圖3C)。這表明其呈現(xiàn)“頭重腳輕”的結(jié)構(gòu)特征,主要由微觀尺度(貢獻(xiàn)總CP的0.14)和兩個(gè)等價(jià)類中大型宏觀尺度終點(diǎn)(貢獻(xiàn)0.18)的因果貢獻(xiàn)構(gòu)成。微觀尺度與宏觀尺度共同解釋了系統(tǒng)CP值的絕大部分(0.41),這量化表明其因果機(jī)制主要受這兩個(gè)尺度支配。
為系統(tǒng)地界定“頂部?jī)?yōu)先”或“底部?jī)?yōu)先”系統(tǒng)與具有顯著中尺度結(jié)構(gòu)系統(tǒng)的分類差異,本文提出“涌現(xiàn)復(fù)雜性(EC)”這一概念。該概念基于路徑長(zhǎng)度L上因果貢獻(xiàn)的熵值。給定每一步(不包括微觀尺度)的增益(i=1,2 ,...,L),則
![]()
這確保了{(lán)p1 ,...,pL}是L步長(zhǎng)上的概率分布。為量化增益的“分散程度”(多尺度特性),需計(jì)算熵值。
![]()
若所有相等(即p為均勻分布),則該值等于log2(L);當(dāng)路徑中少量步驟主導(dǎo)總增益時(shí),該值會(huì)遞減;當(dāng)單一涌現(xiàn)尺度僅由單一因果貢獻(xiàn)構(gòu)成時(shí),該值趨近于零。為比較顯著長(zhǎng)度差異的路徑,這些數(shù)值可通過log2(L)進(jìn)行歸一化處理。
![]()
圖3. 不同尺度下的因果貢獻(xiàn)分析
(A) 無中尺度結(jié)構(gòu)系統(tǒng)的微觀TPM可視化。
(B) 同一系統(tǒng)的可視化呈現(xiàn)。
(C) CE 2.0將該系統(tǒng)的因果貢獻(xiàn)判定為“頂部集中型”,即最后一個(gè)維度的降維貢獻(xiàn)最大。
(D) 具有中尺度結(jié)構(gòu)的類似系統(tǒng)的微觀TPM可視化。
(E) 中尺度系統(tǒng)的可視化呈現(xiàn)。
(F) 因果貢獻(xiàn)向低階維度降維方向偏移,表明該系統(tǒng)具有以多尺度因果結(jié)構(gòu)為主的特點(diǎn),因此展現(xiàn)出更強(qiáng)的涌現(xiàn)性復(fù)雜性。
為展示該方法如何檢測(cè)介觀結(jié)構(gòu),圖3D和3E中建模了類似系統(tǒng),但其變化在于:(0)和(4)在狀態(tài)轉(zhuǎn)移方面可與其他成員區(qū)分開來,它們?cè)诤暧^狀態(tài)終點(diǎn)處與(0,1,2,3)和(4,5,6,7)分別進(jìn)行粗粒化處理。也就是說,對(duì)于該系統(tǒng)而言,對(duì)CP增益貢獻(xiàn)最大的最大維度約簡(jiǎn)并非通過純等價(jià)類實(shí)現(xiàn)。
在這個(gè)中尺度系統(tǒng)中(終點(diǎn)處總復(fù)雜度為0.13,其中(0,1,2,3)和(4,5,6,7)為宏觀狀態(tài)),當(dāng)繪制路徑上的因果貢獻(xiàn)時(shí)(圖3F),可見更早出現(xiàn)的峰值。由于 ΔCP 的這一早期峰值,中尺度系統(tǒng)的涌現(xiàn)復(fù)雜度為2.56比特,而“頂部偏重”系統(tǒng)的涌現(xiàn)復(fù)雜度僅為1.67比特。也就是說,中尺度的顯現(xiàn)取決于 ΔCP 在比終點(diǎn)更高維度處的峰值。
限制和啟發(fā)
CE 2.0模型的一個(gè)局限性在于,其當(dāng)前版本通過預(yù)設(shè)特定的微觀→宏觀路徑來構(gòu)建尺度層級(jí)體系。這種初始設(shè)計(jì)在實(shí)際應(yīng)用和理論層面都具有合理性,畢竟分析時(shí)往往需要單一路徑。但要開發(fā)能整合所有非等量微觀→宏觀路徑的因果分配方案仍需努力,潛在突破口在于運(yùn)用莫比烏斯反演[41]或夏普利值[42]等工具,構(gòu)建覆蓋全部分區(qū)的因果分配框架。
CE 2.0模型面臨的另一個(gè)實(shí)際限制在于,遍歷系統(tǒng)宏觀尺度集合會(huì)導(dǎo)致組合爆炸。針對(duì)CE 1.0[16,17](以及連續(xù)系統(tǒng)[43])已有啟發(fā)式方法,其中最近張等人[22]的研究提出,可采用奇異值分解(SVD)作為精確估算特定宏觀尺度下能量輸入(EI)增益的方法,無需遍歷所有尺度集合,從而避免伴隨的組合爆炸。該研究還強(qiáng)調(diào)了動(dòng)力學(xué)可逆性對(duì)因果涌現(xiàn)的重要性——其動(dòng)力學(xué)可逆性度量與確定性及簡(jiǎn)并性表現(xiàn)出高度相似性,表明因果原語(yǔ)與可逆性存在共同關(guān)聯(lián)。
因此,在本文的補(bǔ)充信息中,研究者探索了一種基于改進(jìn)SVD方法的CE 2.0新啟發(fā)式方法。如S4所述,該方法無需在宏觀尺度上進(jìn)行搜索,即可檢測(cè)所比較系統(tǒng)在限制條件和啟發(fā)式方法上的多尺度結(jié)構(gòu)差異,表明CE 2.0分析(如因果涌現(xiàn)和涌現(xiàn)復(fù)雜性)可在不產(chǎn)生組合爆炸的情況下進(jìn)行估算。
與其他涌現(xiàn)理論的比較分析
作為理論框架,CE 2.0具有三大優(yōu)勢(shì):(1) 它以公理化方式建立在因果分析的基礎(chǔ)術(shù)語(yǔ)之上,且對(duì)分析框架內(nèi)的假設(shè)具有魯棒性;(2) 它能涵蓋宏觀層面所有可能的因果關(guān)系,而CE 1.0則無法做到;(3) 它以創(chuàng)新方式闡明了系統(tǒng)的多尺度因果結(jié)構(gòu),解決了長(zhǎng)期存在的過度決定論與因果排除論之爭(zhēng)。本文將對(duì)這些優(yōu)勢(shì)進(jìn)行深入探討與實(shí)證分析。
公理落地
如前所述,整合信息論(EI)在CE 1.0中的應(yīng)用曾因基于最大熵(均勻)分布[24](此處用P(C)表示)[25,26]而受到質(zhì)疑。核心問題在于CE 1.0需要依賴這一EI假設(shè)來檢測(cè)因果涌現(xiàn)——事實(shí)上,因果涌現(xiàn)理論不應(yīng)依賴于EI計(jì)算背后的假設(shè)。這將同時(shí)影響其實(shí)際應(yīng)用和理論基礎(chǔ)。在某些情況下,例如整合信息論中,最大熵分布可進(jìn)一步解釋為對(duì)系統(tǒng)采取“內(nèi)在視角”的函數(shù)[21],但這需要接受整合信息論的假設(shè),包括其對(duì)意識(shí)的分析。
在CE 2.0中,同樣建議對(duì)P(C)采用均勻分布。這是因?yàn)槿舨辉试SP(C)在不同尺度間存在差異,則意味著宏觀層面的反事實(shí)假設(shè)和干預(yù)措施無法獨(dú)立于其微觀尺度進(jìn)行計(jì)算,這對(duì)大多數(shù)科學(xué)因果模型而言是不合理的(例如,評(píng)估電燈開關(guān)與燈泡之間因果關(guān)系的強(qiáng)度時(shí),需按兩者總原子數(shù)進(jìn)行加權(quán)等)。
然而,與CE 1.0不同,該P(yáng)(C)推薦值并非檢測(cè)因果涌現(xiàn)的必要條件。事實(shí)上,宏觀層面的CP增益已被證明對(duì)P(C)的選擇具有魯棒性——即使在微觀和宏觀層面均采用觀測(cè)分布時(shí),增益程度仍保持一致[27]。這一優(yōu)勢(shì)在圖4中也直觀呈現(xiàn):微觀和宏觀層面的P(C)均為各自尺度的觀測(cè)穩(wěn)態(tài)分布,因此宏觀層面的P(C)本質(zhì)上是微觀層面P(C)的粗粒度表征(即不同尺度間對(duì)干預(yù)分布的描述具有等效性)。盡管如此,CE 2.0仍能在這些條件下檢測(cè)宏觀層面的因果關(guān)系。
總體而言,CE 2.0在理論層面比CE 1.0更具穩(wěn)健性,這得益于其基于因果原語(yǔ)的構(gòu)建——這些原語(yǔ)歷來被證明是因果關(guān)系本質(zhì)的基礎(chǔ)要素,同時(shí)該理論還能在因果分析的多樣化背景假設(shè)中檢測(cè)因果涌現(xiàn)現(xiàn)象。
CE 2.0涵蓋所有宏觀層面的因果關(guān)系
CE 2.0可檢測(cè)CE 1.0框架無法識(shí)別的宏觀因果關(guān)系案例。
這種檢測(cè)方法的實(shí)例展示在一個(gè)由兩個(gè)等價(jià)類構(gòu)成的8態(tài)系統(tǒng)中,該系統(tǒng)在微觀尺度上表現(xiàn)為“塊狀模型”(見圖4A左圖)。系統(tǒng)設(shè)定單一宏觀尺度,其中兩個(gè)等價(jià)類各自被粗粒化為帶有自環(huán)的宏觀態(tài),其粗粒度表示為(0,1,2,3),(4,5,6,7)。通過CE 1.0方法基于宏觀尺度能量增益計(jì)算的因果涌現(xiàn),以及通過CE 2.0方法基于宏觀尺度耦合增益計(jì)算的因果涌現(xiàn),均在該系統(tǒng)的調(diào)控過程中得到呈現(xiàn)。
從圖4A(左)所示的初始TPM開始,研究團(tuán)隊(duì)對(duì)每個(gè)狀態(tài)si在等價(jià)類中的概率進(jìn)行調(diào)整。經(jīng)過50個(gè)步驟后,原本會(huì)轉(zhuǎn)移至等價(jià)類其他成員的概率將逐步疊加到si的自環(huán)概率上,最終達(dá)到p=1。圖4A(中)展示了這一調(diào)整過程的中間狀態(tài),而圖4A(右)則呈現(xiàn)了最終的TPM。該系統(tǒng)通過離散概率重分配步驟,從初始的“塊模型”構(gòu)型逐步演化為具有p=1自環(huán)的8個(gè)微狀態(tài)排列矩陣。
在每個(gè)步驟中,CE 1.0的計(jì)算結(jié)果均基于等效性指數(shù)(EI)展示,并與CE 2.0中CP增益的對(duì)比結(jié)果進(jìn)行對(duì)照,最終以選定的固定宏觀尺度作為終點(diǎn)。出人意料的是,CE 1.0的EI檢測(cè)并未發(fā)現(xiàn)因果涌現(xiàn)現(xiàn)象,即便系統(tǒng)最初被劃分為兩個(gè)等價(jià)類。而從CE 2.0的新視角來看,圖4所示系統(tǒng)在初始階段就存在顯著的宏觀尺度因果關(guān)系。隨著自環(huán)概率的增加和微觀尺度可區(qū)分性的增強(qiáng),這種宏觀尺度因果關(guān)系逐漸減弱,當(dāng)微觀尺度貢獻(xiàn)微乎其微時(shí)徹底消失——直至微觀尺度完全確定且無退化狀態(tài)時(shí),宏觀尺度因果關(guān)系完全消失。
在某些情況下,CE1.0和CE2.0會(huì)重疊(例如,圖4中 ΔCP 轉(zhuǎn)為零前的刻度與通過搜索EI最大值所識(shí)別的刻度相同)。這是因?yàn)镃E1.0和CE2.0在數(shù)學(xué)上存在緊密關(guān)聯(lián),因?yàn)镋I具有如下分解形式:
EI = effectiveness ? log2 n
具體來說,EI可以分解為確定性減去簡(jiǎn)并性(即有效性),再乘以一個(gè)規(guī)模項(xiàng)log2n,這個(gè)規(guī)模項(xiàng)實(shí)際上就是給定尺度的維度(即其狀態(tài)數(shù)量)。[9] 這個(gè)規(guī)模項(xiàng)的存在使得CE 1.0無法清晰分析多尺度結(jié)構(gòu),因?yàn)樗痪邆涑叨炔蛔冃裕虼藷o法追蹤因果關(guān)系在不同尺度間的演變。相比之下,在CE 2.0中,規(guī)模項(xiàng)被移除,從而通過因果分配實(shí)現(xiàn)了對(duì)多尺度結(jié)構(gòu)的恰當(dāng)分析。
雖然CE 2.0聚焦于 ΔCP ,但若需為因果建模或解釋選擇一個(gè)具有高維度的因果相關(guān)尺度,其方法可用于篩選出滿足條件的宏觀尺度:即在最小化維度縮減的同時(shí)最大化因果預(yù)測(cè)(CP)的個(gè)體宏觀尺度。這意味著CE 2.0可用于解答與CE 1.0相同的實(shí)證問題,必要時(shí)還能識(shí)別出具有高維度的單一因果相關(guān)宏觀尺度。這一過程可通過兩種方式實(shí)現(xiàn):一是分析 ΔCP 中的邊際效益遞減規(guī)律(如涌現(xiàn)復(fù)雜性理論所述),二是通過重新引入尺寸項(xiàng)來權(quán)衡CP增益,靈活復(fù)現(xiàn)CE 1.0的分析框架。簡(jiǎn)言之,CE 1.0可通過應(yīng)用CE 2.0框架,以限定目標(biāo)——尋找能平衡高CP與高維度的單一宏觀尺度——來推導(dǎo)得出。
![]()
圖4. CE 1.0無法捕捉所有宏觀因果關(guān)系
(A)在“塊模型”系統(tǒng)中,通過增加各狀態(tài)自環(huán)概率的初始、中期和末期,其等價(jià)類上存在兩個(gè)宏觀狀態(tài)。通過以1/步長(zhǎng)遞增的方式從完整轉(zhuǎn)移概率集中抽離概率,直至微觀尺度完全由自環(huán)概率p=1的狀態(tài)構(gòu)成,實(shí)現(xiàn)概率重分配。
(B)CE 2.0能檢測(cè)宏觀因果關(guān)系,并在概率重分配過程中隨著微觀尺度因果區(qū)分度的提升而合理降低,而EI則無法做到。
與其他相關(guān)涌現(xiàn)理論的比較
學(xué)界曾提出多種檢測(cè)因果涌現(xiàn)(或更廣義的涌現(xiàn)現(xiàn)象)的替代方案,例如通過整合信息分解[44]或考察動(dòng)態(tài)依賴性[45]。但這些方案都依賴互信息的計(jì)算,這對(duì)因果涌現(xiàn)研究存在根本性問題——因?yàn)橐蚬P(guān)系的本質(zhì)特征在于其不依賴于被測(cè)過程的數(shù)據(jù)分布本身[37]。以COPY門循環(huán)為例,互信息的計(jì)算完全取決于初始狀態(tài)的多樣性,卻未能像因果原語(yǔ)那樣準(zhǔn)確反映每個(gè)門對(duì)后續(xù)步驟的充分必要性[22,27]。
近期關(guān)于涌現(xiàn)現(xiàn)象的研究主要聚焦于識(shí)別宏觀尺度與微觀尺度相一致但其動(dòng)態(tài)仍可獨(dú)立描述的案例,例如計(jì)算機(jī)軟件。[29] 這類研究探討了宏觀尺度是否具有“因果閉合性”,即能否被視為自身的原因。這與本文提出的基于隨機(jī)游走的宏觀一致性條件密切相關(guān),此前的研究也存在類似探討。[18] 然而,僅檢查一致性、可壓縮性、因果閉合性等指標(biāo),并不能直接衡量因果涌現(xiàn)現(xiàn)象,因?yàn)檫@些指標(biāo)無法反映宏觀尺度對(duì)系統(tǒng)微觀層面之外因果運(yùn)作的貢獻(xiàn)——這需要某種特定的因果性度量標(biāo)準(zhǔn),或在此處,對(duì)支撐此類度量的因果原語(yǔ)進(jìn)行增益。相反,這些指標(biāo)僅能識(shí)別哪些宏觀尺度是微觀尺度的有效描述,同時(shí)保留其動(dòng)態(tài)特性,因此可視為適當(dāng)?shù)膲嚎s形式。例如,在圖4分析的系統(tǒng)中,預(yù)設(shè)路徑末端的最大維度縮減就是一個(gè)有效的宏觀尺度,完全與其微觀尺度一致,但因果貢獻(xiàn)卻微乎其微。
CE 2.0的概念含義
除微觀物理學(xué)外,所有科學(xué)都隱含著因果涌現(xiàn)的運(yùn)作機(jī)制——其模型、解釋和實(shí)驗(yàn)都默認(rèn)宏觀實(shí)體的存在,并認(rèn)為這些實(shí)體能有效解釋系統(tǒng)的因果運(yùn)作。這種觀點(diǎn)與普遍還原論的名義承諾相矛盾,后者似乎暗示所有因果力量都會(huì)“消散”至系統(tǒng)底層的微觀尺度[46,47]。這種現(xiàn)象源于因果排除論證[48]:對(duì)于任何給定的宏觀現(xiàn)象,其效應(yīng)也可被描述為底層微觀尺度的成因,從而使得宏觀層面的描述變得多余。
CE 1.0理論徹底顛覆了傳統(tǒng)排除論點(diǎn),指出根據(jù)信息整合理論(EI),宏觀層面具有更強(qiáng)的因果效力。這種類似邏輯構(gòu)成了整合信息理論中排除公設(shè)的基礎(chǔ)(該公設(shè)或許是所有公設(shè)中最具爭(zhēng)議性的[49])。但CE 1.0理論卻得出一個(gè)反直覺結(jié)論:即便宏觀狀態(tài)未完全處于精確等價(jià)類之間,其底層微觀層面仍可能被排除——這一結(jié)果令人意外,且其認(rèn)識(shí)論與本體論層面的含義尚不明確。
相比之下,在CE 2.0框架中,因果排除機(jī)制的處理更為優(yōu)雅。從當(dāng)前對(duì)單一路徑的分析來看,宏觀尺度并不會(huì)凌駕于微觀尺度的因果關(guān)系之上(盡管微觀尺度的因果貢獻(xiàn)仍可能微乎其微)。相反,它們僅通過因果分配模式貢獻(xiàn)額外的因果效力,從而形成更全面的實(shí)體論體系——其中各個(gè)尺度都是高維對(duì)象的損耗性切片,而該高維對(duì)象包含了系統(tǒng)因果運(yùn)作的所有相關(guān)信息。
盡管其他涌現(xiàn)理論常主張某些宏觀特性或定律在原則上無法還原為微觀層面,因此物理學(xué)不具備“因果封閉性”(如安德森等人、埃利斯等人及弗里茨曼等人的研究)[50–52],但這一要求在涌現(xiàn)理論中仍存爭(zhēng)議[53]。相比之下,即使宏觀層面完全可還原為微觀層面(如本文所述模型),因果涌現(xiàn)仍可能發(fā)生,因?yàn)楹暧^層面無論如何都會(huì)降低因果關(guān)系的不確定性。也就是說,即便宏觀層面本身可還原,其在因果原語(yǔ)層面的增益按定義并不成立。這些超越微觀層面的增益來源并不神秘,其基礎(chǔ)在于不確定性降低[10,54],而這又源于宏觀態(tài)的多重可實(shí)現(xiàn)性[3]。
自CE 2.0理論提出以來,系統(tǒng)涌現(xiàn)現(xiàn)象正是通過宏觀尺度不確定性最小化實(shí)現(xiàn)的。由此引出一個(gè)更廣泛的問題:在科學(xué)因果模型及其所代表的系統(tǒng)中,不確定性(無論是噪聲形式還是共同原因)是否僅存在于認(rèn)知層面?要回答這個(gè)問題,需要對(duì)物理學(xué)的科學(xué)終極狀態(tài)等未知領(lǐng)域進(jìn)行推測(cè)[3]。即便是微小的真實(shí)不確定性來源(如非決定論),在混沌系統(tǒng)中也可能被放大,甚至可能存在被證明無法判定的物理系統(tǒng)[55]。即便科學(xué)因果模型中所有內(nèi)在的不確定性最終都被證明僅存在于認(rèn)知層面,這也僅適用于覆蓋整個(gè)宇宙的封閉因果模型——在如此宏大的宇宙尺度因果模型中,由于模型外部不存在可定義的干預(yù)因素,所有因果關(guān)系的概念都將徹底消失[11]。因此,雖然微觀尺度對(duì)因果效應(yīng)的不確定性為零且不存在共同原因(例如置換矩陣)時(shí),因果涌現(xiàn)現(xiàn)象會(huì)消失,但這種條件與科學(xué)中大多數(shù)因果模型存在顯著差異。
結(jié)語(yǔ)
CE 2.0提出了一種概念與數(shù)學(xué)層面均具有創(chuàng)新性的涌現(xiàn)理論,該理論將系統(tǒng)視為多尺度層級(jí)結(jié)構(gòu)。即使在大多數(shù)情況下,單個(gè)尺度(尤其是微觀尺度)也只是高維對(duì)象的切片——但其中僅極少數(shù)尺度具有因果相關(guān)性,該理論能夠識(shí)別這些尺度,從而揭示對(duì)系統(tǒng)因果運(yùn)作至關(guān)重要的層級(jí)結(jié)構(gòu)。
具體而言,該理論揭示了如何通過信息論對(duì)因果原語(yǔ)(充分性和必要性)的概括性增強(qiáng),來測(cè)量宏觀尺度上的因果關(guān)系。這種增強(qiáng)沿著特定路徑發(fā)生,該路徑貫穿系統(tǒng)可能的維度縮減過程。因果涌現(xiàn)是這種增強(qiáng)的總和,而因果貢獻(xiàn)可沿路徑進(jìn)行分配。該理論提出了一種新穎的分類體系:某些系統(tǒng)在因果關(guān)系上呈現(xiàn)“頭重腳輕”特征(如單一宏觀尺度占主導(dǎo)),而其他系統(tǒng)則具有更豐富的中觀結(jié)構(gòu)。涌現(xiàn)復(fù)雜度計(jì)算量化了因果貢獻(xiàn)在尺度層級(jí)中的分布廣度。這些改進(jìn)標(biāo)志著理論從原始版本CE 1.0的重大擴(kuò)展,使其能夠捕捉多尺度結(jié)構(gòu)。CE 2.0還能檢測(cè)CE 1.0無法識(shí)別的宏觀因果關(guān)系,同時(shí)仍可靈活復(fù)現(xiàn)CE 1.0的分析結(jié)果(詳見結(jié)論部分)。
然而,CE 2.0當(dāng)前的算法框架雖然基于單一維度縮減路徑,但仍存在明顯局限。該框架既未明確說明如何在多條路徑間分配資源,又在實(shí)際應(yīng)用中面臨組合爆炸問題(具體偽代碼可參見補(bǔ)充材料中的注釋S3)。不過,如何突破這些局限已成為未來研究的重點(diǎn)方向(關(guān)于無路徑方法的討論可參考其他涌現(xiàn)理論的對(duì)比分析,而CE 2.0分析的啟發(fā)式方法建議詳見注釋S4)。
因果解釋2.0(CE 2.0)在物理學(xué)、生物學(xué)、神經(jīng)科學(xué)和經(jīng)濟(jì)學(xué)等領(lǐng)域具有關(guān)鍵應(yīng)用價(jià)值。特別值得一提的是,基于因果原語(yǔ)在理解復(fù)雜系統(tǒng)因果關(guān)系中的公理重要性,結(jié)合既往研究發(fā)現(xiàn)——深度神經(jīng)網(wǎng)絡(luò)中涌現(xiàn)概念的形成機(jī)制[56],以及人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程中因果結(jié)構(gòu)的變化規(guī)律[57],CE 2.0有望為人工智能可解釋性[58]和人工智能安全性[59]這一新興領(lǐng)域作出貢獻(xiàn),例如通過分析深度神經(jīng)網(wǎng)絡(luò)及其概念的多尺度結(jié)構(gòu)來推動(dòng)相關(guān)研究。
參考文獻(xiàn)
West, G. (2018). Scale: The Universal Laws of Life, Growth, and Death in Organisms, Cities, and Companies (Penguin).
Noble, D. (2011). A theory of biological relativity: No privileged level of causation. Interface Focus 2, 55–64.
Hoel, E. (2024). The World Behind the World: Consciousness, Free Will, and the Limits of Science (Simon & Schuster).
Grasso, M., Albantakis, L., Lang, J.P., and Tononi, G. (2021). Causal reductionism and causal structures. Nat. Neurosci. 24, 1348–1355.
Hoel, E.P. (2018). Agent above, atom below: How agents causally emerge from their underlying microphysics. In Wandering Towards a Goal: How Can Mindless Mathematical Laws Give Rise to Aims and Intention?, A. Aguirre, B. Foster, and Z. Meral, eds. (Springer), pp. 63–76.
Flack, J.C. (2017). Coarse-graining as a downward causation mechanism. Phil. Trans. R. Soc. A. 375, 20160338.
Braun, H.A. (2021). Stochasticity versus determinacy in neurobiology: From ion channels to the question of the ‘‘free will’’. Front. Syst. Neurosci. 15, 629436.
Jedlicka, P. (2017). Revisiting the quantum brain hypothesis: toward quantum (neuro)biology? Front. Mol. Neurosci. 10, 366.
Hoel, E.P., Albantakis, L., and Tononi, G. (2013). Quantifying causal emergence shows that macro can beat micro. Proc. Natl. Acad. Sci. 110, 19790–19795.
Hoel, E. (2017). When the map is better than the territory. Entropy 19, 188.
Pearl, J. (2009). Causality (Cambridge University Press).
Varley, T.F. (2020). Causal emergence in discrete and continuous dynamical systems. Preprint at arXiv. https://doi.org/10.48550/arXiv.2003.13075.
Yang, M., Wang, Z., Liu, K., Rong, Y., Yuan, B., and Zhang, J. (2024). Finding emergence in data by maximizing effective information. Natl. Sci. Rev. 12, nwae279.
Pigozzi, F., Goldstein, A., and Levin, M. (2025). Associative conditioning in gene regulatory network models increases integrative causal emergence. Commun. Biol. 8, 1027.
Hoel, E., and Levin, M. (2020). Emergence of informative higher scales in biological systems: a computational toolkit for optimal prediction and control. Commun. Integr. Biol. 13, 108–118.
Griebenow, R., Klein, B., and Hoel, E. (2019). Finding the right scale of a network: efficient identification of causal emergence through spectral clustering. Preprint at arXiv. https://doi.org/10.48550/arXiv.1908.07565.
Zhang, J., and Liu, K. (2022). Neural information squeezer for causal emergence. Entropy 25, 26.
Klein, B., and Hoel, E. (2020). The emergence of informative higher scales in complex networks. Complexity 2020, 1–12.
Klein, B., Hoel, E., Swain, A., Griebenow, R., and Levin, M. (2021). Evolution and emergence: higher order information structure in protein interactomes across the tree of life. Integr. Biol. 13, 283–294.
Hoel, E.P., Albantakis, L., Marshall, W., and Tononi, G. (2016). Can the macro beat the micro? integrated information across spatiotemporal scales. Neurosci. Conscious. 2016, niw012.
Marshall, W., Findlay, G., Albantakis, L., and Tononi, G. (2024). From micro to macro units: a mathematical framework for identifying the causal grain of a system from its intrinsic perspective. Preprint at bioRxiv. https://doi. org/10.1101/2024.04.12.589163.
Zhang, J., Tao, R., Leong, K.H., Yang, M., and Yuan, B. (2025). Dynamical reversibility and a new theory of causal emergence based on svd. npj Complexity 2, 3.
Yuan, B., Zhang, J., Lyu, A., Wu, J., Wang, Z., Yang, M., Liu, K., Mou, M., and Cui, P. (2024). Emergence and causality in complex systems: A survey of causal emergence and related quantitative studies. Entropy 26, 108.
Balduzzi, D. (2011). Information, learning and falsification. Preprint at arXiv. https://doi.org/10.48550/arXiv.1110.3592.
Eberhardt, F., and Lee, L.L. (2022). Causal emergence: When distortions in a map obscure the territory. Philosophies 7, 30.
Aaronson, S. (2017). Higher-level causation exists (but I wish it didn’t). https://scottaaronson.blog/?p=3294.
Comolatti, R., and Hoel, E. (2025). Consilience in causation: Causal emergence is found across measures of causation. Entropy 27, 825.
Yuste, R. (2015). From the neuron doctrine to neural networks. Nat. Rev. Neurosci. 16, 487–497.
Rosas, F.E., Geiger, B.C., Luppi, A.I., Seth, A.K., Polani, D., Gastpar, M., and Mediano, P.A. (2024). Software in the natural world: A computational approach to emergence in complex multi-level systems. Preprint at arXiv. https://doi.org/10.48550/arXiv.2402.09090.
Go′ mez-Emilsson, A., and Percy, C. (2022). The ‘‘slicing problem’’ for computational theories of consciousness. Open Philosophy 5, 718–736.
Bongard, J., and Levin, M. (2023). There’s plenty of room right here: Biological systems as evolved, overloaded, multi-scale machines. Biomimetics 8, 110.
Beebee, H., Hitchcock, C., Menzies, P.C., and Menzies, P. (2009). The Oxford Handbook of Causation (Oxford Handbooks Online).
Fisher, L.D. (1999). Advances in clinical trials in the twentieth century. Annu. Rev. Public Health 20, 109–124.
Lewis, D. (1973). Causation. J. Philos. 70, 556–567.
Fitelson, B., and Hitchcock, C. (2011). Probabilistic measures of causal strength. In Causality in the Sciences, P.M.I.F. Russo, ed. (Oxford University Press), pp. 600–627.
Albantakis, L., Marshall, W., Hoel, E., and Tononi, G. (2019). What caused what? a quantitative account of actual causation using dynamical causal networks. Entropy 21, 459.
Pearl, J., and Mackenzie, D. (2018). The Book of Why: The New Science of Cause and Effect (Basic Books).
Marshall, W., Albantakis, L., and Tononi, G. (2018). Black-boxing and cause-effect power. PLoS Comput. Biol. 14, e1006114.
Gershenson, C., and Ferna′ ndez, N. (2012). Complexity and information: Measuring emergence, self-organization, and homeostasis at multiple scales. Complexity 18, 29–44.
Marchese, E., Caldarelli, G., and Squartini, T. (2022). Detecting mesoscale structures by surprise. Commun. Phys. 5, 132.
Jansma, A. (2025). Mereological approach to higher-order structure in complex systems: From macro to micro with mo¨ bius. Phys. Rev. Res. 7, 023016.
Winter, E. (2002). The shapley value. In Handbook of Game Theory with Economic Applications, 3 (Elsevier), pp. 2025–2054.
Chvykov, P., and Hoel, E. (2020). Causal geometry. Entropy 23, 24.
Rosas, F.E., Mediano, P.A.M., Jensen, H.J., Seth, A.K., Barrett, A.B., Carhart-Harris, R.L., and Bor, D. (2020). Reconciling emergences: An information-theoretic approach to identify causal emergence in multivariate data. PLoS Comput. Biol. 16, e1008289.
Barnett, L., and Seth, A.K. (2023). Dynamical independence: Discovering emergent macroscopic processes in complex dynamical systems. Phys. Rev. E 108, 014304.
Bontly, T.D. (2002). The supervenience argument generalizes. Philosophical Studies 109, 75–96.
Block, N. (2003). Do causal powers drain away? Philos. Phenomenol. Res. 67, 133–150.
Kim, J. (2000). Mind in a Physical World: An Essay on the Mind-Body Problem and Mental Causation (MIT Press).
Bayne, T. (2018). On the axiomatic foundations of the integrated information theory of consciousness. Neurosci. Conscious. 2018, niy007.
Anderson, P.W. (1972). More is different: Broken symmetry and the nature of the hierarchical structure of science. Science 177, 393–396.
Ellis, G.F.R. (2020). The causal closure of physics in real world contexts. Found. Phys. 50, 1057–1097.
Fritzman, J.M. (2024). Collapsing strong emergence’s collapse problem. Eur. J. Philos. Sci. 14, 24.
Carroll, S.M., and Parola, A. (2024). What emergence can possibly mean. Preprint at arXiv. https://doi.org/10.48550/arXiv.2410.15468.
Liu, K., Yuan, B., and Zhang, J. (2024). An exact theory of causal emergence for linear stochastic iteration systems. Entropy 26, 618.
Cardona, R., Miranda, E., Peralta-Salas, D., and Presas, F. (2021). Constructing turing complete euler flows in dimension 3. Proc. Natl. Acad. Sci. 118, e2026818118.
Ra¨ z, T. (2023). Methods for identifying emergent concepts in deep neural networks. Patterns 4, 100761.
Marrow, S., Michaud, E.J., and Hoel, E. (2020). Examining the causal structures of deep neural networks using information theory. Entropy 22, 1429.
Templeton, A., Conerly, T., Marcus, J., Lindsey, J., Bricken, T., Chen, B., Pearce, A., Citro, C., Ameisen, E., and Jones, A. e. a. (2024). Scaling monosemanticity: Extracting interpretable features from claude 3 sonnet. Transformer Circuits Thread. URL: https://transformer-circuits.pub/2024/ scaling-monosemanticity.
Lazar, S., and Nelson, A. (2023). AI safety on whose terms? Science 381, 138.
Jansma, A., and Hoel, E. (2025). Pymergence: A python toolkit for causal emergence 2.0. Zenodo. https://doi.org/10.5281/zenodo.17210078.
參考文獻(xiàn)可上下滑動(dòng)查看
因果涌現(xiàn)第七季——從理論到應(yīng)用
在神經(jīng)系統(tǒng)中意識(shí)的生成、城市交通的擁堵演化、全球產(chǎn)業(yè)系統(tǒng)的協(xié)同與失穩(wěn)之中,始終潛藏著一條貫穿微觀與宏觀的因果脈絡(luò):個(gè)體行為本身或許簡(jiǎn)單,卻能在尺度躍遷中孕育出高度組織化、難以還原的整體結(jié)構(gòu)。復(fù)雜現(xiàn)象并非微觀規(guī)則的線性疊加,而是源于多尺度動(dòng)力學(xué)作用下逐步形成的因果組織。正是在這一背景下,因果涌現(xiàn)理論被提出,并在因果涌現(xiàn) 2.0、工程化涌現(xiàn)以及多尺度因果抽象等工作中推進(jìn),逐漸發(fā)展出一套融合動(dòng)力學(xué)分析、信息論度量以及譜方法與人工智能工具的研究框架,從而將研究重心從“復(fù)雜性本身”轉(zhuǎn)向“因果結(jié)構(gòu)如何出現(xiàn)、如何被度量并在現(xiàn)實(shí)系統(tǒng)中發(fā)揮作用”。
為系統(tǒng)梳理因果涌現(xiàn)領(lǐng)域的最新進(jìn)展,北京師范大學(xué)系統(tǒng)科學(xué)學(xué)院教授、集智俱樂部創(chuàng)始人張江老師領(lǐng)銜發(fā)起,組織對(duì)該主題感興趣的研究者與探索者共同研讀前沿文獻(xiàn)、交流研究思路。讀書會(huì)將于2026年2月22日起每周日上午(創(chuàng)建讀書會(huì)暫定時(shí)間為10:00-22:00)線上開展,持續(xù)約10周,包含主講分享與討論交流,并提供會(huì)后視頻回放,誠(chéng)邀相關(guān)領(lǐng)域研究者及跨學(xué)科興趣者參與。
![]()
詳情請(qǐng)見:
1.
2.
3.
4.
5.
6.
7.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.