自旋玻璃(spin glass)、自旋冰(spin ice)和量子自旋液体(quantum spin liquid)(之一)
帕里西于 1948 年出生于意大利罗马,爷爷和父亲都是建筑工人,因此家族曾希望他将来做一名工程师。然而,青少年时代的帕里西喜爱阅读科学书籍,被书中复杂的抽象知识所深深吸引。鉴于 20 世纪中叶物理学的蓬勃发展,他决定研究物理,并且深信自己有能力去解决一个具有挑战性的物理问题。大学时,他成为粒子物理学家卡比博(N. Cabibbo)的学生。卡比博因发现“卡比博角”闻名于世,也称得上是诺贝尔奖级别的大
文章目录
- 1. Giorgio Parisi 简介
- 2. 复杂无序系统
- 3. 自旋玻璃简介
- 4. 磁场中的现象
- 5. Edwards-Anderson model
- 6. Sherrington-Kirkpatrick model
- 7. 复本及复本对称破缺(replica symmetry breaking, RSB)
- 8. 复本对称破缺对交叉学科的影响
- 9. 无限范围模型(Infinite-range model)
- 10. 非遍历行为和应用(Non-ergodic behavior and applications)
- 11. 自诱导自旋玻璃(Self-induced spin glass)
- 12. 空腔方法(Cavity method)
2021 年诺贝尔物理学奖得主帕里西在无序系统方面作出开创之举,他提出复本对称破缺方法解决自旋玻璃问题,这一方法也对神经网络等交叉学科产生深厚影响,激发未来对人工智能和人脑等复杂系统的进一步研究。
2021 年,诺贝尓奖委员会决定将物理奖颁发给研究复杂系统的三位科学家,一时引起无数诧异和哗然,这是诺贝尔奖首次颁发给复杂系统研究领域。
帕里西(G. Parisi)因其对无序和随机现象理论的革命性贡献而独享一半奖金,诺贝尔奖委员会给他的颁奖词是“他发现了从原子到行星尺度的物理系统中无序与涨落的相互作用”。帕里西是非常典型的理论物理学家,由于他研究的领域数学物理味道较浓,并且十分抽象,故即使在理论物理圈子里,他也不是那种妇孺皆知的科学家。他的代表性工作包括随机量子化,自旋玻璃理论,界面生长动力学普适类,随机气候模型和鸟群群体运动的涨落标度等。在获得诺贝尔奖之前,他几乎拿遍了作为顶级理论物理学家该拿的所有奖项:玻尔兹曼奖、狄拉克奖、费米奖、丹尼海涅曼数学物理奖、拉斯昂萨格奖、沃尔夫奖等。获奖领域横跨统计力学、粒子物理、数学物理、自旋玻璃等。
1. Giorgio Parisi 简介
帕里西于 1948 年出生于意大利罗马,爷爷和父亲都是建筑工人,因此家族曾希望他将来做一名工程师。然而,青少年时代的帕里西喜爱阅读科学书籍,被书中复杂的抽象知识所深深吸引。鉴于 20 世纪中叶物理学的蓬勃发展,他决定研究物理,并且深信自己有能力去解决一个具有挑战性的物理问题。
大学时,他成为粒子物理学家卡比博(N. Cabibbo)的学生。卡比博因发现“卡比博角”闻名于世,也称得上是诺贝尔奖级别的大师。帕里西后来回忆,他的导师是那个时代罗马最聪明的理论物理学家。1970 年帕里西取得博士学位后,先在弗拉斯卡蒂国家实验室工作了 10 年,之后来到罗马第二大学担任理论物理学教授。1992 年起至今为罗马第一大学的量子理论教授,研究重点是量子场论、统计力学和复杂系统。
2013 年帕里西获得《自然》(Nature)周刊颁发的杰出导师奖时,提到他的导师,说他导师曾经说过,科学研究的目的就是享受解决问题的乐趣,这可能是卡比博留给帕里西最宝贵的财富。帕里西在他的科学生涯中将这句话体验得淋漓尽致!
2. 复杂无序系统
2.1 相变、序参量与对称性破缺
在自然界和日常生活中,我们随处可见相变——物质从一种相变为另一种相。一个最常见的例子就是水:液态水既可以通过降温结成冰,也可以通过加热蒸发为水蒸气。这两个相变过程(液相到固相、液相到气相)都伴随着某些宏观物理量(例如密度)的突变,被称为非连续相变或一级相变。有意思的是,在水的相图上,代表气液相变的线终止于
374
°
C
374\ \degree\mathrm{C}
374 °C 附近(这个终点称为临界点)。在临界点,并没有任何物理量发生不连续的变化,但是某些物理量(如压缩系数)发散,在临界温度之上,气液不可分。物质经过临界点的过程称为连续相变或二级相变。
另一个重要的相变例子是铁磁相变,即磁铁(铁磁相)在升温过程中失去磁性变为顺磁相的过程。首先发现这个现象的是著名物理学家皮埃尔·居里,因而,铁磁相变发生的温度被称为“居里温度”。铁磁相变是一个连续相变,在居里温度处,磁化率发散。
在相变发生的过程中,外界条件(例如温度)是连续变化的,然而物质的状态却可以发生突然的改变,以至于某些物理量发生不连续的变化或者发散。解释这种“神奇”的现象长期以来都是一个让物理学家着迷的问题。
19 世纪 30 年代,前苏联的天才物理学家列夫·朗道提出了“序参量”的概念,并且建立了朗道相变理论。根据朗道理论,相变的过程必然伴随着某种“序”的变化。例如,液态的水分子是杂乱无章地排列的,而一旦结冰,它们就会规则有序地排列在晶格位置(分子会在晶格位置附近振动,但不会远离),因而水结冰的液固相变过程中产生了晶体序。而在铁磁相变的过程中,原子的自旋指向由顺磁相中的随机状态变为指向某一特定方向,因而铁磁相变伴随着自旋指向序的产生,从而导致了材料的宏观磁性(自发磁化)。根据朗道理论,序参量在连续/非连续相变中,分别发生连续/非连续的变化。
相变过程中序的产生对应着某种对称性的破缺。例如,水具有平移和旋转对称性——由于水分子在空间是均匀无序分布的,整个体系在做任意的平移或旋转之后不变,然而一旦水结冰,平移和旋转对称性就破缺了,体系只有在特定的平移或旋转下才能保持不变(要求所有的分子在平移或旋转之后还处在晶格格点上)。类似地,顺磁相具有镜像反演对称性——所有自旋翻转后体系不变,而在铁磁相中这种对称性破缺——镜像反演操作后整个体系的磁化强度会改变符号。基于序参量和对称性破缺,朗道理论揭示了相变这一日常现象的深刻本质。
2.2 复杂系统
1970 年代末期,帕里西的研究兴趣转向无序系统的理论研究,因为这类系统的复杂性深深吸引了帕里西。无序系统理论研究始于 1980 年代,帕里西是先行者之一。
以气体为例,气体中的粒子可以被视为小球,其飞行速度随温度的升高而增加。当温度下降或压力升高时,小球首先液化,然后凝固。形成的固体通常是一种晶体,小球在晶体中以规则的模式排列。然而,如果这种变化发生得很快,小球来不及规则排列,从而形成一种无序的图案,即使液体进一步冷却或挤压在一起,图案也不会改变。如果重复实验,尽管变化以完全相同的方式发生,但是每次都会呈现全新的图案。
3. 自旋玻璃简介
我们可以把这些小球形成的图案看作是玻璃或颗粒材料(如沙子或者砾石)的简化模型。帕里西最初研究的是另一种类似系统——自旋玻璃,这是磁性合金材料的一种亚稳定状态。
3.1 自旋冻结
相互作用产生有序,热运动产生无序。当物质的温度升高时,原子自身的热运动逐渐超过原子之间的相互作用,于是物质宏观上变为顺磁性。而当温度重新降低时,物质将恢复独自的磁性特质。铁磁体材料在高温状态下的磁性特征遵从居里-外斯定律。而当温度降至一定水平(称为相变温度或居里点)后,将快速恢复铁磁性性质。而自旋玻璃材料在高温时虽然也呈现顺磁性,但当温度下降时,复杂的相互作用使得长程有序状态无法形成,各个磁矩被随机地冻结在某个方向,最后呈现无规则的长程无序状态。而这个转变过程是缓和的,就磁化率(测量宏观上磁性到底有多大的量)来说,自旋玻璃材料在温度下降时磁化率先缓慢增高,经过一个峰值后再缓慢下降。达到峰值时的温度也称为“冻结温度”(表示之后开始“冻结”)。
在凝聚态物理中,自旋玻璃是一种以随机性为特征的磁性状态,除了在称为“冻结温度(freezing temperature)” T f T_{f} Tf 的温度下冻结自旋的协同行为(cooperative behavior)。磁自旋(Magnetic spins),粗略地讲,是在三维空间中南北磁极的方向。在铁磁固体中,组成原子的磁自旋都沿同一方向排列。与铁磁体相比,自旋玻璃被定义为“无序”磁性状态,其中自旋随机排列或不以规则模式排列,并且耦合也是随机的。
术语“玻璃”来自自旋玻璃中的磁性无序与常规化学玻璃(例如窗玻璃)的位置无序之间的类比。在用作窗户的玻璃或任何无定形固体中,原子键结构高度不规则;相反,晶体具有均匀的原子键模式。在铁磁固体中,磁自旋都沿同一方向排列;这类似于晶体的晶格结构。
自旋玻璃中的单个原子键是大致相等数量的铁磁键(邻居具有相同的方向)和反铁磁键(邻居具有完全相反的方向:北极和南极翻转 180 度)的混合物。这些对齐和未对齐的原子磁体的模式产生了所谓的阻挫相互作用(frustrated interactions)——与在规则的、完全对齐的固体中看到的相比,原子键的几何形状发生了扭曲。它们还可能产生一种以上的原子几何排列是稳定的情况。
3.2 亚稳态
自旋玻璃是典型的无序系统,在经典统计物理里,自旋可以标记粒子的离散状态,比如向上或向下。一般的磁体中,所有磁矩的自旋都指向同一个方向,其分布是长程有序的。铁磁性材料和反铁磁性材料的磁矩在相变温度以下只有一种排列状态。比如铁磁性材料在低温时所有的磁矩都按着同一个方向排列。这个状态下系统的能量是最低的。要改变这种状态需要较大的能量。而自旋玻璃中处于格点上的自旋的相互作用是完全随机的,这种随机性导致自旋取向出现阻挫效应(frustration effect),即自旋的取向难以满足局部能量最低的要求。自旋玻璃的一个显著特征是宏观平均磁矩消失,但存在自旋玻璃序。这里的“玻璃”一词实际上是长程无序状态的代名词,表示这种无序状态类似于一般的玻璃。
自旋玻璃及其内部出现的复杂内部结构被称为“亚稳态”,因为它们“卡在”稳定的构型中,而不是最低能量构型(可能是对齐的和铁磁性的)。研究这些结构的数学复杂性是很难的,而在实验或模拟领域中获得了丰富的成果。自旋玻璃的概念广泛的应用于物理、化学、材料科学和计算机科学中的人工神经网络。
3.3 磁化弛豫
自旋玻璃材料由于自旋随机冻结,宏观整体的磁化率是 0。然而,自旋玻璃并不像反铁磁性材料一样在低温时对外部磁场产生抵抗,而是像顺磁性材料一样,会被外部磁场磁化。而自旋玻璃不同于顺磁性材料的地方是,它磁化的过程是相对缓慢的。顺磁材料的磁化弛豫时间(从开始到磁化完成的时间)几乎可以忽略不计,但自旋玻璃则需以分钟甚至小时计。同样地,已经磁化后撤除外部磁场,自旋玻璃需要的恢复时间也是缓慢的。
在帕里西关于自旋玻璃的书中的介绍,他写道:研究自旋玻璃就像看莎士比亚的四大悲剧。如果你想跟两个人同时做朋友,但是这两个朋友之间互相敌视,这会让人沮丧。这类场景在古典悲剧中更是突出,如果感情最要好的朋友成为了敌人在同一个舞台上相遇,怎样才能把房间里的紧张氛围降到最低?
3.4 玻璃化和无序系统
伟大的物理理论往往有令人惊叹的普适性,朗道理论也不例外。几乎所有已知的两相之间的转变过程都可以被纳入朗道相变理论的框架。然而,似乎存在一个例外——玻璃化。高温下熔融的二氧化硅液体经过淬火(快速降温)形成石英玻璃,这个过程称为玻璃化。液体和玻璃(固体)在宏观性质上有着显著的不同,然而在微观分子的排列上似乎都是杂乱无章的。类似地,顺磁相也可以通过自旋玻璃相变在低温下变为自旋玻璃相。自旋玻璃没有宏观的自发磁性(类似顺磁),然而所有自旋几乎都是“冻”住、不会随着时间演化而翻转的(类似铁磁)。
如果朗道理论还是正确的,那么玻璃化过程对应了哪种序的产生、以及哪种对称性的破缺?事实上,玻璃态代表了一类复杂体系,称为“无序系统”。无序系统具有不同于简单体系(如气体、液体、顺磁等)的宏观性质,但是微观状态上似乎又是杂乱而没有规律的。这有悖于物理学家对于相变的理解:新相的产生必须有对应序的产生和对称性的破缺。最终,乔治·帕里西提供了答案。而他也因为“找到了无序复杂系统中隐藏的模式”而获得了 2021 年的诺贝尔物理学奖。帕里西的理论基于自旋玻璃模型,而在介绍这个模型之前,我们先需要了解它的“初级版本”——伊辛模型。
3.5 Ising model
伊辛模型(也叫楞次—伊辛模型)是统计物理中最重要的模型之一,最初由德国物理学家威廉·楞次为研究铁磁相变而引入(1920 年)。体系的构成十分简单,即由 N N N 个位于格点上的自旋 s i s_{i} si 周期性排列而成。自旋的方向可以为向上或向下,分别用 s i = + 1 s_{i} = +1 si=+1、 s i = − 1 s_{i} = -1 si=−1 来表示。任意两个相邻的自旋 s i s_{i} si、 s j s_{j} sj 之间有相互作用 − J i j s i s j -J_{ij}s_{i}s_{j} −Jijsisj ,其中 J i j = J J_{ij} = J Jij=J 为常数(一般取 J = 1 J =1 J=1,代表铁磁相互作用)。在没有外磁场的情况下(本文不讨论存在外场的情况),体系的哈密顿量为:
H = − ∑ < i j > J i j s i s j H = -\sum_{\left<ij\right>}J_{ij}s_{i}s_{j} H=−⟨ij⟩∑Jijsisj
其中 < i j > \left<ij\right> ⟨ij⟩ 表示对所有近邻的自旋对求和。伊辛模型可存在两种不同的相,一个是无序的顺磁相( m = 0 m = 0 m=0),另一个则是有序的铁磁相( m > 0 m > 0 m>0 或 m < 0 m < 0 m<0 ),由序参量磁化强度:
m = 1 N < ∑ i = 1 N s i > m =\frac{1}{N}\left<\sum_{i=1}^{N}s_{i}\right> m=N1⟨i=1∑Nsi⟩
表征,其中 < > \left<\right> ⟨⟩ 代表热力学系综平均。物理学家最感兴趣的问题是,从 Ising model 的哈密顿量出发,统计物理理论能否给出顺磁与铁磁之间的相变(即 m m m 从 0 0 0 变到有限值)?
早在 1925 年,楞次的学生恩斯特·伊辛就得到了一维伊辛模型的严格解。他发现,一维伊辛模型不会发生相变——在任意温度下,一维伊辛模型的稳态都是顺磁态。不过,伊辛把这个结论
做了错误的推广,认为在其他维度下,这个模型也没有相变。直到 1944 年,拉斯·昂萨格(1968 年诺贝尔化学奖得主)发表了二维伊辛模型的解析解,严格证明了二维伊辛模型在有限温度下存在二级相变,这也使得二维伊辛模型成为第一个在有限温度下呈现连续相变的模型。1952 年,李政道和杨振宁(1957 年诺贝尔物理学奖得主)提出了李杨相变理论,尝试从数学上解释伊辛模型在热力学极限下(无穷大体系)存在相变的原因。然而,尽管无数伟大的物理学家做了不懈的尝试,目前为止,三维伊辛模型还无法严格求解。
3.6 自旋玻璃模型
自旋玻璃模型与伊辛模型只有一个很“微小”的不同:Ising model 中的自旋 s i s_{i} si、 s j s_{j} sj 间的相互作用 J i j J_{ij} Jij 为随机数(通常为高斯分布或二项式分布)。这个模型是由 Edwards 和 Anderson 二人于 1975 年引入的,因此被称为 Edwards—Anderson 模型(简称 EA 模型)。同年,Sherrington 和 Kirkpatrick 二人引入了 EA 模型的平均场形式,也就是将非近邻自旋间的相互作用也考虑在内,即 Ising model 中的 < i j > \left<ij\right> ⟨ij⟩ 包括所有自旋对,且 J i j J_{ij} Jij 满足高斯分布,
P ( J i j ) = 1 J N 2 π exp [ − N 2 J 2 ( J i j − J 0 N ) 2 ] P(J_{ij})=\frac{1}{J}\sqrt{\frac{N}{2\pi}}\exp\left[-\frac{N}{2J^{2}}\left(J_{ij}-\frac{J_{0}}{N}\right)^{2}\right] P(Jij)=J12πNexp[−2J2N(Jij−NJ0)2]
,其中 J 0 / N J_{0} /N J0/N 和 J 2 / N J^{2}/N J2/N 分别为 P ( J i j ) P(J_{ij}) P(Jij) 的 平 均 值 和 方 差 。 这个模型被称为 Sherrington—Kirkpatrick 模型(简称SK模型)。后续会讨论平均场自旋玻璃理论,即 SK 模型的解。
有意思的是,哈密顿量中看起来微小的变化,就导致自旋玻璃模型与伊辛模型的低温物理性质发生了巨大的改变。在零温条件下( T = 0 K T = 0\ \mathrm{K} T=0 K),对于伊辛模型而言,如果所有自旋的方向全部相同,那么体系的哈密顿量取得最小值,体系处于铁磁相。不过,对于自旋玻璃而言,自旋对间相互作用的随机性使得体系的能量最小值并不容易寻找。不妨看一个简单的例子。
上图展示了一个由
2
×
2
2\times2
2×2 个自旋构成的二维自旋玻璃模型,其中自旋间的相互作用
J
i
j
J_{ij}
Jij 有正值(设为 1)也有负值(设为 -1)。可以看到,无论四个自旋怎么取,都无法满足使所有相互作用
−
J
i
j
s
i
s
j
-J_{ij}s_{i}s_{j}
−Jijsisj 都为最小值 -1,这与上图中展示的伊辛模型的情形显然不同。这种现象被称为“阻挫”。可以想象,随着体系的增大,类似的阻挫也会迅速增加。事实上,从计算复杂度理论的角度来看,求解自旋玻璃基态(能量最低)是一个 NP 完备问题。这意味着,随着 N 的增大,即使对于最好的算法来说,寻找所有基态所花的时间也会指数级
exp
(
c
N
)
\exp(cN)
exp(cN) 增长,其中
c
c
c 为常数。
3.7 自旋玻璃相变
由于阻挫的存在,自旋玻璃模型在低温下的稳定构型看起来是无序的(自旋指向随机)。然而从动力学的角度来讲,几乎所有的自旋都是不动的,因而低温的自旋玻璃相(类比玻璃)与高温的顺磁相(类比液体)明显不同。从顺磁相到自旋玻璃相的过程看起来是一种无序到无序的相变,伊辛模型的序参量磁化强度表达式不再有效,因为 m m m 在两相中都为零。那么,自旋玻璃相变到底对应了什么序参量的变化和哪种对称性破缺呢?
4. 磁场中的现象
时间依赖性将自旋玻璃与其他磁性系统区分开来。
高于自旋玻璃化转变温度(transition temperature), T c T_{c} Tc,自旋玻璃表现出典型的磁性(如顺磁性)。
如果在样品冷却到转变温度时施加磁场,则样品的磁化强度会增加,如居里定律所述。达到 T c T_{c} Tc (其与冻结温度 T f T_{f} Tf 一致)后,样品变成自旋玻璃,进一步冷却导致磁化强度几乎没有变化。这被称为场冷磁化(field-cooled magnetization)。
当去除外部磁场时,自旋玻璃的磁化强度迅速下降到较低的值,称为剩余磁化强度。
然后,当磁化接近零(或原始值的一小部分——这仍然未知)时,磁化会缓慢衰减。这种衰减是非指数的,没有简单的函数可以充分拟合磁化与时间的曲线。这种缓慢的衰减特别适用于旋转玻璃。在仪器噪声水平之上,以天为单位的实验测量呈现了持续的变化。
自旋玻璃与铁磁材料的不同之处在于,在铁磁物质去除外部磁场后,磁化强度无限期地保持在剩磁值上。顺磁材料与自旋玻璃的不同之处在于,在去除外部磁场后,磁化强度迅速降至零,没有剩磁。衰减是迅速和指数级的。
如果在没有外部磁场的情况下将样品冷却到 T c T_{c} Tc 以下,并在转变为自旋玻璃相后施加磁场,则初始值会迅速增加到称为零场冷却磁化强度(zero-field-cooled magnetization)的值。然后向场冷磁化方向发生缓慢的向上漂移。
令人惊讶的是,时间的两个复杂函数(零场冷却和剩磁)的总和是一个常数,即场冷却值(field-cooled value),因此两者都与时间共享相同的函数形式,至少在非常小的外部场的限制。
5. Edwards-Anderson model
玻璃态的物理本质直到今天依然悬而未决。50多年前,物理学家为了研究玻璃态提出了自旋玻璃的概念。爱德华兹(S. Edwards)和安德森(P. Anderson)于1975年提出短程相互作用的自旋玻璃模型。
在这个模型中,我们将自旋粒子排列在
d
d
d 维晶格上,只有最近邻相互作用,类似于 Ising 模型。该模型可以精确求解临界温度,并观察到在低温下存在玻璃相。该自旋系统的哈密顿量由下式给出:
H = − ∑ ⟨ i j ⟩ J i j S i S j H=-\sum _{\langle ij\rangle }J_{ij}S_{i}S_{j} H=−⟨ij⟩∑JijSiSj
其中 S i S_{i} Si 指的是在晶格点 i i i 处的半自旋粒子的泡利自旋矩阵, ⟨ i j ⟩ \langle ij\rangle ⟨ij⟩ 是指对相邻格点 i i i 和 j j j 求和。 J i j J_{ij} Jij 的负值表示 i i i 和 j j j 点处的自旋之间的反铁磁相互作用。总和包含任何维度的晶格上的所有最近邻位置。代表自旋-自旋相互作用的磁性的变量 J i j J_{ij} Jij 称为键或链接变量(bond or link variables)。
为了确定该系统的配分函数,需要平均自由能:
f [ J i j ] = − 1 β ln Z [ J i j ] f\left[J_{ij}\right]=-{\frac {1}{\beta }}\ln {\mathcal {Z}}\left[J_{ij}\right] f[Jij]=−β1lnZ[Jij]
其中 Z [ J i j ] = Tr S ( e − β H ) \mathcal {Z}\left[J_{ij}\right]=\operatorname {Tr} _{S}\left(e^{- \beta H}\right) Z[Jij]=TrS(e−βH),取 J i j J_{ij} Jij 的所有可能值。 J i j J_{ij} Jij 的值分布被视为具有均值 J 0 / N J_{0}/N J0/N 和方差 J 2 / N J^{2}/N J2/N:
P ( J i j ) = N 2 π J 2 exp { − N 2 J 2 ( J i j − J 0 N ) 2 } P(J_{ij})={\sqrt {\frac {N}{2\pi J^{2}}}}\exp \left\{-{\frac {N}{2J^{2 }}}\left(J_{ij}-{\frac {J_{0}}{N}}\right)^{2}\right\} P(Jij)=2πJ2Nexp{−2J2N(Jij−NJ0)2}
使用复本方法(replica method)求解自由能,在低于一定温度下,发现系统存在称为自旋玻璃相(或玻璃相)的新磁相,其特征在于消失的磁化强度 m = 0 m=0 m=0 以及在同一晶格点处但在两个不同复本处的自旋之间的两点相关函数(two point correlation function)的非零值:
q = ∑ i = 1 N S i α S i β ≠ 0 q=\sum _{i=1}^{N}S_{i}^{\alpha }S_{i}^{\beta }\neq 0 q=i=1∑NSiαSiβ=0
其中 α \alpha α, β \beta β 是复本下标。因此,铁磁到自旋玻璃相变的序参量是 q q q,而顺磁性到自旋玻璃的序参量也是 q q q。因此,描述三个磁相的新序参量集由 m m m 和 q q q 组成。
在复本对称的假设下,平均场自由能由下述表达式给出:
β f = − β 2 J 2 4 ( 1 − q ) 2 + β J 0 m 2 2 − ∫ exp ( − z 2 2 ) log ( 2 cosh ( β J z + β J 0 m ) ) d z \begin{aligned} \beta f=-{\frac {\beta ^{2}J^{2}}{4}}(1-q)^{2}+{\frac { \beta J_{0}m^{2}}{2}}-\int \exp \left(-{\frac {z^{2}}{2}}\right)\log \left(2\cosh \left(\beta Jz+\beta J_{0}m\right)\right)\,\mathrm {d} z \end{aligned} βf=−4β2J2(1−q)2+2βJ0m2−∫exp(−2z2)log(2cosh(βJz+βJ0m))dz
6. Sherrington-Kirkpatrick model
除了不寻常的实验特性外,自旋玻璃也是广泛的理论和计算研究的主题。早期关于自旋玻璃的理论工作的很大一部分涉及一种基于系统配分函数复本的平均场理论。
同一年(1975 年),David Sherrington 和 Scott Kirkpatrick 提出自旋玻璃的平均场模型(简称 S-K 模型)[2],他们的工作标志着物理学家对自旋玻璃系统的研究拉开了序幕。这是一个重要的、完全可解的自旋玻璃模型,具有长程阻挫铁磁(long range frustrated ferro)耦合和反铁磁耦合。它对应于描述磁化的慢动力学和复杂的非遍历平衡状态的自旋玻璃的平均场近似。
S-K 模型将短程模型推广到全连接的情形,即每个自旋都同其他自旋两两连接。现在知道 S-K 模型的平均场性质(包括动力学行为)存在数学解析形式,这可能是帕里西非常着迷于此类模型的原因之一。
与 Edwards-Anderson(EA)模型不同,在系统中虽然只考虑了两个自旋相互作用,但每个相互作用的范围可能是无限的(在晶格大小的数量级)。因此,我们看到任何两个自旋都可以与铁磁或反铁磁键相关联,并且它们的分布与 Edwards-Anderson 模型的情况完全相同。 SK 模型的哈密顿量与 EA 模型非常相似:
H = − ∑ i < j J i j S i S j H=-\sum _{i<j}J_{ij}S_{i}S_{j} H=−i<j∑JijSiSj
其中 J i j J_{ij} Jij, S i S_{i} Si, S j S_{j} Sj 与 EA 模型中的含义相同。 i < j i<j i<j 即是包括了所有自旋对, J i j J_{ij} Jij 满足高斯分布。
在统计物理框架下,计算体系的热力学性质一般要从自由能出发。由于无序相互作用的存在,自旋玻璃的自由能需要对满足给定随机分布的所有 J i j J_{ij} Jij 作平均(称为淬火平均,用方括号 [ ] [ ] [] 表示):
[ F ] = − k B T [ log Z ] [F] = -k_{\mathrm{B}}T[\log Z] [F]=−kBT[logZ]
其中, k B k_{\mathrm{B}} kB 是玻尔兹曼常数, Z Z Z 是配分函数。淬火平均的自由能公式一般情况下无法直接求得。为此,Edwards 和 Anderson 二人巧妙地提出了“复本技巧”:
[ log Z ] = lim n → 0 [ Z n − 1 ] n [\log Z]=\lim_{n\rightarrow 0}\frac{\left[Z^{n}-1\right]}{n} [logZ]=n→0limn[Zn−1]
将 [ log Z ] [\log Z] [logZ] 转化为可计算的 [ Z n ] [Z^{n}] [Zn] 。物理上,相当于构造原系统的 n n n 个复本( n n n 为正整数),再计算这 n n n 个复本的总配分函数 Z n Z^{n} Zn 及其无序平均值,最后外推至 n → 0 n\rightarrow 0 n→0 的情形。
复本构造使得讨论无序自旋玻璃相的序参量和对称性重新成为可能。帕里西等提出了复本间的交叠序参量来表征自旋玻璃的相变:
q α β = 1 N ∑ i = 1 N [ m i α m i β ] q_{\alpha\beta}=\frac{1}{N}\sum_{i=1}^{N}\left[m^{\alpha}_{i}m_{i}^{\beta}\right] qαβ=N1i=1∑N[miαmiβ]
其中, m i α m_{i}^{\alpha} miα,代表复本 α \alpha α 中第 i i i 个自旋的局域磁化强度。尽管自旋玻璃相的宏观磁化强度为零,复本交叠序参量可以不为零。
基于复本交叠序参量公式,我们可以讨论复本对称性。由于复本代表了相空间(体系所有可能状态的集合)的取样,所以复本对称性实际上表征了相空间的对称性,而不是真实空间的对称性。最初,Edwards 和 Anderson 假设了自旋玻璃相中复本对称,即 q α β q_{\alpha\beta} qαβ 的值不依赖于复本 α \alpha α、 β \beta β 的选择,称为 Edwards—Anderson 序参量 q α β = q q_{\alpha\beta} = q qαβ=q 。
基于复本对称假设的计算给出了非常有趣的结果:存在一个临界温度 T c T_{\mathrm{c}} Tc ,在这个温度之上 q q q 为零,之下则大于零。因而 T c T_{\mathrm{c}} Tc 代表了自旋玻璃的相变温度;该相变对应的序参量为复本交叠序参量——朗道理论的普适性再次被验证。
复本对称理论虽然可以预测自旋玻璃相变的产生,但是也存在着问题。该理论得到的零温熵 S ( 0 ) = − 1 / ( 2 π ) ≈ − 0.16 S(0) = -1/(2\pi)\approx -0.16 S(0)=−1/(2π)≈−0.16 ,而按照熵的微观定义,离散变量物理体系的熵不可能为负值,这就是所谓的“负熵灾难”。另外,de Almeida 和 Thouless 发现复本对称解在自旋玻璃相中并不稳定(自由能函数展开式的二阶项前的系数矩阵不正定)。由此,他们找到了复本对称解稳定区间的边界,称为 AT 线。在 AT 线之下,复本对称性破缺!
基于以上结果,可得到平均场自旋玻璃模型的相图(见上图)。在顺磁相中,
m
=
q
=
0
m = q = 0
m=q=0;铁磁相中
m
≠
0
m\neq 0
m=0,
q
>
0
q > 0
q>0。顺磁相和铁磁相中复本对称,自旋玻璃相中复本对称破缺。最后剩下的问题是,自旋玻璃相中复本对称性是如何破缺的?或者说,自旋玻璃相的真正稳定解是怎样的?最终,帕里西找到了答案。
该模型的平衡解,经过 Sherrington、Kirkpatrick 等人的一些初步尝试,于 1979 年由 Giorgio Parisi 用复本方法找到。随后由 M. Mezard、G. Parisi、M.A. Virasoro 和许多其他人对 Parisi 解的解释工作揭示了玻璃态低温相的复杂性质,其特征是遍历性破坏(ergodicity breaking)、超度量性(ultrametricity)和非自均性(non-selfaverageness)。进一步的发展导致了空腔方法(cavity method)的创建,该方法允许在没有复本的情况下研究低温阶段。Francesco Guerra 和 Michel Talagrand 的工作提供了对 Parisi 解决方案的严格证明。
复本平均场理论的形式也被应用于神经网络的研究,它可以计算简单神经网络架构的存储容量等属性,而无需设计或设计训练算法(如反向传播)。
具有短程阻挫相互作用和无序的更实际的自旋玻璃模型,例如相邻自旋之间的耦合遵循高斯分布的高斯模型,也已被广泛研究,特别是使用蒙特卡罗模拟。这些模型显示以尖锐相变(sharp phase transitions)为界的自旋玻璃相。
除了与凝聚态物理相关外,自旋玻璃理论还具有很强的跨学科特性,可应用于神经网络理论、计算机科学、理论生物学、经济物理学等。
7. 复本及复本对称破缺(replica symmetry breaking, RSB)
7.1 复本技巧(Replica trick)
在自旋玻璃和其他淬火无序系统的统计物理学中,复本技巧是一种基于以下公式应用的数学技术:
ln Z = lim n → 0 Z n − 1 n \ln Z=\lim _{n\to 0}{Z^{n}-1 \over n} lnZ=n→0limnZn−1
或者:
ln Z = lim n → 0 ∂ Z n ∂ n \ln Z=\lim _{n\to 0}{\frac {\partial Z^{n}}{\partial n}} lnZ=n→0lim∂n∂Zn
其中 Z Z Z 是最常见的配分函数,或类似的热力学函数。
上面的恒等式通过泰勒展开很容易理解:
lim n → 0 Z n − 1 n = lim n → 0 e n ln Z − 1 n = lim n → 0 n ln Z + 1 2 ! ( n ln Z ) 2 + … n = ln Z {\displaystyle {\begin{aligned}\lim _{n\rightarrow 0}{\dfrac {Z^{n}-1}{n}}&=\lim _{n\rightarrow 0}{\dfrac {e^{n\ln Z}-1}{n}}\\&=\lim _{n\rightarrow 0}{\dfrac {n\ln Z+{1 \over 2!}(n\ln Z)^{2}+\dots }{n}}\\&=\ln Z~~\end{aligned}}} n→0limnZn−1=n→0limnenlnZ−1=n→0limnnlnZ+2!1(nlnZ)2+…=lnZ
它通常用于简化 ln Z ‾ {\overline {\ln Z}} lnZ 的计算,将问题简化为计算无序平均 Z n ‾ {\overline {Z^{n}}} Zn,其中 n n n 假定为整数。这在物理上等同于对系统的 n n n 个副本(copies)或复本(replicas)进行平均,因此得名。
复本技巧的关键在于,虽然假设 n n n 为整数,但要恢复无序平均对数(disorder-averaged logarithm),则必须将 n n n 连续变化到零。复本技巧核心的这一明显矛盾从未得到正式解决,但是在复本方法可以与其他精确解决方案进行比较的所有情况下,这些方法都会导致相同的结果。(要证明复本技巧有效,必须证明卡尔森定理(Carlson’s theorem)成立,即比率 ( Z n − 1 ) / n (Z^{n}-1)/n (Zn−1)/n 是小于 π \pi π 的指数类型。)
有时需要复本对称破坏 (RSB) 的附加属性才能获得与遍历性破坏相关的物理结果。
7.1.1 广义表达式
它通常用于涉及分析函数的计算(可以扩展为幂级数)。
使用 f ( z ) f(z) f(z) 的幂级数做展开:成为 z z z 的幂或换句话说 z z z 的复本,使用 z z z 的幂,并执行相同的计算在 f ( z ) f(z) f(z) 上。
使用 f ( z ) f(z) f(z) 的幂级数:展开为 z z z 的幂,或者换句说法是 z z z 的复本,并使用 z z z 的幂对 f ( z ) f(z) f(z) 执行相同的计算。
在物理学中非常有用的一个特殊情况是平均热力学自由能,
F = − k B T ln Z [ J i j ] F=-k_{\rm {B}}T\ln Z[J_{ij}] F=−kBTlnZ[Jij]
J i j J_{ij} Jij 的值具有一定的概率分布,通常是高斯分布。
配分函数由下式给出
Z [ J i j ] ∼ e − β J i j Z[J_{ij}]\sim e^{-\beta J_{ij}} Z[Jij]∼e−βJij
请注意,如果我们只计算 Z [ J i j ] Z[J_{{ij}}] Z[Jij](或更一般地说,任何 J i j J_{ij} Jij 的幂)而不是我们想要平均的它的对数,得到的积分(假设是高斯分布)就是
∫ d J i j e − β J − α J 2 \int \mathrm{d}J_{ij}e^{-\beta J-\alpha J^{2}} ∫dJije−βJ−αJ2
标准高斯积分是可以轻松计算的(例如完成平方)。
为了计算自由能,我们使用复本技巧:
ln Z = lim n → 0 Z n − 1 n {\displaystyle \ln Z=\lim _{n\to 0}{\dfrac {Z^{n}-1}{n}}} lnZ=n→0limnZn−1
如果 n n n 是一个整数,这将对数求平均的复杂任务,简化为求解一个相对简单的高斯积分。复本技巧假设如果可以为所有正整数 n n n 计算 Z n Z^{n} Zn,那么这可能足以允许计算 n → 0 n\to 0 n→0 的极限行为。
显然,这样的论点会引入许多数学问题,并且由此产生的用于执行极限 n → 0 n\to 0 n→0 的形式通常会引入许多微妙之处。
在使用平均场理论进行计算时,采用此极限通常需要引入额外的序参量,这是一种称为“复本对称破缺”的属性,与无序系统内的遍历性破坏(ergodicity breaking)和慢动力学密切相关。
7.1.2 物理应用
复本技巧用于在平均场近似中确定统计力学系统的基态。通常,对于容易确定基态的系统,可以分析基态附近的涨落。否则使用复本方法。一个例子是系统中的淬火无序(quenched disorder)的情况,例如自旋玻璃,自旋之间具有不同类型的磁链,导致许多不同的自旋构型(configuration)具有相同的能量.
在具有淬火无序的系统的统计物理学中,实现相同无序的任何两个状态(或者在自旋玻璃的情况下,具有相同的铁磁和反铁磁键分布)称为彼此的复本。对于具有淬火无序的系统,人们通常期望宏观量将是自平均的(self-averaging),因此对于特定无序的任何宏观量,将与通过对所有可能实现的无序进行平均计算的相同量无法区分。引入复本允许人们在不同的无序上展现这个平均值。
在自旋玻璃的情况下,我们预计在热力学极限内的每个自旋的自由能(或任何自平均量)与晶格上各个位点之间的铁磁和反铁磁耦合的特定值无关。因此,我们明确地找到自由能作为无序参数的函数(在这种情况下,是铁磁和反铁磁键分布的参数),然后平均所有可能实现的无序的自由能(位点之间耦合的所有值,每个都有其对应的概率,由分布函数给出)。由于自由能采取以下形式:
F = F [ J i j ] ‾ = − k B T ln Z [ J ] ‾ F={\overline {F[J_{ij}]}}=-k_{\mathrm{B}}T{\overline {\ln Z[J]}} F=F[Jij]=−kBTlnZ[J]
其中 J i j J_{ij} Jij 描述了无序(对于自旋玻璃,它描述了每个独立位点 i i i 和 j j j 之间的磁相互作用的性质),我们取 J J J 中描述的所有耦合值的平均值,并以给定分布加权。为了对对数函数进行平均,复本技巧派上用场,用上面提到的极限形式替换对数。在这种情况下,数量 Z n Z^{n} Zn 表示 n n n 个相同系统的联合配分函数。
7.1.3 REM——最简单的复本问题
随机能量模型(random energy model,REM)是无序系统统计力学中最简单的模型之一,并且可能是最简单的模型,可以将复本技巧的平均和幂展示到复本对称破缺的 1 级(level 1 of replica symmetry breaking)。该模型特别适合这种介绍,因为不同过程的精确结果是已知的,并且可以通过交叉检查结果来证明复制技巧是有效的。
- 随机能量模型
在无序系统的统计物理学中,随机能量模型是具有淬火无序的系统的玩具模型,例如自旋玻璃,具有一级相变。它涉及一个包含 N N N 个自旋的集合的统计(即自由度 σ ≡ { σ i } i = 1 N {\boldsymbol {\sigma }}\equiv \{\sigma _{i}\}_{i=1}^ {N} σ≡{σi}i=1N 可以取两个可能值之一 σ i = ± 1 \sigma _{i}=\pm 1 σi=±1) 使得系统的可能状态数为 2 N 2^{N} 2N。这些状态的能量是独立同分布的高斯随机变量 E x ∼ N ( 0 , N / 2 ) E_{x}\sim {\mathcal {N}}(0,N/2) Ex∼N(0,N/2),均值为零,方差为 N / 2 N/2 N/2。该模型的许多属性都可以精确计算。它的简单性使得该模型适用于对淬火无序和复本对称等概念的教学介绍。
- 与其他无序系统的比较
r r r-spin 无限范围模型,其中所有 r r r-spin 集合相互作用,相互作用常数是随机的、独立的、同分布的,成为适当定义的 r → ∞ r\to\infty r→∞ 极限下的随机能量模型。
更准确地说,如果模型的哈密顿量定义为
H ( σ ) = ∑ { i 1 , … , i r } J i 1 , … i r σ i 1 ⋯ σ i r , {\displaystyle H({\boldsymbol {\sigma }})=\sum _{\{i_{1},\ldots ,i_{r}\}}J_{i_{1},\ldots i_{r}} \sigma _{i_{1}}\cdots \sigma _{i_{r}},} H(σ)={i1,…,ir}∑Ji1,…irσi1⋯σir,
其中求和包括所有 ( N r ) {N \choose r} (rN) 不同的 r r r 索引集合,并且对于每个这样的集合, { i 1 , … , i r } \{i_{1}, \ldots ,i_{r}\} {i1,…,ir}, J i 1 , … , i r J_{i_{1},\ldots ,i_{r}} Ji1,…,ir 是均值为 0 且方差为 J 2 r ! / ( 2 N r − 1 ) J^{2}r!/(2N^{r-1}) J2r!/(2Nr−1),在 r → ∞ r\to \infty r→∞ 极限中恢复为随机能量模型。
- 热力学量的推导
顾名思义,在 REM 中,每个微观状态都有独立的能量分布。对于无序的特定实现, P ( E ) = δ ( E − H ( σ ) ) P(E)=\delta (E-H(\sigma )) P(E)=δ(E−H(σ)),其中 σ = ( σ i ) \sigma =(\sigma _{i}) σ=(σi) 指的是由状态描述的单个自旋组态, H ( σ ) H(\sigma) H(σ) 是与之相关的能量。最终的广延变量(如自由能)需要对所有无序实现进行平均,就像 Edwards-Anderson model 的情况一样。在所有可能的实现中平均 P ( E ) P(E) P(E),我们发现无序系统的给定组态(configuration)具有等于 E E E 的能量的概率由下式给出:
[ P ( E ) ] = 1 N π J 2 exp ( − E 2 J 2 N ) [P(E)]={\sqrt {\frac {1}{N\pi J^{2}}}}\exp \left(-{\dfrac {E^{2}}{J^ {2}N}}\right) [P(E)]=NπJ21exp(−J2NE2)
其中 [ ⋯ ] [\cdots] [⋯] 表示所有无序实现的平均值。此外,自旋的两种不同微观组态 σ \sigma σ 和 σ ′ \sigma ' σ′ 的能量值的联合概率分布分解为:
[ P ( E , E ′ ) ] = [ P ( E ) ] [ P ( E ′ ) ] [P(E,E')]=[P(E)]\,[P (E')] [P(E,E′)]=[P(E)][P(E′)]
可以看出,给定自旋组态的概率仅取决于该状态的能量,而不取决于单个自旋组态。
对于 ∣ E ∣ < N J log 2 |E|<NJ{\sqrt {\log 2}} ∣E∣<NJlog2,REM 的熵为:
S ( E ) = N [ log 2 − ( E N J ) 2 ] {\displaystyle S(E)=N\left[\log 2-\left({\frac {E}{NJ}}\right)^{2}\right]} S(E)=N[log2−(NJE)2]
然而,这个表达式只有在每个自旋的熵 lim N → ∞ S ( E ) / N \lim _{N\to \infty }S(E)/N limN→∞S(E)/N 是有限的情况下成立,即当 ∣ E ∣ < − N J log 2 |E|<-NJ{\sqrt {\log 2}} ∣E∣<−NJlog2。由于 ( 1 / T ) = ∂ S / ∂ E (1/T)=\partial S/\partial E (1/T)=∂S/∂E,这对应于 T > T c = 1 / ( 2 log 2 ) T>T_{c}=1/(2{ \sqrt {\log 2}}) T>Tc=1/(2log2)。对于 T < T c T<T_{c} T<Tc,系统在少数能量组态 E ≃ − N J log 2 E\simeq -NJ{\sqrt {\log 2}} E≃−NJlog2 中保持“冻结”状态,在热力学极限下,每个自旋的熵会消失。
7.1.4 自平均(Self-averaging)
无序系统的自平均物理特性可以通过对足够大的样本进行平均来描述。这个概念是由 Ilya Mikhailovich Lifshitz 提出的。
- 定义
在物理学中,经常会遇到淬火随机性(quenched randomness)发挥重要作用的情况。这种系统的任何物理性质 X X X 都需要对所有无序实现进行平均。系统可以完全由平均值 [ X ] [X] [X] 来描述,其中 [ ⋯ ] [\cdots] [⋯] 表示对所有实现(realisations)进行平均(“对样本进行平均”),前提是当 N → ∞ N\rightarrow \infty N→∞ 时,相对方差(relative variance) R X = V X / [ X ] 2 → 0 R_{X} = V_{X} / [X]^{2} \rightarrow 0 RX=VX/[X]2→0,其中 V X = [ X 2 ] − [ X ] 2 V_{X} = [X^{2}] - [X]^{2} VX=[X2]−[X]2, N N N 表示所有样本的个数。在这种情况下,单个大型系统足以代表整个系综。这样的量称为自平均。远离临界,当较大的晶格由较小的块构建时,由于外延量的可加性,中心极限定理保证 R X ∼ N − 1 R_{X} \sim N^{-1} RX∼N−1,从而确保自平均。另一方面,在临界点,由于长程相关性, X X X 是否是自平均的问题变得不平凡。
- 非自平均系统
在纯临界点,如果根据相关性的标准定义,随机性会导致纯系统的临界行为(即临界指数)发生变化,则随机性被归类为相关(relevant)。最近的重整化群和数值研究表明,如果随机性或无序性相关,则自平均特性会丢失。最重要的是,当 N → ∞ N\rightarrow\infty N→∞ 时,临界点处的 R X R_{X} RX 接近一个常数。这种系统称为非自平均。因此,与自平均方案不同,数值模拟无法在更大的晶格(大 N N N)中改进图像,即使临界点是确切已知的。总之,各种自平均的类型可以在 R X R_{X} RX 等量的渐近大小依赖性的帮助下进行索引。如果 R X R_{X} RX 随着大小下降到零,则它是自平均的,而如果 R X R_{X} RX 在 N → ∞ N\rightarrow\infty N→∞ 时接近常数,则系统是非自平均的。
- 强自平均和弱自平均
自平均系统进一步分为强和弱。如果表现出的行为是如前所述的中心极限定理所建议的 R X ∼ N − 1 R_{X} \sim N^{-1} RX∼N−1,则系统被称为强自平均。一些系统显示出较慢的幂律衰减 R X ∼ N − z R_{X}\sim N^{-z} RX∼N−z,其中 0 < z < 1 0 < z < 1 0<z<1。此类系统被分类为弱自平均。系统的已知临界指数决定了指数 z z z。
还必须补充一点,相关的随机性(relevant randomness)并不一定意味着非自平均,尤其是在平均场情况下。 上面提到的 RG 论点需要扩展到非常受限(sharp limit)的 T c T_{c} Tc 分布和远程相互作用的情况。
7.1.5 其他替代方法
空腔法是研究无序平均场问题的另一种方法,通常比复制法更简单。它被设计用来处理局部树状图上的模型。
另一种替代方法是超对称方法(supersymmetric method)。超对称方法的使用为复本技巧提供了一种数学上严格的替代方案,但仅限于非交互系统中。
此外,已经证明 Keldysh technique 为复本方法提供了一种可行的替代方案。
7.2 复本对称破缺(Replica symmetry breaking, RSB)
当时困扰物理学家的一朵乌云是,S-K 模型的低温熵为负值,这强烈违背了物理直观,因为自旋取向只有两个方向(离散取值)的系统的熵不可能为负(系统的构型数是可数的)。1978 年,对 S-K 模型的稳定性分析证明,S-K 模型的低温解是不稳定的 [3]。那么,一个重要的问题随之而来,S-K 模型的负熵危机根源在哪?次年,这个问题被年轻的帕里西解决 [4],当时他年仅 31 岁。
针对自旋玻璃系统,帕里西提出了复本对称破缺(replica symmetry breaking, RSB)的概念,发展了一套有效的数学方法,并给出了平均场自旋玻璃模型的一个精确的理论解。
既然自旋玻璃相中复本对称性破缺,不妨先假设一种简单的破缺方式:一阶(
K
=
1
K=1
K=1)复本对称破缺。在该假设下,整个相空间分裂成多个子空间(称为“纯态”)。在子空间内部,复本在任意重排下对称,即只要复本
α
\alpha
α、
β
\beta
β 属于同一纯态,那么不论它们如何取值,
q
α
β
=
q
1
q_{\alpha\beta}= q_{1}
qαβ=q1 。另外,纯态也在任意重排下对称,即只要复本
α
\alpha
α、
β
\beta
β 属于不同纯态,那么不论它们如何取值,
q
α
β
=
q
0
q_{\alpha\beta}= q_{0}
qαβ=q0,如上图所示。可见,一阶复本对称破缺在承认复本对称破缺的前提下,保留了最高的对称性。帕里西计算了一阶复本理论的零温熵 ,发 现
S
(
0
)
S(0)
S(0) 从
−
0.16
-0.16
−0.16 增加到了
−
0.01
-0.01
−0.01,另外,自旋玻璃相的自由能虽然还是不稳定的,但是更接近稳定(自由能函数展开二阶系数矩阵的本征值虽然仍有负值,但更接近零)。自然地,沿着这一思路,可以进一步考察二阶(
K
=
2
K=2
K=2)、三阶(
K
=
3
K=3
K=3)……复本对称破缺。帕里西的计算表明,随着破缺阶数的增加,
S
(
0
)
S(0)
S(0) 逐渐趋向于零,见下表。
表 不同阶复本对称破缺理论得到的零温熵 S(0)
K | S(0) |
---|---|
0 | -0.16 |
1 | -0.01 |
2 | -0.004 |
∞ \infty ∞ | 0 |
这些尝试让帕里西推测,只有无穷阶( K → ∞ K\rightarrow\infty K→∞) 复本对称破缺(称为全阶复本对称破缺)才会给出自旋玻璃相的真正严格解。全复本对称破缺的理论确实得到了零温下的熵 S ( 0 ) = 0 S(0) = 0 S(0)=0,而且通过对自由能函数展开分析表明,全复本对称破缺解在低温下是稳定的。另外,全复本对称破缺理论的结果与SK模型的模拟结果也很好地吻合。几十年后,帕里西解被数学上严格证明。帕里西对全阶复本对称破缺的设计在 K → ∞ K\rightarrow\infty K→∞ 的情况下保留了最高的对称性。自旋玻璃的相空间分裂成无穷级,每一级都由多个子空间构成,同一子空间内复本对称(如果复本 α \alpha α、 β \beta β 属于 k k k 级的同一子空间,则不论 α \alpha α、 β \beta β 如何取, q α β = q k q_{\alpha\beta}= q_{k} qαβ=qk ),而子空间之间也具有重排不变性(如果复本 α \alpha α 、 β \beta β 属于 k k k 级不同子空间,则不论 α \alpha α、 β \beta β 如何取, q α β = q k − 1 q_{\alpha\beta}= q_{k} - 1 qαβ=qk−1)。这种分裂可以按照分形(自相似)的形式一直进行下去,直到最小的子空间(纯态)。纯态的 q α β q_{\alpha\beta} qαβ 回归到 Edwards—Anderson 序参量 q E A q_{\mathrm{EA}} qEA 。
帕里西解数学上十分优美,具有分形特征和超度量性。如上图所示,复本(微观态)以分形树的形式组织。分形树具有自相似的特点:该树的每一分枝都与原树相似,而每一分枝又由相似的子分枝组成。上图右侧则展示了超度量性。如果取出其中任意三个复本,它们两两组合将会得到三个交叠量
q
a
q_{a}
qa 、
q
b
q_{b}
qb、
q
c
q_{c}
qc 。这三个值之间的关系只有两种可能性:要么
q
a
=
q
b
=
q
c
q_{a} = q_{b} = q_{c}
qa=qb=qc ,组成等边三角形;要么
q
a
>
q
b
=
q
c
q_{a} > q_{b} = q_{c}
qa>qb=qc ,组成等腰三角形。超度量空间的这种关系对应了普通度量空间的三角不等式,并给出了超度量空间中距离的定义。有意思的是,在普通度量空间中,对于一个行走者来说,即使步长很小,只要坚持不懈地走,总可以走到远方。而在超度量空间中,只要步长是一定的,那么不管走了多久,终点与起点的距离都是一样的(上图右侧中,在任意子空间中任取两点,代表起始态和终态,它们的距离一样)。在超度量空间中,布朗运动(随机行走)并不各态历经。
复本对称破缺其物理本质就是将原有模型自旋之间的复杂相互作用,转换为同一模型的多个拷贝(即多个复本)间的相互作用。这样,复本之间就存在一耦合矩阵,如果这一矩阵的非对角元素均同(对角元素显然一样),那么这个均同的元素就是统计物理的序参量,从而刻画了前面提到的自旋玻璃序。帕里西以天才的想象力引入了破缺,即正确的复本矩阵应该在对角线上出现不断分块结构,每一次分块将引入新的序参量;而且,对于 S-K 模型,这种分块是无穷多次的。这样,序参量将变成连续的函数。帕里西发现,只有这样,S-K 模型的低温熵才能在复本对称破缺无穷多次之后趋于零,负熵危机才得以解决,也不违反热力学第三定律。
随着帕里西与合作者几十年如一日的深入研究,复本对称破缺的物理意义逐渐明朗。这一猜想在 20 多年后被法国数学家塔拉格兰(M. Talagrand)证明 [6],成为物理学史上为数不多的经典案例!帕里西后来总结道:当物理学家使用数学时,他们以更宽松的方式使用它(when physicists use mathematics, they use it in a looser way)。这十分贴切地形容了物理学家眼中数学与物理的关系:物理是数学的实在。例如,2015 年,随机激光物理系统中的实验也证实了复本对称破缺的概念 [7]。物理学家在解决物理问题的过程中,擅长在物理直觉指引下做近似;而最不可思议的地方是,这种近似最后却是精确的。这样的思维,也许可以总结为不求严格,只求精确。在 21 世纪复杂系统研究中,这样的研究风格可以说是必需的。
有人向帕里西讨教他是如何开创复本对称破缺的思想时,帕里西笑着回答道:“因为那时候不用到处开会,我能专注于一件事情”(大意)。这说明,要完成一件有深刻影响力的事情,需要的专注与大量的时间和精力上的投入等同。当然,前提是科学家关注重要的科学问题,并且与某个研究领域一起成长(不是老化)。可见科学家一生能做成一件重要的事情,就已经非常了不起了!帕里西开创的领域长期来看是小众方向,但他几十年如一日地坚持,让自旋玻璃研究的涓涓细流终成大河,这种精神尤其值得有志于科学探索的年轻人学习!
帕里西的理论对于无序复杂系统的研究产生了深远的影响,已被广泛地应用在各类问题中,包括玻璃化转变、阻塞相变、进化动力学、优化问题、神经网络、人工智能模型等。
7.3 Parisi 的发现过程
以下摘录自 Parisi 所著的《随椋鸟飞行——复杂系统的奇遇》一书:
一生中最有价值的研究成果之所以能够问世,可能是因为你在去别处的路上与之不期而遇。
我就是这样。人们认为我对物理学最大的贡献就是提出了自旋玻璃理论,这是我在研究基本粒子问题时应运而生的。
那时候,为了解决这个问题,最合适的工具似乎是一种数学技术,名为复本法,而我当时还没有掌握。我搜集了关于这个问题的所有文献,开始进行研究。所谓的复本法,是一种数学方法,即取一个系统,进行多次复制,然后比较多个复本的行为表现。这种方法看上去完全能够解决我研究的问题,但是在一份文献描述的案例中,以它得出的结果完全离谱,让人不知所云。
面对一个新问题,当我还没有明确的认识时,选择一种可能不奏效的工具并非明智之举。这就像在使用指南针的时候,它时常指向南方,而不是北方,但谁也不知道它什么时候指南,什么时候指北,也不知其原因。
所以我决定先弄清楚这个工具到底可不可靠。
那是 1978 年圣诞节前夕,当时我在弗拉斯卡蒂实验室工作。我复印了一篇文章,论述的是复本技术导致不可靠结果的案例。假期里我一直把这篇文章带在身边。
文章讨论了关于无序系统和自旋玻璃的问题,这些问题与我当时的研究领域相去甚远,我也从未涉猎过。然而对于理解这种方法为何在研究中不起作用,这篇文章又至关重要。我研究了文章用的模型,又验算了所有的数据,这些都是对的,但结果却不合逻辑。这个问题就值得深究了。
度假回来后,我做了一些进展非常顺利的工作,答案似乎唾手可得。我试图以一些更加先进的研究成果为起点来解决这个问题,认为这样会轻而易举,但越是努力,问题就越难解决。
如果有些结果一致,有些结果又与数值模拟的值相去甚远,这就意味着研究结果还差得很远。或许有必要彻底改变看问题的角度。
不知不觉中,我已经开始探索一个新的研究领域。我不再思考初心所指的基本粒子问题,我的兴趣被别的东西激发了。
- 自旋玻璃
自旋玻璃指的是一种金属合金,取这个名字是因为它们的磁性相变,这一相变是由形成合金的粒子的自旋行为所致,其表现类似于玻璃的相变。
这些合金由贵金属形成,比如金、银,其中含有少量被稀释的铁。在高温下,它们的行为类似于一般的磁性系统,但当温度下降到某个值以下时,就会出现类似于玻璃、蜡或沥青的行为:变化越来越慢,系统似乎永远不会达到平衡状态。
在学校里我们都学过,液体是一种被注入固体容器后就会呈现容器形状的材料。玻璃在高温下显然是液体,但很明显,这种液体表现出不寻常的行为。例如,如果我们把一个装满熔融玻璃(或蜂蜜、蜡)的容器倒过来,液体不会立即倒在地板上,而是开始慢慢地从容器中“滴落”。玻璃越是冷却,滴得就越慢,由于某种原因,这一系统行为的速度大大减慢。
当温度下降时,系统动力学中的急剧变慢与金属合金的磁化行为有一些相似之处。这就好比在降低温度时,自旋翻转的可能性同时降低,因此不可能达到平衡状态。
让我们回到前面第一章中的例子,想象一辆满载乘客的公共汽车,只要密度相对较低,想从一个点到另一个点的人就可以让其他人避让而自己顺利通过。当然,那些避让的人也会再使别人挪动位置,产生连锁反应。只要有足够的空间,一切都可以正常运行。但是,密度越高,接触越紧密,人与人之间的空间越小,一动起来就越困难,越容易被卡住。英国人称之为“traffic jam”(“拥堵”或“交通堵塞”)
这种现象相当普遍(涉及玻璃、蜡、蜂蜜、沥青、金属合金……),促使学者们纷纷研究其原理。解决这个问题最好的办法是建立一个起步简单的模型,重现这种现象。这一过程有可能让我们发现温度变化时导致动力学变慢的基本特征或相互作用。这些特征和相互作用存在于玻璃、蜂蜜、蜡、沥青和某些金属合金中,但在水或其他大多数液体中应当不存在。
- 模型
从实验的角度来看,研究这些材料的相变也相当困难。我可以告诉你们一件有意思的事,在澳大利亚,一项独一无二的实验正在进行。科学家们采集了一定量的沥青,在控制温度的情况下,沥青仍然保持一定的粘度(因此沥青不完全静止并能形成液滴),他们要测量这些沥青滴落的频率。该实验始于 1929 年,到 2014 年为止只滴落了 9 滴。后来我就不再关注这个饰演了,很难想象再过多久我们才会看到一些有趣的结果……
这些系统研究起来很复杂,最好的办法当然是建立一个比实际情况简单的综合模型,这可以帮助我们找到答案。
为了理解什么是模型,以及它对理论物理学家的用处,我们可以把它想成大富翁游戏。这是一种社会模型,只包含几条简单的游戏规则,包括土地的支配权和费用、建筑费用和房地产租金的数额。再加上我们生活中经常遇到的偶然因素,通过掷骰子的方式移动,让“意外”和“概率”来决定玩家是走出困境还是陷入僵局。
有了这些简单的规则,只要玩上一会儿,你们就会意识到资本主义制度的一个特征:有钱人会变得越来越富有。
虽然大富翁游戏不能涵盖现实社会的所有复杂性,但却能够从中把握某些特征。同样道理,物理学家建立的模型也不能包含真实系统的所有复杂性,但如果我们能为模型有意制定一些规则,就有希望看到模型成功重现研究现象的一些基本特征。
一旦建立了模型并制定了描述其运行的规则,就可以让系统进行演化,也就是说,可以开始我们的大富翁游戏了,或者说我们就可以通过升高或降低这个综合模型中定义的温度,用计算机模拟系统的相变。
这个不断演化的模型将会产生一些结果,就像玩大富翁的时候“有钱人会变得越来越富有”一样,或者像伊辛模型显示的那样,铁磁相变会在温度降低时出现。
这样,我们就可以开始着手发展我们的理论,即从综合模型的规则和初始数据出发,建立可以重现模拟结果的数学结构。这种实验室不再由磁铁、电路、电炉或其他传统实验设备组成,现在它用的是计算机,我们用计算机重现的并非金属合金的变化,而是模型的运转。
如果成功做到了这一点,接下来就要弄清,我们建立的这个理论是否真的可以在实际情况中应用,从而解决金属合金、玻璃、蜡和其他许许多多系统的问题。
- 自旋玻璃模型
在此前看到的伊辛模型中,自旋之间的力是这样的:在低温下,它们倾向于朝同一方向看齐,要么全部向上,要么全部向下。
然而,在自旋玻璃模型中,作用于某些自旋对之间的力则倾向于使自旋朝向相反的方向,这就使情况变得复杂了。
让我们来举个实际的例子。在生活中,我们往往很容易意识到自己的目标与别人的不一致,因此不得不放弃自己的追求。例如,我想与甲先生和乙先生成为朋友,但不幸的是,他们二人不睦,因此我很难同时与他们成为非常要好的朋友。这种情况本身令人沮丧不已,但涉及很多人时,就会变得更加复杂。
我们想象一部这样的悲剧:两个群体之间有一场争斗,剧中的每个角色都必须选边站队。而且,他们每个人对别人都有强烈好恶(这真是一出悲剧!)。简单起见,我们可以假设他们之间喜欢与厌恶的感觉都是相互的(今天已经开发出了一些方法,可以处理他们之间感觉并非相互的情况)。
我们从这部剧中选取三个角色,安娜、雅丽和保罗。如果这三个人彼此都很友善,那就没有问题了,他们会选择同一队。同样简单的结果是,如果他们中的两个人关系很好,并且都讨厌第三个人,第三个人也讨厌他们,在这种情况下,志趣相投的两个人会选择同一队,而剩下那个人将选择另一队。但是,如果他们三人互相看不顺眼,又会有怎样的结果呢?这会造成一定程度的沮丧感,因为有两个互不喜欢的人必然会在同一队中。
当许多这样的三人组感到沮丧时,情况显得就开始变得不稳定了,有些人可能会换到另一队,试图找到总体沮丧程度相对较低的状态。我们可以将这种“戏剧张力”定义为沮丧三人组的数量除以所有三人组的总数。
详细的研究表明,在莎士比亚的悲剧中,这样定义的戏剧张力在悲剧开始的时候非常小,剧情进行到一半的时候达到峰值,最后在悲剧结束时减小。
在上图的自旋玻璃示意图中,不再有三元组,而是将自旋置于方形网格上,每个自旋只能向上或向下(禁止朝向其他方向)。刚才说的“友善关系”,现在我们称之为“铁磁键”,这是倾向于让自旋指向同一方向的力,在上图中我们用实线表示。而前面讲的“厌恶关系”就变成了“反铁磁键”,用虚线表示,这代表倾向于让自旋指向相反方向的力。同样,我们可以很容易地验证它们是否存在阻挫(“沮丧感”)。来看看下图的例子:
在这种情况下,左上角的自旋与其下方的自旋之间有一个反铁磁键,但与右侧的自旋之间有一个铁磁键,这样的话它只能满足这两个键中的一个,所以并不知道它会向上还是向下。
最早的自旋玻璃模型是由爱德华兹和安德森提出的,但更简单的模型是谢林顿和柯克帕特里在 1975 年建立的。
现在回到我的问题上来,如果使用复本法来计算谢林顿和柯克帕特里模型描述的自旋玻璃系统的物理量,会遇到一系列不合逻辑的问题。例如,计算得到的熵会出现负值,这是不可能的,因为在每个物理系统中,熵都是一个被定义为正值的变量。如果一个系统中熵的计算结果是负值,要么计算结果是错的(这种情况有可能发生,但事实并非如此,因为我们都进行了检查),要么某个地方存在概念性错误。
- 寻求解决办法
我最初犯的概念性错误有两个。第一个是技术上的错误,很难向非专业研究人士解释清楚,总之是与错误的数学假设有关。
另一个是物理上的错误,因为我不知道我正在研究的现象有哪些特征(后来我花了三年多的时间才弄明白我所做的这个数学解的物理意义)。
1979 年,在我写的第一篇关于这个内容的文章中,我明确指出,可以使用一个给定的结构来部分解决这一问题。文章最后,我兴奋地补充道:“这个结构可以推广,以便得到完备的解决方案。”
正如科学论文通常的遭遇,我这篇文章在发表之前被送到了一位评审专家那里,也就是一位能看懂文章并决定是否值得发表的同行。他的评语大致是说:“帕里西做的东西让人完全不能理解。然而,由于方程给出的结论符合数值模拟的结果,因此这篇文章也可以发表。至于文中提到推广此方法以适用于更复杂情况的部分,不必赘述。”后来这篇文章发表了,不过我删去了最后一部分内容。
抛开这些轶事不谈,其实那时候我真的不知道自己在做什么。我已经找到了一些处理问题的规则,并加以应用,最后经过一系列的步骤建立了方程,而且是有意义的,最重要的是,通过方程得到的结果与数值模拟的数据完全相符,还得到了熵的正值。
但在“计算过程”中发生了什么我还没弄明白,这就像进入一条隧道,然后却发现自己莫名其妙地从另一头出来了。
在接下来的一篇文章中,理论结果和模拟结果之间的一致性表明,我的理论是有意义的,但这种意义仍然不够清晰。
我没弄懂的物理问题与物理学家所谓的序参量有关。真如我们所看到的,系统中的状态转换通常以参数的变化为特征。例如,研究液体和气体之间相变的序参量是密度。在铁磁相变中,要研究的序参量是磁化强度。在相变过程中,序参量会发生变化,例如密度或磁化强度,其不同数值的物理意义是很容易理解的。
然而令人感到意外的是,在我对自旋玻璃的计算结果中,序参量不再是一个在相变过程中值会发生变化的简单数字:在相变过程中变化的居然是一个函数。一个值是不足以描述相变的,但我当时使用的函数并非单独一个数字组成,而是由无限多个数字组成。
这个函数在物理上代表什么呢?使用函数而不是一个数字作为相变的序参量,是复本法是否奏效的分水岭。如果参数只有一个数字,复本法会导致荒谬的结果。相反,如果序参量是一个函数,即一组无穷多的数字(就像一条线可以被视为一组无穷多的点一样),那么复本法奏效,且会得到自洽的结果。
显然,如果需要用无穷多的数(即函数)来描述系统的相变,就必须有一个深刻的物理意义来支持,但这个意义在当时是完全无法理解的。
- 奇怪的数学
在开始讨论物理问题之前,我们先试着从数学角度来了解一下哪些改变是必要的。
为了使复本法有效,我必须对其进行“延拓”。某一数学方法存在延拓的可能性是基于一种古老得思想。第一个有这种想法的人可能是生活在 14 世纪中叶的法国主教、数学家、物理学家和经济学家尼古拉·德·奥雷姆。
这是一位令人难以置信的人物,他清楚地证明了中世纪并不像我们教科书中所说的那样是科学的黑暗时代。在能显示其才能的诸多证据中,有一本他写的书(大约在 1360 年!),讲的是大气折射造成的恒星位置的扭曲。我当然没有读完,因为是用拉丁语写的……然而,从概念的角度来看,他的推理是正确的。他可能是在日落时看到太阳在地平线上有被压扁的感觉而受到启发,认为这可能是一种扭曲变形现象。计算扭曲变形对于进行精确的天文观测是至关重要的,因为恒星的直接测量必须进行两到三度的校正。
回到我们的话题,奥雷姆第一个发现了一个数的 1 / 2 1/2 1/2 次幂就相当于它的平方根。现在对我们来说,这似乎微不足道,我们从高中就开始学了,却没有意识到奥雷姆在将幂的性质扩展到分数方面所做的逻辑飞跃,因为在他以前,幂的性质只适用于整数。
求幂的概念非常简单:求一个数的二次幂,就是取这个数两次,算出乘积;求三次幂,需要取三次,算出乘积,以此类推。所以求 1 / 2 1/2 1/2 次幂看起来显然是一个荒谬的操作,难道意味着“取半次”?奥雷姆的想法是将求幂的性质扩展,根据该性质,如果对一个已求幂的数求幂,则必须相应地把指数相乘。 2 2 2^{2} 22 的三次方等于 2 6 2^{6} 26(即 64 64 64,或为 4 3 4^{3} 43)。
如果把一个数字平方后再求 1 / 2 1/2 1/2 次幂,我们会得到起始数字(因为 2 2 2 乘以 1 / 2 1/2 1/2 等于 1 1 1),这意味着求 1 / 2 1/2 1/2 次幂相当于取平方根:事实上,一个数字平方后再取平方根就是该数字本身。
这些性质是正式推导出来的,因为取一个数字半次是没有意义的;然而,形式上确保了结果的自洽性。尼古拉·德·奥雷姆超越了最初的观点,即直接理解,而通过保存形式的一致性,他获得了一种非常简单的方法来解决极其复杂的运算。
从奥雷姆开始,数学经常在新的条件下以一种形式上正确的方式扩展性质,从而拓宽其适用范围。
为了解决我的问题,我使用了类似的方法。我在形式上应用了仅针对整数开发和验证的数学技术,希望形式上的性质对于非整数也仍然有效。
我的想法是组合数学的延伸。例如,组合数学告诉我有多少种方法可以将 10 个物体成对放置在 5 个抽屉中。扩展一下,我可以用同样的等式,算出在 10 个抽屉里放置 5 个物体的方式有多少种,这样每个抽屉里就有“半个”物体。显然,结果毫无意义,因为从实际的角度来看,操作无法完成,它并不对应于将物体一分为二,而只是说抽屉中物体的数量是二分之一。然而,为了得到一个正常的解(一般情况下处理的是真实的物体),我必须基于这些想象的物体来完:抽屉里可以有半个物体,物体的总个数可以是非整数,把这些非整数的物体放进抽屉的方案数也可以是非整数!
从这个方法开始,我的想法是将物体分成两半,然后再分成两半,使抽屉中的物体数趋于零。
当然,这是一个纯粹的数学过程,几乎没有物理意义,但它得出了正确的结果,与模拟数据相符。
但是仍有两个问题悬而未决,即从数学上证明执行这种操作是有意义的,并从物理上理解用一个函数而不是单个变量来描述这个序参量的意义。
- 物理学解释
几年后,复本法的数学语言被翻译成了统计物理学的语言,尽管公式更为冗长,但却更容易理解。
通过一系列线索,我和我的朋友马克·梅扎尔、尼古拉·苏拉斯、热拉尔·图卢兹及米格尔·维拉索罗已经能够理解这一结果的物理意义,这是所有无序系统的共同特征,即无序系统同时处于大量不同的平衡态中。这是一个完全出乎意料的发现。
如上图所示,系统可以处于沿曲线分布的任何状态(例如,我们看图中四个黑点
A
A
A、
B
B
B、
C
C
C、
D
D
D,它们表示系统可以处于的许多可能性状态中的四个)。系统的各个状态都有不同的能量,且系统可以在不同的能量极小值处(凹陷处)达到平衡。在标为
A
A
A 的状态中,系统也处于该区域的最低点,状态
B
B
B 也一样,但在状态
C
C
C 和
D
D
D 中,系统处于较浅的凹陷(即系统处于平衡状态,除非升高系统温度,否则不会出离这一状态),但这不代表该区域的最小值。
该图还显示了两个较大的凹陷区域(
A
A
A 周围的区域和
B
B
B 周围的区域),每个凹陷区域内都有许多小凹陷。我们可以称之为
M
M
M 区和
N
N
N 区,见上图。当系统冷却到
N
N
N 区中的某个状态(例如
B
B
B、
C
C
C、
D
D
D 之中任何一个状态)时,即使温度升高,如果升高幅度不太大,系统也会保持在该区域。随后,系统将会在一个区域内不断演化,即发展为一系列构型,这些构型的选择是由系统的演化历史决定的,或者说是由其所处的区域决定的。在降温过程中,系统选择的区域只是众多可能性中的一个。
通常一个物理系统只处于一种状态。例如,在一定温度和压力下,水要么是液体,要么是固体,要么是气体。在某些特殊情况下,系统可能处于两种状态,我们通常称之为两种相。在 100 ° C 100\ \degree\mathrm{C} 100 °C 时,水可以同时处于液相和气相。也存在一个特殊的压力和温度值,此时水同时处于三种相:固相、液相和气相。这就是著名的水的“三相点”,它的出名并非偶然。一般来说,系统都会处于某个单一的相中。然而,我们也发现了同时处于无数相中的低温无序系统。这就是使用一个函数,即无穷多个数值的集合,来表示序参量的意义所在。
理解了这一点,对于物理学而言,是一个真正的进步。综合模型的建立及其结果让我们发现了一种从未见过的现象。就这样,无序系统的世界向我们敞开了大门。
从物理学的解释出发,数学解释也变成了可能。数学的论证花了二十多年时间,弗朗切斯科·圭拉及其合作者为了在一团乱麻中理清头绪做了很多基础工作。论证中使用的论据,就其简易性而言都颇具奇思妙想,但事后再看,这一切又似乎都很简单。
- 从模型到现实
为自旋玻璃的问题找到答案是研究真正玻璃的一个很好的起点,也就是研究那些镶在窗户上的玻璃,至今我们对其行为还没有一个完全的物理学认知。自 20 世纪 90 年代中期以来,我一直在断断续续地从事这项研究以获得准确的描述,从而使我们能够掌握玻璃相变的方方面面。
与自旋玻璃一样,真正的玻璃也是一个无序的系统,这种无序是由于玻璃的成分不仅有硅,还有许多杂质,以及许多不同类型、不同大小的分子,它们相互混合而构成玻璃。因此玻璃不能结晶,因为结晶需要规则的结构。如我们所见,被称为自旋玻璃的这种金属合金,其无序性是由金内部铁原子排列的随机性造成的,当金属是液体时,铁原子可以在金内部随机移动,但随着合金冷却,铁原子移动的可能性就越来越小,最后被随机困在某一位置。
现在,我们正试图对这个真实过程有一个具体的认识,一切看起来极其复杂,然而工作一旦完成,就会变得非常简单。当你在书上学习一个物理理论或数学定理时,不也是清晰明确的吗?然而为获得结果而进行的大量复杂工作却将灰飞烟灭。
另一个需要面对的有趣问题是从示意模型(例如刚刚讲过的自旋玻璃模型)过渡到更为现实的模型,从而更详细地描述自旋之间的力,例如要考虑到自旋之间相互距离的因素。
相变是通过具有精确空间位置的个体之间的相互作用而发生的,这在前面讨论时用的简化模型中没办法呈现。
除了缺乏空间结构外,简化模型也无法呈现时间的发展。
当我们要研究的系统处于平衡状态时,也就是说当它在某一时间内保持稳定时,统计力学的技术就“容易”派上用场。对于玻璃或蜡等无序系统,达到平衡状态所需的时间通常非常长,可能要好几年或好几个世纪。当然这也会发生在窗户的玻璃上,只不过我们会用一些工业技术让它们更加坚固。
如果一个物理过程不处于平衡状态,那么时间就有了意义,因为人们总是可以区分过程的时间前后,这在处于平衡状态的系统中是无法区分的。
简单地说,如果一个球处于稳定的平衡状态,即停在坑底,给它拍一些照片,那么我们永远无法将这些照片按拍摄的时间顺序排列,因为这个球的状态未呈现出任何变化的迹象。但是,如果拍摄一个滚落的球,情况就会发生变化,因为在不平衡的状态下,时间先后是显而易见的。
因此,我们面临的问题是要将理论拓展至和时间相关的情形,因为存在这种不平衡状态;另外,我们还要将理论拓展至和空间相关的情形,因为这些过程都在空间中进行,而且只有相邻粒子之间才会有相互作用。总之,为了彻底了解玻璃的相变,还有大量的工作要做。
- 拓宽视野
我的初衷是检查一种可以帮我解决粒子问题的数学方法(对于那个问题,复本法的原始版本得心应手),后来我发现自己掌握了一个非常强大而实用的数学和概念工具,可用于解决各种貌似毫无关联的问题,也就是与无序系统相关的问题。
现实世界是混乱无序的,正如我们一开始所说的那样,许多现实世界的情况可以通过大量相互作用的基本单元来描述。
我们可以用简单的规则将单元之间的相互作用模式化,但这些集体行为的结果实在是难以预料。
所谓基本单元一般是自旋、原子或分子、神经元、细胞,但也包括网站、证券经纪人、股票和债券、人、动物、生态系统的各个组成部分……
并非所有基本单元之间的相互作用都会产生无序系统。无序产生的原因是一些基本单元的行为与众不同,比方说一些自旋试图反向排列,一些原子与其他大多数原子有区别,个别金融运营商抛售其他人正在购买的股票,一些受邀参加晚宴的嘉宾与某些客人不睦,想坐得离他们远点……
这样看来,在所有这些无序的情况下,我发现的数学和概念工具对于解决问题都是不可或缺的。
例如,最近我们做了一个实验,将尽可能多的大小不一的固体小球放入一个盒子中,结果实验取得了重要的成果。这是一个非常有趣的问题,因为这些大小不一的固体小球可以用来构建液体、晶体、胶体系统、颗粒系统和粉末的模型。此外,固体小球的“装箱问题”与信息和优化理论的重要问题也息息相关。
8. 复本对称破缺对交叉学科的影响
复本对称破缺本属于非常抽象的数学物理概念,但40年来,我们难以置信地看到它广泛地存在于各交叉学科领域,甚至影响了概率论的研究分支。接下来简述一下复本对称破缺在神经网络及优化问题研究方面的影响。神经网络是当前科学研究范式(AI for Science)的基本工具,而优化问题更是非常古老的学科方向。
8.1 神经网络的理论研究
帕里西开创的复本对称破缺的研究范式,是其获得诺贝尔物理学奖的重要原因。该范式在 1980 年代中期就已延伸到人工神经网络的理论研究。这对于当前人工智能的基础理论研究不乏具有参考价值。
早期的研究集中于分析联想记忆网络。这类网络是根据神经科学的赫布律来设计的简单循环神经网络,它能够提取部分被破坏的记忆模式,从而模拟大脑的联想记忆功能。复本方法的主要贡献在于解析了联想记忆的相图,发现了记忆相、顺磁相和自旋玻璃相,并且发现通过记忆相的转变都是一级相变 [8]。这个工作使得统计物理第一次能够深刻理解复杂的神经网络结构与功能之间的关系,并由此开启计算神经科学这一学科。做出这一开创性工作的科学家之一,意大利理论物理学家阿米特(D. Amit)更是在 1989 年就出版了相关学术专著,将其一生都贡献给了计算神经科学的早期发展,培养了很多这一领域的领导者。另一科学家佐姆波林斯基(H. Sompolinsky)在以色列创建了埃德蒙和莉莉·萨夫拉脑科学中心,并大力发展神经物理学,成为了横贯统计物理、神经网络和脑科学领域的大师级人物。
同一时期,受阿米特影响的粒子物理学家阿博特(L. Abbott)也在 1990 年代转向神经网络和脑科学研究,随后在哥伦比亚大学创建了享誉世界的扎克曼大脑行为研究所,培养了这一领域相当活跃的很多年轻学者。同在 1980 年代中期,加德纳(E. Gardner)也以一己之力创建了在感知机(监督学习的典型网络)中的加德纳理论 [9],该理论也是基于复本分析的研究范式,其强大之处在于能够定量计算神经网络计算的物理极限,比如存储容量、最小数据量、算法学习极限等 [5]。
1995 年,弗朗兹(S. Franz)和帕里西为研究自旋玻璃提出了Franz-Parisi势 [10],巧妙地将统计物理构型空间的几何结构纳入热力学势函数的计算。2014 年,笔者将Franz-Parisi势用于分析感知机学习的计算复杂性起源,揭开了人工神经网络态空间的几何分析序幕 [11]。随后学界提出局域熵的概念 [12],拓展了人们对神经计算的认知边界。传统的平衡态分析显示,这些几何孤立的态基本是零熵的;然而,经验设计的学习算法动力学往往被态空间的少数稠密区域所吸引,而这些区域对神经网络的泛化(即举一反三能力)性能有关键性的影响 [12]。
除此之外,复本方法还可用于对无监督学习(即无师自通)的研究。笔者从 2015 年开始着力于这方面的理论研究,用简明的数学和清晰的物理图像勾勒出学习过程的本质是自发对称性破缺 [13]。这种类型的研究还有很多,都与帕里西在自旋玻璃理论的开创性研究息息相关。
在近 40 年来人工神经网络的理论研究中,复本方法及复本对称破缺的概念扮演着不可或缺的角色。如今,无论在机器学习或神经科学有建树的科学家中,有相当一部分在职业生涯早期曾接受过统计物理或物理学的严格训练。在帕里西获得诺贝尔奖之际,许多计算神经科学家或理论机器学习学者表达了对他的祝贺和感激,因为帕里西的思想促成了如今神经网络的理论研究这一交叉学科的繁荣!
8.2 组合优化算法的物理分析
21 世纪初,帕里西与合作者系统地提出空腔方法 [14],这是与复本方法相辅相成的物理学基本方法。空腔方法的本质在于分析稀疏因子图(这类图一般有两种节点,一种代表变量或自旋,另一种代表约束或相互作用;典型的计算机科学问题,比如组合优化的随机 k-SAT 问题就可映射成这样的物理问题)时,通过引入图上节点的虚拟缺失,构造空腔概率的迭代方程,从而求解体系的自由能等物理量。这类组合优化问题的复杂性也深深吸引帕里西对其进行深入系统的研究。值得一提的是,他与合作者发现,处于 NP-完备类的随机 k-SAT 问题(k 可以理解为自旋的多体相互作用,SAT 可以理解为求解能量基态)也存在复本对称破缺相,并且在复本对称破缺思想的指导下,帕里西与合作者提出全新的算法——调查传播法(survey propagation),求解组合优化 SAT 问题基态的极限逼近理论阈值 [15]。
为了表彰他们的贡献,美国物理学会在 2016 年将统计物理学界的重要奖项“昂萨格奖”授予帕里西与其合作者。这显示了统计物理与计算机科学甚至信息科学的基本问题存在着深刻的联系。
8.3 复杂系统的研究路在何方:智能起源
当今, 非常复杂的两类系统——以连接主义为代表的人工智能和人脑,仍然缺乏从原理层面上去理解的突破。其中人工智能毫无疑问已经在重塑人类社会经济的方方面面,而人类对于大脑的理解也必将对社会文明产生不可估量的影响。最近,科学探索奖历届得主评选出的十大科学技术问题的前 3 个分别为:①人类的意识,以及学习和记忆的生物基础从何而来;②人脑和机器是否能实现直接通讯;③通用人工智能是否能实现。寻找这些问题的答案并非易事,尽管最后答案可能很简单。
统计物理方法是一座架起微观作用到宏观涌现的桥梁,而帕里西在无序系统研究的奠基性贡献,将指引物理、数学、机器学习与理论脑科学交叉方向的科学家破解人工智能和人脑的奥秘。机器智能和生物智能是由非常复杂的组元(比如神经细胞、神经突触等),通过时空多层级的相互作用所形成的集体行为,其中精确的数学机制很难一目了然。在这条艰辛的求索道路上,兼具物理深刻性和数学美的理论无疑将开启本世纪在认知科学方面的科学革命,让从第一性原理出发设计智能世界变成了可能。也只有到了那个时刻,就像麦克斯韦从其方程组导出光是电磁波那样,人类文明也必将步入一个崭新的时代!
9. 无限范围模型(Infinite-range model)
无限范围模型是 Sherrington-Kirkpatrick 模型的推广,其中我们不仅考虑两个自旋相互作用,还考虑 r r r-自旋相互作用,其中 r ≤ N r \leq N r≤N 和 N N N 是总自旋个数。与 Edwards-Anderson 模型不同,与 SK 模型类似,相互作用范围仍然是无限的。该模型的哈密顿量描述为:
H = − ∑ i 1 < i 2 < ⋯ < i r J i 1 … i r S i 1 ⋯ S i r H = -\sum_{i_1 < i_2 < \cdots < i_r} J_{i_1 \dots i_r} S_{i_1}\cdots S_{i_r} H=−i1<i2<⋯<ir∑Ji1…irSi1⋯Sir
其中 J i 1 … i r , S i 1 , … , S i r J_{i_{1}\dots i_{r}},S_{i_{1}},\dots ,S_{i_{r}} Ji1…ir,Si1,…,Sir 与 EA 模型中的含义相似。该模型的 r → ∞ r\to \infty r→∞ 的极限称为随机能量模型(random energy model)。在这个极限中,可以看出自旋玻璃存在于特定状态的概率仅取决于该状态的能量,而不取决于其中的单个自旋构型。通常假设跨晶格的磁键(magnetic bonds)呈高斯分布来求解该模型。由于中心极限定理,任何其他分布都有望给出相同的结果。高斯分布函数,均值 J 0 N \frac {J_{0}}{N} NJ0 和方差 J 2 N \frac { J^{2}}{N} NJ2 为:
P ( J i 1 ⋯ i r ) = N r − 1 J 2 π r ! exp { − N r − 1 J 2 r ! ( J i 1 ⋯ i r − J 0 r ! 2 N r − 1 ) } P\left(J_{i_{1}\cdots i_{r}}\right)={\sqrt {\frac {N^{r-1}}{J^{2}\pi r!} }}\exp \left\{-{\frac {N^{r-1}}{J^{2}r!}}\left(J_{i_{1}\cdots i_{r}}-{\frac {J_{0}r!}{2N^{r-1}}}\right)\right\} P(Ji1⋯ir)=J2πr!Nr−1exp{−J2r!Nr−1(Ji1⋯ir−2Nr−1J0r!)}
该系统的序参量由磁化强度 m m m 和在同一位置的自旋之间的两点自旋相关性 q q q 给出,在两个不同的复本中,这与 SK 模型相同。在复本对称性和 1-复本对称破坏(1-Replica Symmetry Breaking)的假设下,这个无限范围模型可以根据 m m m 和 q q q 明确地求解自由能。
β f = 1 4 β 2 J 2 q r − 1 2 r β 2 J 2 q r − 1 4 β 2 J 2 + 1 2 β J 0 r m r + 1 4 2 π r β 2 J 2 q r − 1 + ∫ exp ( − 1 2 z 2 ) log ( 2 cosh ( β J z 1 2 r q r − 1 + 1 2 β J 0 r m r − 1 ) ) d z \begin{aligned} \beta f={}&{\frac {1}{4}}\beta ^{2}J^{2}q^{r}-{\frac {1}{ 2}}r\beta ^{2}J^{2}q^{r}-{\frac {1}{4}}\beta ^{2}J^{2}+{\frac {1}{ 2}}\beta J_{0}rm^{r}+{\frac {1}{4{\sqrt {2\pi }}}}r\beta ^{2}J^{2}q^{r -1}+{}\\&\int \exp \left(-{\frac {1}{2}}z^{2}\right)\log \left(2\cosh \left(\beta Jz{ \sqrt {{\frac {1}{2}}rq^{r-1}}}+{\frac {1}{2}}\beta J_{0}rm^{r-1}\right)\right)\,\mathrm {d} z \end{aligned} βf=41β2J2qr−21rβ2J2qr−41β2J2+21βJ0rmr+42π1rβ2J2qr−1+∫exp(−21z2)log(2cosh(βJz21rqr−1+21βJ0rmr−1))dz
10. 非遍历行为和应用(Non-ergodic behavior and applications)
当给定系统的任何(平衡)实例(instance)时,它最终会访问所有其他可能的(平衡)状态(具有相同的能量),此时称此热力学系统是遍历的。自旋玻璃系统的一个特点是,低于冻结点 T f T_{\text{f}} Tf,实例被困在一组“非遍历”的状态:系统可以在几个状态之间波动,但不能转换到其他等效能量状态。直觉上,可以说系统无法摆脱层级混乱的能量景观的深度最小值;最小值之间的距离由超度量(ultrametric)给出,最小值之间的能垒很高。参与率(participation ratio)计算从给定实例可访问的状态数,即参与基态的状态数。自旋玻璃的遍历方面的研究有助于将 2021 年诺贝尔物理学奖的一半授予 Giorgio Parisi。
对于物理系统,例如铜中的稀有元素锰(dilute manganese),冻结温度通常低至 30 30 30 开尔文( − 240 ° C -240\ \degree \mathrm{C} −240 °C),因此自旋玻璃磁性似乎在日常生活中几乎没有应用。然而,非遍历状态和崎岖的能量景观(energy landscapes)对于理解某些神经网络的行为非常有用,包括 Hopfield 网络,以及计算机科学优化和遗传学中的许多问题。
11. 自诱导自旋玻璃(Self-induced spin glass)
2020 年,Radboud University 和 Uppsala University 的物理研究人员宣布,他们在钕的原子结构中观察到一种称为自诱导自旋玻璃的行为。一位研究人员解释说:“…我们是扫描隧道显微镜的专家。它使我们能够看到单个原子的结构,并且我们可以分辨原子的北极和南极。随着高精度成像的进步,我们能够发现钕中的行为,因为我们可以解决磁性结构中令人难以置信的微小变化。”钕以一种以前在元素周期表元素中从未见过的复杂磁性方式表现。
12. 空腔方法(Cavity method)
空腔法是 Marc Mézard、Giorgio Parisi 和 Miguel Angel Virasoro 在 1987 年提出的一种数学方法,用于求解统计物理学中的一些平均场类型模型,特别适用于无序系统。该方法已被用于计算许多凝聚态物质和优化问题中的基态特性。
最初发明用于处理旋转玻璃的 Sherrington-Kirkpatrick 模型,腔方法已显示出更广泛的适用性。它可以看作是 Bethe-Peierls 迭代方法在树状图中的推广,适用于环不是太短的图的情况。可以用腔方法完成的不同近似通常以它们的等效复本方法命名,复本方法的不同步骤在数学上比腔方法更微妙且更不直观。
空腔方法已被证明在解决优化问题(如 k-satisfiability 和 graph coloring)中很有用。它不仅在平均情况下产生了基态能量预测,而且还启发了算法方法。
- 参考文献
-
Edwards S F, Anderson P W. Theory of spin glasses. Journal of Physics F, 1975, 5(5): 965-974.
-
Sherrington D, Kirkpatrick S. Solvable model of a spin-glass. Physical Review Letters, 1975, 35(26): 1792-1976.
-
Almeida J, Thouless D J. Stability of the Sherrington-Kirkpatrick solution of a spin glass model. Journal of Physics A General Physics, 2001, 11(5): 983.
-
Parisi G. Infinite number of order parameters for spin-glasses. Physical Review Letters, 1979, 43(23): 1754-1756.
-
Haiping Huang. Statistical mechanics of neural networks. Singapore: Springer, 2022.
-
Talagrand M. The Parisi formula. Annals of Mathematics, 2006, 163: 221.
-
Ghofraniha N, Viola I, Maria F D, et al. Experimental evidence of replica symmetry breaking in random lasers. Nature Communications, 2015, 6: 6058.
-
Amit D J, Gutfreund H, Sompolinsky H. Storing infinite numbers of patterns in a spin-glass model of neural networks. Physical Review Letters, 1985, 55(14): 1530.
-
Gardner E. The space of interactions in neural network models. Journal of Physics A-Mathematical and General, 1988, 21: 257-270.
-
Franz S, Parisi G. Recipes for metastable states in spin glasses. Journal de Physique I, 1995, 5(11):1401.
-
Huang H P, Kabashima Y. Origin of the computational hardness for learning with binary synapses. Physical Review E, 2014, 90(5): 52813-52813.
-
Baldassi C, Ingrosso A, Lucibello C, et al. Subdominant dense clusters allow for simple learning and high computational performance in neural networks with discrete Synapses. Physical Review Letters, 2015, 115(12): 128101.
-
Hou T, Huang H P. Statistical physics of unsupervised learning with prior knowledge in neural networks. Physical Review Letters, 2020, 124(24): 248302.
-
Mézard M, Parisi G. The Bethe lattice spin glass revisited. The European Physical Journal B-Condensed Matter and Complex Systems, 2001, 20(2): 217-233.
-
Mézard M, Parisi G, Zecchina R. Analytic and algorithmic solution of random satisfiability problems. Science, 2002, 297: 812-815.
Sadoc, J. F.; Mosseri, R. (2007). Geometrical Frustration (reedited ed.). Cambridge University Press. ISBN 9780521031875.
视频: 周海军. 自旋玻璃: 计算复杂性的统计物理. 2021.11.19.
李欣阳, 金瑜亮. 无序中的对称性——诺奖得主帕里西工作解读[J]. 物理, 2022, 51(01): 29-34.
Giorgio Parisi. 随椋鸟飞行: 复杂系统的奇境. 2022.
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)