首页 > 数码科技 > 杨振宁指的是谁呢?_ising模型

杨振宁指的是谁呢?_ising模型

栏目:数码科技

作者:B姐

热度:0

时间:2024-02-28 09:59:31

指的是中国科学院院士、诺贝尔物理学奖获得者杨振宁先生。

杨振宁,男,1922年10月1日(护照上为9月22日)生于安徽合肥,物理学家,香港中文大学博文讲座教授兼理论物理研究所所长,清华大学高等研究院名誉院长、教授,纽约州立大学石溪分校荣休教授,中国科学院院士、香港科学院荣誉院士,1957年获诺贝尔物理学奖。

1949年,进入普林斯顿高等研究院进行博士后研究工作,开始同李政道合作。当时的院长奥本海默说,他最喜欢看到的景象,就是杨、李走在普林斯顿草地上;同年,与恩利克·费米合作,提出基本粒子第一个复合模型。

1996年,获清华大学、上海交通大学两所大学颁授荣誉博士学位。

2012年6月,杨振宁在清华大学庆祝90岁生日,并获得了校方赠送的刻有其重大贡献的黑水晶一尊。

2019年9月21日,获得2019年度求是奖“求是终身成就奖”。

学术成果:

统计力学是杨振宁的主要研究方向之一。他在统计力学方面的特色是对扎根于物理现实的普遍模型的严格求解与分析,从而抓住问题的本质和精髓。

1952年杨振宁和合作者发表了3篇有关相变的重要论文。第一篇是他在前一年独立完成的关于2维Ising模型的自发磁化强度的论文,得到了1/8这一临界指数。

这是杨振宁做过的最冗长的计算。Ising模型是统计力学里最基本却极重要的模型,但是它在理论物理中的重要性到20世纪60年代才被广泛认识。

1952年,杨振宁还和李政道合作完成并发表了两篇关于相变理论的论文。两篇文章同时投稿和发表,发表后引起爱因斯坦的兴趣。

材料热力学的材料热力学(第三版)

李政道是为中国做出巨大贡献的人。李政道想留在哪里,完全是他个人的自由。一个充分尊重别人自由的国家,才是值得被尊重的国家。李政道虽然回国次数不如杨振宁多,当年也是风云人物,受到了很多人的接见。而中国也通过李政道的关系,送了很多人才到国外进修。

1986年,李政道还创立了中国高等科学技术中心(CCAST)并担任主任。而论爱国之心,李政道与杨振宁是一样的,在大是大非面前都很可靠。莫伟给中科院领导写信,提出:海外科学家都有私心,只有杨振宁和李政道完全没有私心,一心一意想中国发展的好。宇称不守恒的发现,被誉为20世纪物理学中的革命。根据《李政道传》所写,这一发现是由李政道先找到突破口的。

1956年大约是4月底和5月初的一天上午,杨振宁开车从长岛来纽约哥伦比亚大学看李政道,在李的办公室里进行了讨论。不久,杨振宁要移动他停在街上的汽车,他们就走到街上。把车停好后,由于饭馆都还没开门,他们就近在125街和百老汇大街路口的白玫瑰咖啡厅边喝咖啡边讨论。李政道把最近的工作以及宇称不守恒的突破性想法,统统告诉了杨振宁。

杨振宁激烈地反对李政道所说的一切。但经过反复的讨论,他逐渐被说服。午饭后,他们回到李政道的办公室,杨已经完全被说服,并表示愿意与李合作。他还提出了一个很重要的建议,就是劝李不要急忙发表上述那篇论文。他说,这是一个非常热门的突破,应该用最快的速度,将整个弱作用领域一下子都占领下来。这样更加完整,有更大的意义。

李政道觉得十分有道理,同时觉得如有杨振宁的参加,会使整个事情做的更好。两人开始了友好的竞赛。他们在大约两周内完成了全部的β衰变分析。这需要进行大量计算。两人在计算能力上不相上下,都做出了贡献。一个月后他们完成了对这些过程的分析,写出了论文。这篇论文是由李政道执笔,署名也是李政道在前。这就是轰动一时后来获得1957年诺贝尔奖的那篇论文。

讲真,霍金与杨振宁相比差远了!

书名:材料热力学(第三版)

ISBN:703014617

作者:徐祖耀 李麟

出版社:科学出版社

定价:35

页数:308

出版日期:2005-1-1

版次:

开本:16开

包装:平装

简介

本书可供从事材料科学、金属学、力学、机械等研究的科技人员参考,也可作为高等院校相关专业的教学参考书。

目录:

第三版前言

第二版前言

前言

第一章 热力学第一定律

1-1 热和功

1-2 热力学第一定律

1-3 状态函数和全微分

1-4 焓和比热容

1-5 标准态

1-6 例题

第二章 热力学第二定律和第三定律

2-1 自发过程和不可逆过程

2-2 熵及热力学第二定律

2-3 平衡态的判据

2-4 熵的统计概念

2-5 配置熵(组态熵、混合熵)

2-6 固溶体的混合熵

2-7 振动熵和磁性熵

2-8 热力学第三定律

2-9 Richard和Trouton规则

2-10 例题

第三章 自由能

3-1 自由能函数

3-2 自由能和温度的关系

3-3 例题

3-4 蒸气压与自由能

3-5 界面自由能

3-6 磁性自由能

参考文献

第四章 麦克斯韦方程及其应用

4-1 一些有用的关系式

4-2 理想气体的内能和焓

4-3 应用麦克斯韦关系式求dS

4-4 求du及dH

4-5 求C下标p-C下标v

4-6 热弹性效应

第五章 单元系中的相平衡

5-1 吉布斯自由能函数

5-2 一级相变和二级相变

5-3 Clausius-Clapeyron方程

5-4 Ehrenfest方程

5-5 纯组元中相平衡

5-6 超导态、磁性转变及λ相变

5-7 曲面相界面热力学

5-8 例题

参考文献

第六章 溶液

6-1 溶液中组元浓度的表示法

6-2 偏摩尔量

6-3 化学势(化学位)

6-4 亨利定律和拉乌尔定律

6-5 Gibbs-Duhem公式的积分和活度测定

6-6 溶液的界面吸附

6-7 其他偏摩尔量及其关系式

6-8 例题

第七章 二元系的自由能

7-1 形成溶液时自由能的变化

7-2 理想溶液与非理想溶液性质的比较

7-3 规则溶液

7-4 多余偏摩尔量

7-5 非规则溶液的自由能

7-6 混合相的自由能

7-7 例题

第八章 相平衡

8-1 单相平衡

8-2 多元系复相平衡的条件

8-3 相律的推导

8-4 二元系中的两相平衡及三相平衡

8-5 三元系中的相平衡

8-6 二级相变时的相平衡

8-7 例题

参考文献

第九章 统计热力学

9-1 概述

9-2 微正则系综、正则系综和巨正则系综

9-3 点阵统计理论和Ising模型

9-4 有序-无序转变

9-5 浓度起伏与固溶体分解

9-6 材料的电导、磁性和比热

9-7 分子合金的热力学

参考文献

第十章 溶液的统计热力学

10-1 溶液的准化学模型

10-2 溶液的中心原子模型

10-3 二元间隙溶液的中心原子模型

10-4 Gaye渣系模型

10-5 SELF液态合金及渣模型

参考文献

第十一章 相图热力学

11-1 概述

11-2 平衡相浓度的计算原理

11-3 端际固溶体的溶解度

11-4 有限溶解度固相线的计算

11-5 亚稳相的溶解度

11-6 二元系组元完全互溶的相图

11-7 由电子计算机测制相图

11-8 亚点阵模型及其应用

ll-9 二元系热力学性质的外推及实际应用

11-10 相图的优化计算

参考文献

第十二章 相变热力学

12-1 新相的形成

12-2 凝固热力学

12-3 脱溶分解

12-4 Spinodal分解

12-5 共析分解热力学

12-6 有序-无序相变驱动力的计算

12-7 马氏体相变热力学

12-8 贝氏体相变热力学

12-9

块状相变热力学

12-10 二级相变

12-11 纳米材料的相结构稳定性及相变热力学

参考文献

第十三章 化学平衡热力学

13-1 质量作用定律

13-2 范德霍夫等温方程

13-3 范德霍夫等压方程

13-4 Le Chatelier-Braun原则

13-5 金属的氧化

13-6 金属的渗碳

13-7 Fe-C中碳的活度

13-8 渗氮

13-9 气体在金属中的溶解度

参考文献

第十四章 材料中的一些物理现象的热力学分析

14-1 晶体中的缺陷

14-2 电-热效应

14-3 去磁制冷

14-4 热辐射

14-5 气体液化

14-6 扩散

14-7 杂质在晶界的偏聚

14-8 多元钢的偏聚热力学公式

14-9 回火马氏体致脆

14-10 例题

参考文献

全书主要参考文献

从深度神经网络到物理过程

霍金在中国这么出名,更多的是因为英国媒体和学术界的包装推广,当然他个人的学术成就也不低,但无法和杨振宁相提并论。

但是杨振宁在中国已经被很多人黑成了翔,黑他的人总是抓着模糊的道德问题紧追不放,却没有真正去了解他个人在物理学上取得的堪称伟大的成就。

和清华的老师聊过,杨振宁和翁帆感情是很好的,真心相爱的话大家有什么好喷的呢?还有人说,杨振宁退休回国就是捞钱养老,毫无用处。但实际上杨振宁回到清华,能够充分作用自身的影响力,调动学术界的很多资源,这很有利于清华相关学科的发展。要不然大家真以为他不值那个价儿?

网络时代,希望大家能够有自己的判断力,不要被一些媒体牵着鼻子走。特别是对人这种复杂个体的评价,更需要慎重。

清北经常被黑,很多人不了解内部情况,总是为了黑而黑,让我们这些学生痛心疾首。

大家时常会把Hawking和同时代的物理学家相比,譬如和C. N. Yang、Fermi、Pauli等等,实话实话,Hawking确实不如他们的成就多,不如他们成就高。至于说“Hawking是继Einstein后最伟大的科学家”,这仅仅是媒体宣传的说辞,在学界,这是不客观的。只能说Hawking是伟大的科学家,但和Einstein和C. N. Yang比起来,单从学术成果上讲,并不在一个层次上。就拿C. N. Yang(杨振宁)来说,Yang确实是现在在世的最伟大的物理学家,没有之一,他的成果众多,而且影响深刻,他的成果成为很多物理乃至数学领域相关分支的根基理论,譬如Yang-Mills规范场理论、Yang-Baxter方程等等,这些都要比Hawking最具代表性的成果:奇性定理、黑洞的Hawking辐射要更加重要,更加基本,而且如果去看Hawking论文的引用率,我们会发现,他的论文引用率是没有像Witten这样的人高的(Witten是著名弦论学家)。但是话又说回来,我们可能要问,为什么同时期有比Hawking优秀得多得多的物理学家,为什么Hawking的名气如此之大呢?很大程度上,是因为他身残志坚的形象和他令人敬佩的品质,Hawking作为一个深受“渐冻症”困扰的人,如今他可以做出这些科学成就,就已经非常了不起了,他的那种认真和坚守着实令人尊敬。

我们可以简单地看来一下Hawking的工作,Hawking的工作主要集中在广义相对论与宇宙学上,他和Penrose合作的一系列论文创建了现代宇宙学的数学结构理论:

奇性定理: Hawking和Penrose共同提出并证明了奇性定理,这是Hawking早年非常重要的工作,奇性定理告诉我们,“只要广义相对论正确,因果性良好,能量正定,而且时空中至少存在一点物质,那么这个时空就有奇点,或者说至少存在一个物理过程,时间有开始,或者有结束,或者既有开始也有结束”,该定理预言了时间的开始和终结。这个定理深刻表明了“大爆炸”奇点是Einstein广义相对论的必然结果。这一成果虽然重要,但是仍是广义相对论框架下的一个小点、一个小问题的解决。

黑洞力学(黑洞热力学): 首先Hawking论证了黑洞的事件视界必须具有球形拓扑。随后1973 年Hawking和其合作者Bardeen一起建立了黑洞和热力学基本定律的联系,譬如黑洞视界的表面积 A 和表面引力

kappa 分别能够类比于熵 S 和温度 T 这些热力学量。在这个时期,可以说Hawking在经典广义相对论领域内进行的研究是当时世界上最棒的。

Hawking辐射: Hawking最为重要的工作就是对黑洞热辐射的证明,现称之为Hawking辐射,它首次从微分几何上严格地证明了黑洞存在热辐射,而且是严格的黑体谱。这个工作是黑洞理论的核心,在理论上夜是极为重要的。目前的问题就是没有得到实验验证,而且也很难得到实验验证,因为Hawking辐射是非常小的,通过任何已有的技术都无法直接观测到。

虚时间和宇宙的无边界设想(Hawking无边界宇宙模型): Hawking和Hartle一起发展了的一套处理大爆炸奇点的量子方法,这就是“无边界”方法,即奇点被光滑的“帽子”所取代。为了理解这个观点,Hawking引入虚时间(或欧几里得化)的概念,这个概念将Einstein的赝Riemann几何转换为标准的Riemann几何。尽管这项工作存在独创性,但仍存在诸多困难。这是Hawking晚年的工作,但是还没有引起人们的注意,Hawking自己坦言:大家都普遍接受了黑洞的热辐射理论,但是他认为宇宙的无边界设想是更为重要的。不过必须说的是,Hawking的这套方法虽然受到很大的尊重,但并不是最受欢迎的。(不过通过无边界设想,可以回答一个公众非常感兴趣的问题:“宇宙在大爆炸之前是什么”。根据无边界设想,宇宙大爆炸奇点就相当于地球的南极点,因为并不存在比南极更往南的地方,所以大爆炸奇点之前什么也没有。)

如果和C. N. Yang(杨振宁)对比的话,不得不说Yang的成果不仅在量上要多得多,他在诸多领域都有所贡献,而且更为重要和基本,以下是Yang的13项最具代表性的成果:

弱相互作用中宇称不守恒: 这是Yang和Tsung-Dao Lee(李政道)早年共同发现在弱作用中宇称是不守恒的,而此前物理学界认为宇称无论是在强作用、弱作用还是电磁作用中都是守恒的。后来Chien-shiung Wu(吴健雄)领导的团队通过实验证明了在弱作用中宇称确实是不守恒的,在物理学界引起轩然大波。因为这项极为重要的工作,Yang和Lee一起分享了1957年的诺贝尔物理奖。 学物理的都应该知道对称性在物理中的重要性,因此宇称守恒有着直觉上的吸引力,所以不难理解这项颠覆性的工作是何等重要。

时间反演、电荷共轭和宇称三种分立对称性:Yang、Tsung-Dao Lee和Oehme发表论文讨论时间、电荷和宇称各自不守恒之间的关系。此文对1964年所有的关于CP不守恒的理论分析有决定性的影响。高能中微子实验的理论探讨: 1960年,实验物理学家Schwartz指出如何通过中微子束得到更多弱相互作用的实验信息。Tsung-Dao Lee和Yang在理论上探讨了高能中微子实验的重要性。这是关于中微子实验的第一个理论分析,引导出后来许多重要研究工作。

CP不守恒的唯象框架:1964年,Christenson、Cronin、Fitch和Turlay的实验发现了CP不守恒。Yang和他的学生吴大峻作了CP不守恒的唯象分析,建立了后来分析此类现象的唯象框架,这篇论文定义了这个领域至今仍在使用的理论框架和术语。

Yang-Mills规范场理论: 这是现代规范场理论的基础,更是20世纪下半叶重要的物理突破,而且是弱电统一理论的基础,该理论对研究基本粒子如强子的结构提供了强有力的工具。 1954年,Yang-Mills规范场论(即非Abel规范场论)发表。在两篇短文中,Yang和他的学生Mills将Weyl的Abel规范理论推广到非Abel规范理论。可以说Yang-Mills理论有“开天辟地”的崇高地位,它的成功是物理学史上的一场革命。

规范场论的积分形式:Yang-Mills理论还把物理与数学的关系推进到一个新的水准。

1970年左右,Yang致力于研究规范场论的积分形式,发现了不可积相位因子的重要性,从而意识到规范场有深刻的几何意义。

规范场论与纤维丛理论的对应:1970年代早期,Yang意识到规范场的几何意义以及规范理论的积分形式实际上是一个几何的发展,因此他向J. Simons学习纤维丛理论。Yang最终意识到物理学家所谓的规范对应于数学家所谓的主坐标丛,而物理学家所谓的势对应于数学家所谓的主纤维丛上的联络。

1975年,他发表了论文,揭示了规范场在几何上对应于纤维丛上的联络。

相变理论: 1952年Yang发表了3篇有关相变的重要论文。第一篇是他独立完成的关于二维Ising模型的自发磁化强度的论文,得到了 1/8 这一临界指数。这是Yang做过的最冗长的计算,是一个绝对的壮举。Dyson称其为“雅可比椭圆函数理论的大师式练习”。

1952年,Yang还和Tsung-Dao Lee合作完成并发表了两篇关于相变理论的论文,将对Ising模型的研究扩展到格气模型,并严格计算出气液相变的Maxwell图。两篇文章同时投稿和发表,发表后引起Einstein的兴趣。Yang和Lee的这两篇论文的高潮是第二篇论文中的单位圆定理(现称Lee-Yang单圆定理),它指出吸引相互作用的格气模型的巨配分函数的零点位于某个复平面上的单位圆上。在统计力学和场论中,这个理论至今魅力不减。

玻色子多体问题: Yang在1957年左右与合作者发表或完成了一系列关于稀薄硬球玻色子多体系统的论文,这是一个数学上定义完善的模型,早先Yang和Kerson Huang(黄克孙)、Luttinger合作发表了两篇论文,将费米的赝势法用到该领域。后来Yang和Tsung-Dao Lee用双碰撞方法首先得到了正确的基态能量修正,然后又和Huang、Lee用赝势法得到同样的结果。他们得到能量修正或者声速渐进展开的前两项, 其中最令人惊讶的是著名的平方根修正项(后来被称为Lee-Huang-Yang修正),但当时无法得到实验验证。出乎预料的是,50年后,这一修正项随着冷原子物理学的发展而得到了实验证实。

Yang-Baxter方程: 1967年Yang发现一维

delta 函数排斥势中的费米子量子多体问题可以转化为一个矩阵方程,后被称为Yang-Baxter方程。Yang的这个工作打开了两个领域的大门。后来人们发现Yang-Baxter方程在数学和物理中都是极为重要的方程,与扭结理论、Hopf代数以及弦理论都有密切的关系。

一维

delta函数排斥势中玻色子在有限温度下的严格解: 1969年,Yang将一维

delta 函数排斥势中的玻色子问题推进到有限温度。这是历史上首次得到的有相互作用的量子统计模型在有限温度的严格解。最近这个模型及其结果也在冷原子系统中得到实验实现和验证。

超导体磁通量子化的理论解释:1961年Yang访问斯坦福大学时,该大学的Fairbank和Deaver在实验上发现超导环中磁通量以 hc/2e 为单位的量子化。Yang和Byers给出这一现象的正确理论解释。

非对角长程序:1962年,Yang提出非对角长程序的概念,从而统一刻画超流和超导的本质,同时也深入探讨了磁通量子化的根源。这是当代凝聚态物理的一个关键概念。

1989到1990年,Yang在与高温超导密切相关的Hubbard模型里找到具有非对角长程序的本征态,并和Shou-Cheng Zhang(张首晟)发现了它的SO(4)对称性。

最后其实要说的就是,将两位物理学家作比较事实上没有过多的意义,我们可以客观地阐述他们的成果都有哪些,但是Hawking和Yang之类的物理学家毕竟不在同一个研究领域,我们可以说谁比谁更伟大,但这种比较其实并没有什么价值可言。不管怎样,我觉得Hawking和Yang等等的科学家们都在人类理解世界理解宇宙的探索之路上留下了光辉灿烂的一笔,都应该值得大家的敬仰和尊重。如今Hawking的离世让人悲痛万分,他曾是一个仰望浩渺宇宙的人,如今他成为了星辰宇宙。

深度学习是这么一个过程,它将节点分解为输入层、输出层以及中间的隐藏层,且同一层之间的节点不能相连,只能与相邻层的节点相连。

如果我们将输入层的序号定为0而将输出层的序号定位N,那么节点也可以赋予一个序号列,记为$x_{i,n}$,其中n表示层的序号,i表示x在层中的序号。激活函数记为f,连接权重记为$

omega^i_{i,n}$,表示从n层的第i个节点连接到n+1层第j个节点的连接。这样一个多层神经网络中的数据流转过程就可以记为下述方程:

这里采用Einstein约定,相同指标自动求和。

上述方程可以通过如下符号形式改写:

我们将原来层内指标i改记为x,每个节点的输出值从x改记为$

phi$,层序号用t标记,连接权重改成了函数G。

这只是符号的改变,意义并没有发生丝毫变化。

但这个方程的形式却值得玩味,因为如果忽略激活函数f,那么下述方程的形式其实是量子力学中用两点关联函数(Green函数)改写的离散本征态系统的波函数演化方程:

因此,一个很直接的想法,就是如果x是连续,会怎么样?

也即,如果我们将离散的每一层节点构成的空间,连续化为一维空间,会得到什么?

答案很直接:

第二步直接取了反函数,这对于sigmoid激活函数来说不成问题,但对于ReLU激活函数来说恐怕不能这儿干,因为其在负半轴是常值函数0,反函数不存在。对于基于ReLU改造的Swish激活函数也不好用,因为它在负半轴非单调,会出现双值,所以也没有反函数。

因此,这个写法颇为形式性。

对空间(神经元节点指标)的连续化挺“顺利”的,如果我们忽略反函数不存在所带来的问题的话。

而对于时间(神经元层指标)的连续化则有点麻烦。

我们先来对上面的结果做一些形变:

然后就可以做很强硬的形式上的连续化:

这里其实就等价于引入了一个隐形的归一化条件:

或者可以写得对激活函数更加“普适”一点:

更准确地说,由于这里无论是节点输出值$

phi$还是激活函数f还是两点连接函数G,都是已知的,所以上式的归一化要求事实上是对G的一次归一化调整,即:

我们可以取归一化调整之后的两点连接函数为新的两点连接函数,从而有最终的运动方程:

从形式上来说,可以看做是非相对论性哈密顿量显含时的薛定谔方程,或者,更加类似的其实是热扩散方程(因为没有关键的虚数单位i)。

我们可以将两点关联函数做一个分离。两点关联函数我们归一化到1,那么此时动力学方程为:

对最后的方程再做一次形变:

由于现在两点关联函数是归一化的,我们可以很任性很形式化地认为它是运动项与非定域的包含了波函数与波函数的动量项的非定域势(原因下面会说),而后面减掉的那一项则可以认为是一个定域的势能项与质量项的结合。

让我们对比一下非相对论性薛定谔方程:

是不是感觉形式上很像?

主要的区别就在于中间的积分那一项。

所以下面我们就来处理这一项。

将积分的部分做一下形变(同时我们这里直接取层内指标为坐标的形式,从而为矢量):

其中,第一步是将全空间分解为一系列以x为圆心的同心球,第二步中的$

vec n$是同心球上的单位径向量,第三步利用了Stokes定理,第四到第六步则利用了D维空间中的散度的特性。

最后的结果,第一部分是一个径向梯度,加上一个中心势,从而就是前面所说的“运动项与非定域的包含了波函数与波函数的动量项的非定域势”。

接下来,我们取无穷小曲面,即r只在0的邻域范围内,宏观范围的两点关联函数为0,这么一种特殊的情况,其对应的深度神经网络稍后再说,那么此时就有:

假如我们取G的对称部分为$

hat G$而反对称部分为$ ilde G$,则有:

第二部分,将G看做是一个Finsler度量函数,从而这里给出的就是Finsler度量下的二阶微分算符$

abla^2_G$,乘上一个Finsler度量下指标球相关的常数系数$g_G$。

而第一项则是Finsler度量的反对称部分诱导的类纤维丛联络与波函数梯度的矢量积,乘上另一个指标球相关的常数系数$A_G$。

这方面可以看以前写的老文: 《从弱Finsler几何到规范场》 。

因此,在无穷小连接函数的约束下,上面的方程就是:

形式上是不是很简洁?

而每一项的意义也都明确了:

连接系数给出了Finsler度量,其反对称部分给出了类似纤维丛联络的规范力,其全局变更给出了类时空曲率变化的引力;而激活函数要求的连接系数的归一化系数则是时空上的全局势。

因此深度神经网络的整个学习过程,就是通过输入与输出的散射矩阵,来逆推整个时空的Finsler联络和全局势。

所谓的无穷小邻域内才有效的两点关联函数,在连续化之前,其实对应的就是卷积神经网络中的最小卷积核(3*3卷积)。

假如我们继续引入卷积神经网络的另一个要求,即卷积核是同一层内相同的,那么就等于将Finsler度量限定为只是时间t的函数:

很明显,整个结构被简化了许多。

如果这个卷积网络还是所有层都共享参数的,那么等于把上述方程中的时间t也取消了,那就更简单了。

而假如我们取激活函数为f(x)=nx,那么就等于取消了全局势。最关键的是,如果两个这样的函数在原点处拼接起来,得到的也是取消全局势的激活函数,这样的激活函数中最著名的就是ReLU函数了,其在负半轴(当然$

phi$的取值也不可能到负半轴……)$

Gamma$恒为0,而在正半轴$

Gamma$恒为1,从而等效的势能函数V恒为0。

从而,ReLU对应的可以认为就是某Finsler时空中的“自由”量子系统或者“自由”热扩散系统了,吧…………

对于不是无穷小邻域的情况,其实可以通过无穷小邻域的情况在有限区间内做积分来获得,从而实际上是一个关于一阶与二阶导的非定域算符。

同样的,残差网络引入了不同间隔的层之间的连接,可以看做是将原本对时间的一阶导替换为一阶导的(时间上)非定域算符。

至于说循环神经网络,因为引入了与层数n不同的“时间”,所以这里暂不考虑——或者可以认为是引入了虚时间?

如果我们采用量子场论的视角(虽然很显然不是量子场论),那么深度学习的就是这么一个过程:

首先,我们通过实验知道系统的初态(输入层)与末态(输出层的目标值),而我们不知道的是系统所处的时空的度量(连接系数)与时空上的势能(激活函数)。

于是,我们通过大量的实验(通过大量输入与输出的学习素材)来分析这个时空的特性,通过选择恰当的系统能量函数(Hinton最早给出的RBM与热统中配分函数的相似性,用的就是一维Ising模型的能量函数来类比输出层的误差函数),使得整个系统的最低能态对应的时空就是我们要找的目标时空——这个也容易理解,时空上的测地线一般就是最低能态,而测地线在有相互作用的时候对应散射矩阵,散射矩阵刻画的就是末态与初态的关联,所以反过来知道末态初态就可以设法找出散射矩阵,从而可以设法得到测地线,从而可以设法获得测地线为最低能态的时空,从而得到时空的属性,这个逻辑很合理。

最终,我们利用找到的时空来预测给定初态对应的末态——利用神经网络学习到的结果来进行预测与应用。

所以,训练神经网络的过程,完全可以看做是物理学家通过实验结果来反推时空属性的过程。

很科学。

最后需要说明的是,虽然上面的推导很High,但实际上对于我们解决神经网络的学习这类问题来说,一点帮助都没有。

充其量,只能算是换了一个角度看待神经网络,吧…………

本文遵守创作共享CC BY-NC-SA 4.0协议

杨振宁指的是谁呢?_ising模型