互联网资讯 / 人工智能 · 2023年12月16日

人工智能创建了无法理解的量子实验

量子物理学家马里奥克莱恩至今还记得自己2016年初在维也纳的一家咖啡馆里翻阅MELVIN的计算结果时的情景。MELVIN是克雷恩创建的一套机器学习算法,属于一种人工智能。它的任务是将各种标准量子实验的基础模块进行混合和比对,借此寻找新问题的解决方法。克雷恩发现,MELVIN的确做出了许多有趣的发现,但其中有一条却令他摸不着头脑。

当时我的第一反应是,我的程序一定出bug了,因为这个解法根本不可能存在。MELVIN似乎是想通过创造多光子的复杂纠缠态来解决问题。问题在于,克雷恩、安东塞林格和同事们并未给MELVIN提供创造这类复杂量子态所需的规则,但MELVIN却自己找到了解决之道。最终克雷恩意识到,这套算法发现的其实是上世纪90年代初设计的一套实验安排,不过当初那套实验要简单得多,MELVIN解决的问题则远比它复杂。

我们明白了这是怎么一回事之后,便立即对这个解法进行了归纳和泛化。克雷恩表示。自此之后,其他团队也开展了一些MELVIN设计的新实验,以全新的方法测试量子力学的理论基础。与此同时,克雷恩从维也纳大学跳槽到了多伦多大学,和新同事一起改进了他们的机器学习算法。他们最近研发了一套名叫THESEUS的人工智能系统,不仅计算速度比MELVIN快好几个数量级,而且计算结果对人类一目了然。MELVIN的计算结果需要克雷恩和同事们花费数天、甚至数天时间去理解,但THESEUS的计算结果则几乎一眼自明。

克雷恩接触到这个研究项目其实纯属偶然。当时他和同事们想弄清,如何通过实验创造光子的量子纠缠态:当两个光子发生相互作用时,便会形成纠缠关系,牵涉其中的两个光子都只能通过同一种量子状态进行数学描述。如果你对其中一个光子的状态进行测量,即使两个光子远隔千里,测量结果也能与另一个光子相吻合。

1989年,丹尼尔格林伯格、迈克尔霍恩和塞林格三名物理学家对一种名叫GHZ的量子态进行了描述。GHZ量子态涉及到四个光子,每个光子都处于0或1两种状态的叠加态上。在三人发表的论文中,GHZ状态包含四个相互纠缠的量子比特,整个系统处于一种二维的量子叠加态中,要么为0000,要么为1111。如果对其中一个光子进行测量,发现其处于状态0上,整个叠加态便会坍缩,其它光子的状态也是0;测出的结果为1也是同理。上世纪90年代末,塞林格和同事们首次在实验中观察到了三个量子比特的GHZ态。

克雷恩和同事们还想观察到更高维度的GHZ态。他们想使用三个光子,每个都有三个维度,即可以处于0、1、2三种状态的叠加态上。这种量子态名叫三维量子比特。克雷恩团队想寻找的便是一种三维GHZ态,处于000、111和222三种状态的叠加态上。这种量子态可以大大增强量子通信的安全性、以及量子计算的速度。2013年末,研究人员花了数周时间设计实验和开展计算,试图通过实验创造出所需的量子态,但每次都以失败告终。克雷恩表示:我当时简直要抓狂了,为什么我们就是找不到正确的实验设置呢?

为加速研究进程,克雷恩先是编写了一套计算机程序,可以根据实验设置计算出实验结果,然后对程序进行了升级,将光学实验台上用来生成和操控光子的基础模块整合了进去,包括激光、非线性光学晶体、分光器、移项器、全息图等等。这套程序将这些模块进行随机混合和匹配,组合出了海量配置,并依次开展计算、输出结果。MELVIN就这么诞生了。短短几小时内,这套程序就找出了我们这几位科学家耗费数月都没能找到的解决方案。克雷恩指出,那真是疯狂的一天,我至今都不敢相信这真的发生了。

接下来,他又赋予了MELVIN更多的智慧。每次找到一种有用的配置,MELVIN都会将其加入自己的工具箱。这套算法会记住这些,并试着用它们来寻找更复杂的解决方法。

但令克雷恩在维也纳那间咖啡馆里百思不得其解的,也正是进化后的MELVIN。在MELVIN的实验工具箱中,克雷恩加入了两个晶体,每个可以产生一对处于三维纠缠态的光子。克雷恩原本以为,MELVIN会找到一种实验配置,能够将这两组光子组合在一起,最多达到9个维度。但它其实找到了一种非常罕见的解法,纠缠程度远比其它量子态都要高得多。

克雷恩最终发现,MELVIN其实使用了一种近三十年前由数支研究团队开发的技术。1991年,罗切斯特大学的三名研究人员设计出了其中一种实验方法。随后在1994年,塞林格和奥地利因斯布鲁克大学的同事们又设计出了另一种。从概念上来看,这些实验取得的结果都是相似的,不过塞林格设计的实验配置更简单、更容易理解一些。在该实验中,先由一枚晶体生成一组光子(A和B),这两个光子的行进路线会穿过另一枚晶体,产生光子C和D。从第一枚晶体射出的光子A和第二枚晶体射出的光子C的行进路线会完全重合,都会到达同一个探测器,因此该探测器无法判断某个光子究竟是来自第一枚、还是第二枚晶体。光子B和光子D也是同理。

移相器可以改变光子的相位。如果在两枚晶体之间放置一台移相器,并不断改变移相程度,就会在探测器处造成建设性干涉或破坏性干涉。假设每枚晶体每秒可以产生1000对光子;在产生建设性干涉时,探测器每秒可接收4000对光子;而在产生破坏性干涉时,接收到的光子数则为零,因为尽管单个晶体每秒产生的光子对数为1000,但整个系统却并未产生一个光子。

MELVIN的解法中也包含这样的重叠路线。令克雷恩感到困惑的是,他的算法中只有两枚晶体。MELVIN并未在实验一开始就使用这两枚晶体,而是将它们放进了一台干涉仪中。花了一番功夫进行研究后,他意识到,MELVIN使用的实验设置相当于用到了不止两枚晶体,这样一来便可产生更高维度的纠缠态了。

除了生成复杂的纠缠态之外,使用两枚以上晶体的实验配置还可以实现塞林格在1994年用两枚晶体开展的泛化版本。克雷恩在多伦多大学的同事埃弗瑞姆斯坦伯格对人工智能的研究结果深感震惊。就我所知,这种泛化是人类仅凭自己之力永远也想象不出、也实现不了的。

在其中一种泛化的实验配置中,晶体数量为四,每枚晶体都会产生一对光子,有四条通往四个探测器的重叠路径。量子干涉可以形成建设性干涉,即四台探测器都能探测到光子;或是破坏性干涉,即没有一台探测器能探测到光子。

但直至不久之前,真正开展这样的实验都一直是一个遥远的梦想。不过今年三月,中国科技大学研究人员与克雷恩在联合发表的一篇预印论文上报告称,自己在一枚光子芯片上搭建了完整的实验配置,并成功开展了这项实验。由于光子芯片的光学稳定性极强,研究人员在实验中连续收集了超过16个小时的数据,而这在大规模实验中是不可能实现的。

在刚开始尝试将MELVIN的研究成果简化和泛化时,克雷恩和同事们意识到,这种解法其实和数学中一种名叫图的抽象表达形式很相似。图由顶点和边构成,可以用于描述物体之间的配对关系。在量子实验中,每个光子的行进路线可以用顶点来表示,而每枚晶体则可以用连接两个顶点的边来表示。MELVIN先是创建了这样一个图,然后开展了一系列名叫完美匹配的数学运算,即让每个顶点仅与一条边相连。这一过程可以使最终量子态的计算大大简化,不过对人类来说仍然难以理解。

不过,MELVIN继任者THESEUS的出现改变了这一点。它可以对第一步生成的复杂图进行筛选,逐渐将边和顶点的数量减少到不能再少。这样的图比MELVIN的完美匹配图简单得多,因此更容易被人类解读。

澳大利亚格里菲斯大学的埃里克加瓦尔坎迪对这些研究工作深感震撼。这些机器学习技术真的很有意思。对人类科学家而言,有些解法看上去十分新颖。不过就现阶段来说,这些算法离真正具备提出新想法、创造新概念还差得很远。不过,我相信这一天迟早会到来。尽管我们如今仍在婴儿学步,但千里之行,终归要始于足下。

斯坦伯格也赞同这一观点。就目前来说,这些已经是绝妙的工具了。就像所有优秀的工具一样,它们已经帮助我们实现了一些原本不可能实现之事。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.