利用由清洁、稳定、高输出核聚变能源驱动的恒星能量是满足我们世界不断增长的能源需求的崇高目标。多亏了人工智能,融合现在似乎比以往任何时候都更接近。
瑞士洛桑联邦理工学院 (EPFL) 的研究人员正在利用他们在等离子体物理和控制方法方面的丰富经验以及谷歌子公司 DeepMind 的人工智能研究和技术。结果是一种基于深度强化学习的等离子体配置磁控制新方法。
这种方法的详细信息发表在《自然》杂志上,已应用于瑞士等离子体中心研究设施的真实等离子体系统,即可变配置托卡马克 (TCV)。
托卡马克是一种甜甜圈形的聚变研究设备,它使用强磁场将等离子体限制在比太阳核心更热的温度(数亿摄氏度)。像太阳一样,极端温度促进了氢原子之间的核聚变。SPC 的托卡马克可实现可变等离子体配置(即等离子体在托卡马克中的形状和位置),可用于探索产生能量的新方法。
到目前为止,这个过程本质上是不稳定的,并且出现了一些问题,包括阻止等离子体从允许其形成并保持其就位的一系列磁线圈中逸出。TCV 的 19 个独立线圈中的每一个都必须使用单独的控制系统配置进行连续校准。控制器使用实时估计等离子体特性的算法来调整磁体的电压以获得所需的结果。这些等离子体控制系统对于防止等离子体到达托卡马克壁至关重要,这会阻止反应并损坏容器本身。
幸运的是,控制系统配置可以在用于托卡马克之前进行模拟:“我们的模拟器基于 20 多年的研究并不断更新,”SPC 科学家和 EPFL 研究的合著者 Federico Felici 说新闻稿。“但即便如此,仍需要进行冗长的计算来确定控制系统中每个变量的正确值。这就是我们与 DeepMind 的联合研究项目的用武之地。”
DeepMind 开发了一种 AI 算法,在 SPC 的模拟器上进行训练,大大缩短了对这些模拟进行建模所需的计算时间和能量,同时允许仅使用一个控制器来操纵等离子体。该控制器是一个单一的神经网络,可以同时协调所有 19 个磁线圈,同时学习哪些电压最能产生特定的等离子体配置。
为此训练算法意味着模拟各种控制策略并收集数据或“经验”。然后,该算法创建一个控制策略“以产生所需的等离子体配置”,该策略涉及运行多个控制设置并分析产生的等离子体配置的算法。然后通过要求算法根据正确设置的识别产生特定的等离子体配置来逆转这一点。
模拟很有希望。根据 EPFL发布的消息,DeepMind 的 AI 算法“能够创建和维护各种等离子体形状和高级配置,包括在容器中同时维护两个独立等离子体的配置。” 然后将该算法用于实际的托卡马克以测试其实际应用,这与验证其结果一样有希望。
DeepMind 在一篇博客文章中概述了该过程的工作原理,他们描述了托卡马克内部发生的情况:“我们的控制器首先根据要求的形状塑造等离子体,然后将等离子体向下移动并将其与墙壁分离,将其悬挂在中间船的两条腿。等离子体保持静止,正如测量等离子体特性所需要的那样。然后,最终等离子被引导回容器顶部并安全销毁。”
SPC 的合作始于 DeepMind 黑客马拉松,Felici 碰巧提到了控制托卡马克磁线圈的问题。
“DeepMind 立即对在核聚变等领域测试他们的人工智能技术的前景感兴趣,尤其是在托卡马克这样的现实世界系统上,”Felici 说。
合作的成功展示了人工智能如何具有加速聚变科学的潜力。DeepMind 指出,他们的方法可用于设计和扩展新的托卡马克及其控制器。他们还预测,强化学习将成为控制工业和科学应用中其他复杂机器的“变革性技术”。
至于人类在聚变能源方面的进展,我们可能不会接近每个人都拥有一个“先生”。Fusion Home Energy Reactor”,如“回到未来”中所见,但人工智能可能只是到达那里的门票。