DeepMind 的游戏人工智能改进人类设计的演算法

位于英国的人工智能研究公司 Google DeepMind,利用其游戏人工智能 AlphaZero 取得了计算机科学领域的两项重大突破。 DeepMind 使用了名为 AlphaDev 的新版本 AlphaZero,在排序演算法和密码学方面取得了重大进展。 AlphaDev 发现了一种方法,可以将列表中的项目排序速度提升多达 70%,超越了现有的最佳人类设计方法。它还将一个关键的密码学演算法加速了 30%。这发现非常重要,因为这些演算法是各种软体应用的基础,即使是微小的改进也能带来显著的成本节省和节能效果。

「摩尔定律即将结束,晶片接近其基本物理极限,」Google DeepMind 的研究科学家Daniel Mankowitz 说道。 「我们需要寻找创新的方法来优化计算。」

人工智能设计的演算法取得胜利

尽管 DeepMind 的研究最近才在《自然》杂志上发表,但 AlphaDev 开发的新排序演算法已经被数百万软体开发人员使用。 DeepMind 将其演算法提交给管理广泛使用的 C++ 程式语言的机构,这导致了 C++ 排序演算法在十多年来的首次更新,也是首个受到人工智能启发的演算法更新。

AlphaDev 建立在 AlphaZero 之上,AlphaZero 是一种以强化学习为基础的模型,以精通围棋和西洋棋等游戏而闻名。 DeepMind 的方法是将寻找更快演算法的问题视为一场游戏,训练 AlphaDev 发现胜利的著手方法。这个游戏围绕着选择电脑指令并将它们排列起来形成一个演算法。 AlphaDev 通过创建不仅正确而且比现有演算法更快的演算法来取得胜利。

为了应对这一挑战,AlphaDev 使用组合语言,这是一种提供特定指令以操作电脑晶片上的数据的程式语言。 DeepMind 选择组合语言是因为它允许演算法被细分为细粒度步骤。通过玩游戏并尝试添加组合语言指令,AlphaDev 学会了生成正确且高效的演算法。

图1:由AlphaDev发现的排序网络和演算法改进

最初集中优化三到五个项目的排序演算法。 DeepMind 的研究人员惊讶地发现,AlphaDev 在三个项目的排序演算法上较最佳的人类设计演算法优胜,将所需指令数量从 18 减少到 17。虽然在四个项目上,它没有超越最佳人类演算法,但在五个项目的排序中表现优异,将指令数量从 46 减少到 42。

圖2:由AlphaDev發現的根本不同的演算法。

这些优化带来了显著的加速效果。例如,对于在 Intel Skylake 晶片上排序五个项目的现有 C++ 演算法,所需时间约为 6.91 纳秒,而 AlphaDev 的演算法仅需 2.01 纳秒便完成任务,表示提升了 70%。

接下来的发展

尽管对结果印象深刻,专家们警告机器学习尚未达到完全创造全新且更好演算法的程度。 AlphaDev 仅探索组合语言指令的子集,这限制了与使用不同指令的现有演算法直接比较的可能性。此外,由于 AlphaDev 必须评估的可能演算法数量众多,其能力受到限制。 DeepMind 计划通过使 AlphaDev 适应 C++ 指令,并融入人类设计的方法和直觉来解决这些限制。

并非首次突破

在2022年,DeepMind 已经使用 AlphaZero 在矩阵乘法方面取得了重大进展,这是各种应用中使用的基本计算。通过将问题转化为三维棋盘游戏,并训练名为 AlphaTensor 的新版本 AlphaZero,DeepMind 能够发现更快的矩阵乘法演算法。 AlphaTensor 在超过 70 种不同的矩阵尺寸上优于现有演算法,包括数学家 Volker Strassen 于 1969 年提出的方法。它减少了矩阵乘法所需的步骤数量,并识别出在常见电脑晶片上快 10 到 20%的演算法。 DeepMind 计划将 AlphaTensor 应用于搜索其他类型的演算法,开创计算机科学的新方法。

结语

DeepMind 的成就突显了人工智能在优化计算和为问题解决开辟创新途径方面的潜力。通过利用机器学习和强化学习技术,Google DeepMind 在基础计算机科学领域持续取得突破性的发现。

本文是在 AI 的协助下撰写,并参考以下来源:

https://www.technologyreview.com/2023/06/07/1074184/google-deepmind-game-ai-alphadev-algorithm-code-faster/

https://www.technologyreview.com/2022/10/05/1060717/deepmind-uses-its-game-playing-ai-to-best-a-50-year-old-record-in-computer-science/

https://www.nature.com/articles/s41586-023-06004-9

在此感谢 InnoHK、香港特别行政区政府及人工智能金融科技实验室对本文的支持。
(AIFT 竭力但不能保证内容之准确和可靠,亦不会承担因任何不准确或遗漏而引起的任何损失或损害。)

分享此內容

人工智能金融科技实验室与中银香港进一步加强金融科技合作

Tokenization Revolution - Unleashing Banking's Growth Potential

地址

香港沙田香港科学园科技大道西 19号
11楼 1101-1102 及 1121-1123 室

产品及解决方案

人才

工作机会

关于我们

地址

版权所有 © 2024 人工智能金融科技实验室有限公司