谷歌DeepMind使用了一个大型语言模型来发现新的数学_5G_科技世界_爱云网

　　FunSearch(之所以叫FunSearch，是因为它搜索数学函数，而不是因为它有趣)继续着DeepMind利用人工智能在基础数学和计算机科学领域取得的一系列发现。首先，AlphaTensor找到了一种方法来加速许多不同类型代码的核心计算，打破了50年来的记录。然后，AlphaDev找到了让每天使用数万亿次的关键算法运行得更快的方法。

　　然而，这些工具并没有使用大型语言模型。基于DeepMind的游戏人工智能AlphaZero，这两款游戏都将数学问题当作围棋或国际象棋的谜题来解决。公司的研究员Bernardino Romera-Paredes说，问题在于它们被困在了自己的领域里:“AlphaTensor在矩阵乘法方面很出色，但除此之外基本上什么都没有。”Bernardino Romera-Paredes曾参与AlphaTensor和FunSearch的研究。

　　FunSearch采取了不同的策略。它结合了一个名为Codey的大型语言模型，这是谷歌PaLM 2的一个版本，可以对计算机代码进行微调，还有一些系统可以拒绝不正确或荒谬的答案，并将正确的答案插入其中。

　　谷歌DeepMind的研究科学家侯赛因·法齐(Alhussein Fawzi)说:“坦白地说，我们有一些假设，但我们并不确切知道为什么会这样。”“在项目开始时，我们根本不知道这是否可行。”

　　研究人员首先用Python(一种流行的编程语言)勾勒出他们想要解决的问题。但是他们省略了程序中说明如何求解的那几行。这就是FunSearch的用武之地。它让cody来填补空白——实际上，是建议可以解决问题的代码。

　　第二个算法会对cody的答案进行检查和评分。最好的建议——即使还不正确——会被保存并返回给cody, cody会尝试再次完成程序。Kohli说:“很多会是荒谬的，有些会是明智的，还有一些会是真正的灵感。”“你拿着那些真正有灵感的照片，然后说，‘好吧，拿着这些照片，重复一遍。’”

　　经过几百万条建议和几十次重复的整个过程(花了几天时间)，funsearch终于能够编写出代码，为帽集问题提供一个正确的、以前未知的解决方案，这涉及到寻找特定类型集合的最大大小。想象一下在坐标纸上画点。帽套问题就像试着弄清楚你能放下多少个点，而其中三个点不会形成一条直线。

　　这是一个非常小众的市场，但很重要。数学家们甚至对如何解它都意见不一，更不用说解是什么了。(它还与矩阵乘法有关，alphaatensor找到了一种加快计算速度的方法。)加州大学洛杉矶分校(University of California, Los Angeles)的陶陶(Terence Tao)赢得了包括菲尔兹奖(Fields Medal)在内的许多数学领域的最高奖项，他在2007年的一篇博客文章中称帽集问题“可能是我最喜欢的开放问题”。

谷歌DeepMind使用了一个大型语言模型来发现新的数学

相关推荐