
FunSearch(之所以叫FunSearch,是因为它搜索数学函数,而不是因为它有趣)继续着DeepMind利用人工智能在基础数学和计算机科学领域取得的一系列发现。首先,AlphaTensor找到了一种方法来加速许多不同类型代码的核心计算,打破了50年来的记录。然后,AlphaDev找到了让每天使用数万亿次的关键算法运行得更快的方法。
然而,这些工具并没有使用大型语言模型。基于DeepMind的游戏人工智能AlphaZero,这两款游戏都将数学问题当作围棋或国际象棋的谜题来解决。公司的研究员Bernardino Romera-Paredes说,问题在于它们被困在了自己的领域里:“AlphaTensor在矩阵乘法方面很出色,但除此之外基本上什么都没有。”Bernardino Romera-Paredes曾参与AlphaTensor和FunSearch的研究。
FunSearch采取了不同的策略。它结合了一个名为Codey的大型语言模型,这是谷歌PaLM 2的一个版本,可以对计算机代码进行微调,还有一些系统可以拒绝不正确或荒谬的答案,并将正确的答案插入其中。
谷歌DeepMind的研究科学家侯赛因·法齐(Alhussein Fawzi)说:“坦白地说,我们有一些假设,但我们并不确切知道为什么会这样。”“在项目开始时,我们根本不知道这是否可行。”
研究人员首先用Python(一种流行的编程语言)勾勒出他们想要解决的问题。但是他们省略了程序中说明如何求解的那几行。这就是FunSearch的用武之地。它让cody来填补空白——实际上,是建议可以解决问题的代码。
第二个算法会对cody的答案进行检查和评分。最好的建议——即使还不正确——会被保存并返回给cody, cody会尝试再次完成程序。Kohli说:“很多会是荒谬的,有些会是明智的,还有一些会是真正的灵感。”“你拿着那些真正有灵感的照片,然后说,‘好吧,拿着这些照片,重复一遍。’”
经过几百万条建议和几十次重复的整个过程(花了几天时间),funsearch终于能够编写出代码,为帽集问题提供一个正确的、以前未知的解决方案,这涉及到寻找特定类型集合的最大大小。想象一下在坐标纸上画点。帽套问题就像试着弄清楚你能放下多少个点,而其中三个点不会形成一条直线。
这是一个非常小众的市场,但很重要。数学家们甚至对如何解它都意见不一,更不用说解是什么了。(它还与矩阵乘法有关,alphaatensor找到了一种加快计算速度的方法。)加州大学洛杉矶分校(University of California, Los Angeles)的陶陶(Terence Tao)赢得了包括菲尔兹奖(Fields Medal)在内的许多数学领域的最高奖项,他在2007年的一篇博客文章中称帽集问题“可能是我最喜欢的开放问题”。




