
在世纪之交,当现代网络刚刚兴起,微软成为王者时,一场规模虽小但日益壮大的技术运动对微软构成了生死存亡的威胁。时任微软首席执行官的史蒂夫?鲍尔默(Steve Ballmer)称,微软的一个核心元素是“一颗会附着在它接触到的一切事物上的毒瘤”。疾病是一个竞争性的操作系统,Linux和它所代表的开源软件:与昂贵的专有软件,如微软Windows和Office相比,任何人都可以免费下载、修改和使用这些程序。
开源软件最终与互联网的大部分内容相结合——mozilla Firefox、Android操作系统和维基百科都是“开放”项目——但科技行业成功地将平等主义哲学转化为商机。身价上万亿的公司使用免费的开源软件来构建或增强自己的产品。开源的任何东西仍然经常是为大型科技平台、小工具和数据服务器设计的,并依赖于这些平台、小工具和数据服务器,它们调解了大多数互联网访问,从而吸引用户到世界上最强大的公司。仅仅运行一个应用程序或托管一个网站,几乎肯定需要从微软、谷歌或亚马逊等公司运营的云服务器上购买计算时间。
现在,新生的生成型人工智能行业也面临着类似的问题。越来越多的人在使用大公司提供的人工智能产品,很少有人对这项技术的工作原理有任何见解或发言权。作为回应,越来越多的研究人员和组织开始支持开放人工智能(不要与OpenAI混淆,OpenAI是ChatGPT背后的神秘公司)。这个想法是创建相对透明的模型,让公众可以更容易、更便宜地使用、研究和复制,试图使一种高度集中的技术民主化,这种技术可能有可能改变工作、政治、休闲甚至宗教。但这场运动,就像之前的开源革命一样,面临着被大型科技公司吞并的风险。
最能说明这种紧张关系的例子就是“羊驼2”,这是自称“开放”的最突出、最具争议的人工智能系统,它是由Facebook、Instagram、WhatsApp和Threads的巨擘meta创建的。去年夏天发布的Llama 2是一个大型语言模型,虽然没有ChatGPT和谷歌的Bard那么强大,但它可以免费用于研究和商业用途。但是,尽管该模型的最终代码可以下载,但meta禁止对该代码的某些使用。开发人员不能利用Llama 2来改进任何其他语言模型,他们需要meta的明确许可,才能将Llama 2整合到每月用户超过7亿的产品中——例如,这一政策将禁止TikTok自由使用该技术。Llama的大部分开发流程都是保密的——特别是,除了meta之外,没有人知道该模型是在什么数据上进行训练的。独立程序员和倡导者说,它不符合开放的标准。
不过,初创企业、大学和非营利组织基本上可以下载并使用Llama 2用于任何目的。除了将模型整合到产品中,他们还可以在一定程度上调查Llama 2的能力和局限性的来源,这对于ChatGPT和Bard等“封闭”技术来说要困难得多。在一份书面声明中,meta的一位发言人告诉我,该公司的开放方式“允许人工智能社区以安全和负责任的方式使用羊驼2来帮助推进”人工智能。
抛开使用限制不谈,生成型人工智能模型要真正开放,需要发布的不仅仅是最终程序。训练数据、用于处理数据的代码、微调算法的步骤等等是理解、复制或修改人工智能的关键。旧形式的开放软件可以打包成一个简单的。zip文件并自由分发;人工智能不那么容易被控制或访问。Mozilla全球产品政策主管乌德巴夫·蒂瓦里(Udbhav Tiwari)告诉我:“有人可能会说,我们目前谈论的许多‘开放’人工智能项目根本就不是开源的。”一些评论家认为这种名义上可访问的发布是“公开清洗”的例子,在这种情况下,公司获得声誉和免费研究,而实际上却没有提供人们深入研究、重新创造或与他们的模型竞争所需的信息;全球正在努力重新定义人工智能的“开源”。
还有更开放的模型,通常由非营利组织和小型初创企业发布,提供更多关于培训的细节,使用限制也更少。但即使是这些模型也会遇到生成人工智能的巨大复杂性和资源需求。如果说经典的开源程序在易于理解和修复方面类似于自行车,那么人工智能更像是一辆特斯拉。考虑到如此先进的汽车的工程计划,很少有人能自己修理,更不用说制造了。同样,当您向ChatGPT或Bard提问时,屏幕上的回答是数亿美元计算能力的最终产物,更不用说购买计算机芯片、工资等方面的支出了。除了科技巨头和与他们合作的初创企业(如OpenAI),几乎没有人能负担得起这笔钱。
为大量用户运行这些模型同样代价高昂。麻省理工学院斯隆管理学院(MIT Sloan School of Management)研究人工智能行业的努尔·艾哈迈德(Nur Ahmed)告诉我,大学、非营利组织和初创企业“无法靠自己创造出这种模型”。人工智能风险资本池已经显示出枯竭的迹象,因为投资者担心初创企业将没有足够的资源与最强大的科技公司竞争。
“你是在开源代码、权重或数据,或者是某种组合。但从来没有计算机,从来没有基础设施,”在多伦多大学(University of Toronto)研究大型科技公司对人工智能影响的计算机科学家穆罕默德·阿卜杜拉(Mohamed Abdalla)告诉我。大公司无法提供足够的计算能力或人力资源,甚至无法成为一个小规模的竞争对手,也无法在很大程度上影响人工智能的发展方向。审核甚至“开放”的模型也需要大量的资源——在用于训练生成式人工智能的最大的开源图像数据集中识别儿童性虐待的图像花了近两年的时间。AI Now Institute的董事总经理莎拉·迈尔斯·韦斯特(Sarah Myers West)告诉我:“说开源将使人工智能的使用民主化,和说开源将使整个行业民主化,这两者之间真的有很大的区别。”
一些努力正试图将人工智能基础设施从占主导地位的科技公司转向公众。联邦政府计划建立一个国家人工智能研究资源;几所大学合作在波士顿建立了一个高性能计算中心,用于先进的人工智能研究。波士顿大学(Boston University)的计算机科学家扬尼斯·帕斯查里迪斯(Yannis Paschalidis)是该计算中心的一员,他告诉我,目前,“我不认为我能训练出拥有数万亿个参数的下一代ChatGPT,但我可以对模型进行微调,或者训练一个更小、更专业的模型。”
研究人员还在设计更小、更开放的模型,这些模型足够强大,可以用于许多商业用途,而且训练和运行成本更低。例如,EleutherAI是一家发布开源人工智能的非营利性研究实验室,一群研究人员试图开发一种开放的替代方案,以取代OpenAI封闭的GPT-3。“我们想训练这样的模型,我们想了解它们是如何工作的,我们想让它们的小规模版本向公众开放,”EleutherAI的执行董事斯特拉·比德曼(Stella Biderman)告诉我。尽管如此,许多程序员、初创企业、非营利组织和大学在没有大量资助的情况下无法创建更小的模型,或者只能对更富有的公司提供的模型进行修补。
即使是表面上帮助开源社区的资源,也可能对科技巨头有益:例如,谷歌和meta创建并帮助维护了广泛使用的机器学习免费软件库。在去年春天的财报电话会议上,meta首席执行官马克?扎克伯格表示,“提供这种服务对我们来说非常有价值,因为现在整个行业最优秀的开发者都在使用我们内部也在使用的工具。”当AI项目使用meta的工具构建时,它们很容易商业化,并且可以将用户吸引到元产品生态系统中。(当被问及开放人工智能图书馆背后的盈利动机时,meta的一位发言人告诉我:“我们相信,这些方法既能直接使meta受益,又有助于促进一个健康、充满活力的人工智能生态系统。”)正如许多科技高管所做的那样,支持某种形式的“开放”人工智能开发,也可能是一种对抗不必要监管的策略;为什么要限制开源项目呢?理论上,开源项目代表着更多的市场竞争。当然,资源限制意味着这些项目不太可能严重威胁到领先的人工智能公司。
与此同时,硅谷吸引人才和生产规模最大、性能最好的人工智能产品的能力意味着,研究和注意力倾向于那些公司认为最有价值的程序、软件架构和任务。艾哈迈德说,这反过来又最终“塑造了人工智能的研究方向”。
目前,科技行业重视规模,并从规模中获利:在企业数据服务器上运行更大的模型,以追求在特定基准上的小幅改进。对近年来有影响力的人工智能论文的分析发现,研究优先考虑性能和新颖性,而“尊重他人”和“正义”等价值观几乎不存在。这些技术论文为许多产品和服务中使用的人工智能程序设定了方向。“下游的影响可能是有人被剥夺了一份工作,或者有人被剥夺了住房机会,”Mozilla的人工智能研究员、该研究的合著者阿贝巴·伯哈恩(Abeba Birhane)告诉我。
构建生成式人工智能所需的资源让科技行业扭曲了公众对这项技术的期望:如果ChatGPT是你能想象语言模型工作的唯一方式,那么任何不能像ChatGPT那样工作的东西都是不够的。但这也是构建和使用生成人工智能的一种非常狭隘的方式。很少有人仅仅根据马力来买车;大多数考虑尺寸,设计,里程,信息娱乐系统,安全性等等。人们也可能愿意牺牲性能来换取一个更公平、更透明的聊天机器人——从开放的人工智能中受益不仅需要重新定义开源,还需要重新想象人工智能本身可以和应该是什么样子。




