AI“源神”上线！影响有多大？

作者：冯连阁、王军、实习生孔亚轩

责任编辑：王俊

开源还是闭源？这是大模型时代的问题。

今年早些时候，埃隆·马斯克对微软及其首席执行官萨姆·奥特曼提起诉讼，谴责该公司逐渐隐瞒模型研究细节。这位前联合创始人表示：“直到今天，该公司的网站还声称其使命是确保通用人工智能造福全人类。但实际上，它已经变成了科技巨头微软事实上的闭源子公司。”

不够“开放”，Meta又将其最新开源人工智能模型“开放”。

4月18日，Meta发布其最新版开源大模型Llama 3，引发开源AI社区一片欢呼。巧合的是，Llama 3发布当天，恰逢AI领域顶级学者、开源AI倡导者吴恩达的生日。“（Llama 3）是迄今为止更好的礼物，谢谢Meta！”他说。

迈向2024年，开源与闭源的争斗愈演愈烈，闭源阵营以目前最强的为代表，开源阵营Meta的LLaMa，也在不断迭代。闭源阵营坚持信仰Law，押注打造更强的通用模型；开源阵营的模型能力不断提升，强调推动性能更垂直、配置更灵活的大模型商业化。

关于是否选择开源还是闭源模型的讨论正在进行中。

对于业内人士来说，这一选择不仅将决定他们将如何点亮AI“技术树”，还将影响其商业路线的选择。换言之，这很可能是这个竞争激烈的市场的生死存亡之事。

两个版本，多重惊喜

Meta此次发布的Llame 3包含8B和70B预训练和指令微调版本。

据 Meta 官网介绍，Llama 3 模型将数据和规模提升到了新的高度。它基于超过 15T 的数据在两个定制的 24K GPU 集群上进行训练——训练数据集是 Llama 2 所用量的 7 倍多。它支持 8K 上下文长度，是 Llama 2 容量的两倍。

除了Llama 3，Meta还发布了新的信任和安全工具，包括Llama Guard 2、Code和Eval 2。

据悉，Llama 3即将在AWS（web）、Cloud Face、IBM、Azure等各大云厂商及模型API提供商平台上线，AMD、AWS、Dell、Intel、等提供的硬件平台也对Llama提供了支持。

在官网上，Meta还发布了两个版本与谷歌Gemma、、3等竞争对手的参数对比。据Meta官网介绍，它们在MMLU（学科知识理解）、GPQA（一般问题）、（编码能力）、G *** -8K（数学能力）、MATH（相对困难的数学问题）五个评估集上均表现不俗。

值得注意的是，8B的编码能力非常出色，在AI公众号“数字生活Kazik”站长Kazik分享的用户测试中，8B能够给出解决国际象棋中经典皇后问题的代码，而其之前的版本需要特殊的代码模型才能实现这一点。

市场反应迅速，18日，Meta股价逆势上涨1.54%，次日，百度智能云千帆大模型平台开启邀请测试，为Llama 3提供训练和推理解决方案，助力开发者训练专属大模型。

8B和70B车型只是Llama 3系列的开始，Meta AI首席科学家杨利坤在社交媒体上透露，未来几个月还将发布更多版本。

资深科学家 Jim Fan 认为，后续可能发布的 Llama 3-400B 版本将是一种“分水岭”，开源社区将能使用 GPT-4 级别的模型。

留在牌桌上，展示你的技能

在上一轮竞争中被认为有落入陷阱危险的Meta，在AI牌桌上以Llama系列打出了一手好牌。要讨论它带来的行业震撼，首先要了解大模型领域的开源到底是什么？

大模型领域的开源，通常意味着模型的架构、训练代码、预训练的权重等都公开，让研究者和开发者可以自由的访问和使用。

但不同模型的开源程度不尽相同，“有些模型可能只提供有限的访问，或者只提供部分代码。”郭涛指出，判断一个大型模型是否真正开源的标准可能包括：代码和数据的可访问性、许可证的宽松程度、社区支持的活跃程度、对改进和新应用的开放程度等。

放眼AI界，两条路径上都有“顶尖选手”，当然也有闭源AI行业下属的公司，包括百度的文心易言，以及风靡一时的Kimi。

开源方面，除了Llama系列之外，目前应用最为广泛的开源大模型包括非营利组织LAION、Dolly、MPT等推出的开源大模型，国内则包括阿里巴巴的统一乾文、智普的-4、百川智能的-7B中英文大模型、北京智远武道3.0大模型系列、绵比智能的CPM-Bee 10B中文基础大模型等。

这种差异化往往受到技术进步、商业模式迭代等多重影响。

天使投资人、资深人工智能专家郭涛认为，从技术角度看，开源可以促进学术界的研究和创新，闭源则有助于在一定时期内保持技术领先。

从商业角度看，开源可以吸引开发者社区的贡献，促进技术快速迭代和应用广泛传播，但可能影响公司的盈利模式；闭源可以保护知识产权，为公司创造直接收入来源，但可能限制技术的普及和生态系统的构建。

事实上，在此次发布之前，中国互联网刚刚经历了一轮开源与闭源之争。

据媒体报道，百度CEO李彦宏近日表态，开源大模型意义不大，闭源模型的性能还会不断提升。“有了文心大模型4.0，我们可以兼顾效果、响应速度、推理成本等多方面考量，根据需要裁剪出适合各类场景的更小尺寸模型，并支持微调和后处理。通过降维裁剪出来的模型，在同等尺寸下比直接从开源调出来的模型效果更好，同等效果下成本明显更低。”

李彦宏一直是闭源路线的忠实支持者，原因包括但不限于：他认为闭源的商业模式能够更好地汇集人力和财力。

而其对手360创始人周鸿祎则言辞犀利：“一句话，没有开源就没有Linux，没有Linux就没有互联网。”

《源神》的推出会带来什么影响？

“Llama 3的推出，将带来市场格局的变化。”郭涛在接受21世纪记者采访时指出，其优异的表现或将吸引更多的用户和投资者，从而提升其市场份额。

官网显示，Llama 3 将有条件开源用于商业用途（月活跃用户超过 7 亿需另行申请）。“不过这个对于商业用途来说，基本上是完全免费的。” 说道。

此前，投资人朱啸虎曾接受腾讯 *** 采访，谈到人工智能市场相关话题。当被问及2023年大模型发展的关键节点时，他的回答是Llama的推出。这为中国在应用层面的创新奠定了基础，降低了商业化的门槛。

当然，朱啸虎提到的货币化是指开源生态内的用户，开源大模型的发布者到底能不能盈利还是等待盈利机会，往往没有明确的答案。

闭源大模型通常通过授权、订阅服务，或者直接产品销售的方式盈利。AI领域的领军人物就在其中，虽然一直在推动开源项目，但一直采取收取API授权费用的方式，为其他公司提供服务。在API服务的过程中，其他公司不会接触到模型的细节和源代码，而只是通过API接口来调用。

根据创业者服务平台对全美1003家小企业的调查，生成式人工智能产品已经成为美国小企业应用最为广泛的产品，应用率达到70%。这说明闭源模式的商业化路径在一定程度上获得了成功。

开源模式如何寻求生存和发展的机会？

首先，以开放的生态吸引用户。国盛证券研报指出，开源大模型利用更大的标识符训练数据集、RLHF等方法，实现低训练成本和高性能，超大模型以下大模型的门槛正在消失。

“拥有用户之后，开源大模型通常通过提供增值服务、定制开发、技术支持等方式获得盈利。”郭涛指出，公司可以基于开源模式提供专业的培训服务，或者定制化应用解决方案。

对于 Meta 乃至很多开源开发者来说，开源的野心不只是实现短期的商业，更希望引领规则的设计，构建生态。业内专家分析，开源背后的壁垒并不是那么容易打破的，尤其是高质量、带标注的训练数据集，尤其是专业模型的壁垒。

魅族集团数据合规执行总监朱凌峰表示，目前部分开源AI被头部公司把持，“用的人越多，网格效应就越强，而且不是真正意义上的开放，以后你还要用他们的配套工具和服务，头部公司还可能利用监管豁免，获得寻租空间。”也就是说，巨头游戏以开源为噱头，可能进一步强化大公司的垄断，不利于行业竞争。

据报道，去年 4 月与分析师的 *** 会议中，扎克伯格谈到，如果业界能够对 Meta 使用的基础工具进行标准化，那么 Meta 就能从其他人的改进中获益。同年 5 月，一份名为《我们没有护城河，不行》的谷歌泄露文件在网站上流传，其中包括谷歌需要开源社区远胜于开源社区需要谷歌的观点。文章作者指出，不同开源模式组成的生态系统永远是潜在的竞争对手，与开源 AI 竞争的结果注定会失败。

Meta出手，战局发生变化，大模型路线之争能否迎来真正的胜利者？

“开源和闭源大模型之间不太可能出现绝对的胜负，因为各自适合的应用和场景都不一样。”郭涛认为24K神，开源大模型更适合需要快速创新、大规模协作的项目，而闭源大模型可能更适合对性能、安全要求极高的商业应用。

***

本期编辑蒋培培实习生李杰

AI音乐开始抢占饭碗？246位知名艺人联名致信！

，再次“爆红”

“AI制药”是趋势还是泡沫？