作者:冯连阁、王军、实习生孔亚轩

责任编辑:王俊

开源还是闭源?这是大模型时代的问题。

今年早些时候,埃隆·马斯克对微软及其首席执行官萨姆·奥特曼提起诉讼,谴责该公司逐渐隐瞒模型研究细节。这位前联合创始人表示:“直到今天,该公司的网站还声称其使命是确保通用人工智能造福全人类。但实际上,它已经变成了科技巨头微软事实上的闭源子公司。”

不够“开放”,Meta又将其最新开源人工智能模型“开放”。

4月18日,Meta发布其最新版开源大模型Llama 3,引发开源AI社区一片欢呼。巧合的是,Llama 3发布当天,恰逢AI领域顶级学者、开源AI倡导者吴恩达的生日。“(Llama 3)是迄今为止更好的礼物,谢谢Meta!”他说。

迈向2024年,开源与闭源的争斗愈演愈烈,闭源阵营以目前最强的为代表,开源阵营Meta的LLaMa,也在不断迭代。闭源阵营坚持信仰Law,押注打造更强的通用模型;开源阵营的模型能力不断提升,强调推动性能更垂直、配置更灵活的大模型商业化。

关于是否选择开源还是闭源模型的讨论正在进行中。

对于业内人士来说,这一选择不仅将决定他们将如何点亮AI“技术树”,还将影响其商业路线的选择。换言之,这很可能是这个竞争激烈的市场的生死存亡之事。

两个版本,多重惊喜

Meta此次发布的Llame 3包含8B和70B预训练和指令微调版本。

据 Meta 官网介绍,Llama 3 模型将数据和规模提升到了新的高度。它基于超过 15T 的数据在两个定制的 24K GPU 集群上进行训练——训练数据集是 Llama 2 所用量的 7 倍多。它支持 8K 上下文长度,是 Llama 2 容量的两倍。

除了Llama 3,Meta还发布了新的信任和安全工具,包括Llama Guard 2、Code和Eval 2。

据悉,Llama 3即将在AWS(web)、Cloud Face、IBM、Azure等各大云厂商及模型API提供商平台上线,AMD、AWS、Dell、Intel、等提供的硬件平台也对Llama提供了支持。

在官网上,Meta还发布了两个版本与谷歌Gemma、、3等竞争对手的参数对比。据Meta官网介绍,它们在MMLU(学科知识理解)、GPQA(一般问题)、(编码能力)、G *** -8K(数学能力)、MATH(相对困难的数学问题)五个评估集上均表现不俗。

值得注意的是,8B的编码能力非常出色,在AI公众号“数字生活Kazik”站长Kazik分享的用户测试中,8B能够给出解决国际象棋中经典皇后问题的代码,而其之前的版本需要特殊的代码模型才能实现这一点。

市场反应迅速,18日,Meta股价逆势上涨1.54%,次日,百度智能云千帆大模型平台开启邀请测试,为Llama 3提供训练和推理解决方案,助力开发者训练专属大模型。

8B和70B车型只是Llama 3系列的开始,Meta AI首席科学家杨利坤在社交媒体上透露,未来几个月还将发布更多版本。

资深科学家 Jim Fan 认为,后续可能发布的 Llama 3-400B 版本将是一种“分水岭”,开源社区将能使用 GPT-4 级别的模型。

留在牌桌上,展示你的技能

在上一轮竞争中被认为有落入陷阱危险的Meta,在AI牌桌上以Llama系列打出了一手好牌。要讨论它带来的行业震撼,首先要了解大模型领域的开源到底是什么?

大模型领域的开源,通常意味着模型的架构、训练代码、预训练的权重等都公开,让研究者和开发者可以自由的访问和使用。

但不同模型的开源程度不尽相同,“有些模型可能只提供有限的访问,或者只提供部分代码。”郭涛指出,判断一个大型模型是否真正开源的标准可能包括:代码和数据的可访问性、许可证的宽松程度、社区支持的活跃程度、对改进和新应用的开放程度等。

放眼AI界,两条路径上都有“顶尖选手”,当然也有闭源AI行业下属的公司,包括百度的文心易言,以及风靡一时的Kimi。

开源方面,除了Llama系列之外,目前应用最为广泛的开源大模型包括非营利组织LAION、Dolly、MPT等推出的开源大模型,国内则包括阿里巴巴的统一乾文、智普的-4、百川智能的-7B中英文大模型、北京智远武道3.0大模型系列、绵比智能的CPM-Bee 10B中文基础大模型等。

这种差异化往往受到技术进步、商业模式迭代等多重影响。

天使投资人、资深人工智能专家郭涛认为,从技术角度看,开源可以促进学术界的研究和创新,闭源则有助于在一定时期内保持技术领先。

从商业角度看,开源可以吸引开发者社区的贡献,促进技术快速迭代和应用广泛传播,但可能影响公司的盈利模式;闭源可以保护知识产权,为公司创造直接收入来源,但可能限制技术的普及和生态系统的构建。

事实上,在此次发布之前,中国互联网刚刚经历了一轮开源与闭源之争。

据媒体报道,百度CEO李彦宏近日表态,开源大模型意义不大,闭源模型的性能还会不断提升。“有了文心大模型4.0,我们可以兼顾效果、响应速度、推理成本等多方面考量,根据需要裁剪出适合各类场景的更小尺寸模型,并支持微调和后处理。通过降维裁剪出来的模型,在同等尺寸下比直接从开源调出来的模型效果更好,同等效果下成本明显更低。”

李彦宏一直是闭源路线的忠实支持者,原因包括但不限于:他认为闭源的商业模式能够更好地汇集人力和财力。

而其对手360创始人周鸿祎则言辞犀利:“一句话,没有开源就没有Linux,没有Linux就没有互联网。”

《源神》的推出会带来什么影响?

“Llama 3的推出,将带来市场格局的变化。”郭涛在接受21世纪记者采访时指出,其优异的表现或将吸引更多的用户和投资者,从而提升其市场份额。

官网显示,Llama 3 将有条件开源用于商业用途(月活跃用户超过 7 亿需另行申请)。“不过这个对于商业用途来说,基本上是完全免费的。” 说道。

此前,投资人朱啸虎曾接受腾讯 *** 采访,谈到人工智能市场相关话题。当被问及2023年大模型发展的关键节点时,他的回答是Llama的推出。这为中国在应用层面的创新奠定了基础,降低了商业化的门槛。

当然,朱啸虎提到的货币化是指开源生态内的用户,开源大模型的发布者到底能不能盈利还是等待盈利机会,往往没有明确的答案。

闭源大模型通常通过授权、订阅服务,或者直接产品销售的方式盈利。AI领域的领军人物就在其中,虽然一直在推动开源项目,但一直采取收取API授权费用的方式,为其他公司提供服务。在API服务的过程中,其他公司不会接触到模型的细节和源代码,而只是通过API接口来调用。

根据创业者服务平台对全美1003家小企业的调查,生成式人工智能产品已经成为美国小企业应用最为广泛的产品,应用率达到70%。这说明闭源模式的商业化路径在一定程度上获得了成功。

开源模式如何寻求生存和发展的机会?

首先,以开放的生态吸引用户。国盛证券研报指出,开源大模型利用更大的标识符训练数据集、RLHF等方法,实现低训练成本和高性能,超大模型以下大模型的门槛正在消失。

“拥有用户之后,开源大模型通常通过提供增值服务、定制开发、技术支持等方式获得盈利。”郭涛指出,公司可以基于开源模式提供专业的培训服务,或者定制化应用解决方案。

对于 Meta 乃至很多开源开发者来说,开源的野心不只是实现短期的商业,更希望引领规则的设计,构建生态。业内专家分析,开源背后的壁垒并不是那么容易打破的,尤其是高质量、带标注的训练数据集,尤其是专业模型的壁垒。

魅族集团数据合规执行总监朱凌峰表示,目前部分开源AI被头部公司把持,“用的人越多,网格效应就越强,而且不是真正意义上的开放,以后你还要用他们的配套工具和服务,头部公司还可能利用监管豁免,获得寻租空间。”也就是说,巨头游戏以开源为噱头,可能进一步强化大公司的垄断,不利于行业竞争。

据报道,去年 4 月与分析师的 *** 会议中,扎克伯格谈到,如果业界能够对 Meta 使用的基础工具进行标准化,那么 Meta 就能从其他人的改进中获益。同年 5 月,一份名为《我们没有护城河,不行》的谷歌泄露文件在网站上流传,其中包括谷歌需要开源社区远胜于开源社区需要谷歌的观点。文章作者指出,不同开源模式组成的生态系统永远是潜在的竞争对手,与开源 AI 竞争的结果注定会失败。

Meta出手,战局发生变化,大模型路线之争能否迎来真正的胜利者?

“开源和闭源大模型之间不太可能出现绝对的胜负,因为各自适合的应用和场景都不一样。”郭涛认为24K神,开源大模型更适合需要快速创新、大规模协作的项目,而闭源大模型可能更适合对性能、安全要求极高的商业应用。

***

本期编辑 蒋培培 实习生 李杰

AI音乐开始抢占饭碗?246位知名艺人联名致信!

,再次“爆红”

“AI制药”是趋势还是泡沫?

未经允许不得转载! 作者:admin,转载或复制请以超链接形式并注明出处天心神途传奇手游发布网

原文地址:《AI“源神”上线!影响有多大?》发布于:2024-07-28

发表评论

表情:
验证码
评论列表 (暂无评论,42人围观)

还没有评论,来说两句吧...