神马影视神马影视

AI“源神”启动!影 响 多大?

AI“源神”启动!影 响 多大?

开源 还是闭源?这是属于(yú)大模(mó)型的时代之问。

今年年初,埃隆·马斯克在对(duì)OpenAI及(jí)其CEO萨姆·奥(ào)特曼提(tí)起(qǐ)诉讼时,就对OpenAI逐渐不公开其(qí)模型研究 相关细节 的(de)行为大加谴责(zé)。“时(shí)至今日,OpenAI公司网站(zhàn)还宣称(chēng),它(tā)的宗旨是(shì)确保通用人工智能造福全人类(lèi)。然(rán)而,在现实中,OpenAI已经转变为科技巨头(tóu)微(wēi)软事实上的闭源(yuán)子公司。”这位曾经的OpenAI联合创始人如此表示。

OpenAI不够“Open”,Meta却“Open”了 自己(jǐ)最新的开源人 工智能模型(xíng)。

4月18日,Meta 发布了其最新版本(běn)的开源(yuán)大模型(xíng) Llama 3,引(yǐn)起开源AI社区的一阵(zhèn)欢呼。巧合的是,Llama 3发布当天正好是AI领域顶尖学(xué)者、AI开源倡导者吴恩达的生(shēng)日。“(Llama 3是(shì))至(zhì)今为(wèi)止最好的礼物,谢感谢Meta!”他说。

行至2024,开闭源之争日(rì)渐白热化。闭源阵营以目前(qián)最强的OpenAI为代(dài)表(biǎo),开源阵 营(yíng)Meta的LLaMa、Mistral和Google等也在不断迭(dié)代。闭源阵(zhèn)营坚持对Scaling Law的(de)信仰,押(yā)注在更强通用模型的打造上(shàng);开源阵营模型能力不断提升(shēng),并且强调以更垂直的性能、更灵活的配置来推动大模型商业化落地。

关于应(yīng)该(gāi)选择模型开源还是闭源讨论经久不息。

对于局内人,这一选择(zé)这不(bù)仅决定了他们将如何点亮AI“科技树”,更(gèng)将(jiāng)影响他们的商业路(lù)线(xiàn)选择。换言(yán)之,这很有可能是这(zhè)个残酷竞(jìng)争市场(chǎng)下的生存问题。

两个版(bǎn)本,多重惊喜

Meta此次发布的Llame 3包括8B和(hé)70B的预训练和指令微调版本。

据Meta官网信息(xī),Llama 3 模型(xíng)将数据和规模提升到新的高度。它在两个定制24K GPU集群上基于超过 15T 的(de)数据进行了训练——训练数据集是Llame 2使用量的7倍有余。它支持 8K 上下文长度,是 Llama 2 容量的两倍(bèi)。

除了(le) Llama 3,Meta 还发布了新的信任(rèn)和安全(quán)工具,包括Llama Guard 2、Code Shield和 CyberSec Eval 2。

据悉,Llama 3 即将在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商、模型 API 提供商平(píng)台 上线,Llama还得到AMD、AWS、戴尔、英特尔、NVIDIA和高通(tōng)提供的硬件平台的支(zhī)持。

在官网上,Meta还放出了Llama3两个版本与谷歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等 竞争(zhēng)对手的参数对比。据Meta官网,Llame3在(zài)MMLU(学科知 识 理解)、GPQA(一般问题)、HumanEval(代码(mǎ)能力)、GSM—8K(数学能力)、MATH(比(bǐ)较难的数学问(wèn)题)5个评测集上均表现良好(hǎo)。

值得注意的(de)是,Llama3的代码(mǎ)能(néng)力(lì)非常(cháng)优秀。在 AI领域公众号“数字生命(mìng)卡兹克(kè)”主理人卡兹克分享(xiǎng)的(de)用户实(shí)测中(zhōng),Llama3—8B能够(gòu)给出国际象棋中经典(diǎn)皇后问题的解题代(dài)码。而其前代版本Llama2需要专(zhuān)门的代码模(mó)型才能实现(xiàn)。

市场的(de)反应(yīng)速度很快。18日当天,Meta股价逆势收涨(zhǎng)1.54%。次日,百度智能云千帆大模(mó)型平(píng)台开放邀约测(cè)试,提供针(zhēn)对Llama 3的训练推(tuī)理方案,帮助开发者训练专属大模型。

8B和70B 两个型号的模型,仅 仅标志着 Llama 3 系列的开端,Meta AI首席科学(xué)家杨立昆在其社交媒体透露(lù),在接下(xià)来的几(jǐ)个月,还会有更多版本陆续发布。

英伟达高(gāo)级科学家Jim Fan认为之(zhī)后可能会发布的Llama 3-400B以上的版本将成为某种“分水岭”,开源社区将能用上GP一汽解放:一季度净利润1.69亿元 同比增长174%T-4级别的模型。

不(bù)下牌桌,各显神通

上一轮元宇宙(zhòu)竞争中被认(rèn)为可能跌进(jìn)坑里的Meta,在人(rén)工智能的牌桌上打出了Llama系列这(zhè)把 好牌。要讨论Llama3带来的行(xíng)业震荡,首先要明白,什么是大模型领域的开源?

大模型(xíng)领域的(de)开(kāi)源通 常意(yì)味着模型的架构、训练代码和预训练权重等(děng)都被公开,允许研究人员和开发者自由地访(fǎng)问和使用(yòng)。

不(bù)过,开源的程度(dù)因模型(xíng)而异。“有些可能只提供有限的(de)访问权限或部分代码。”郭涛指(zhǐ)出,判断大模型是否真正(zhèng)开源 的基准可能包括:代(dài)码和数据的可访问性、使用许可的宽松(sōng)程度、社区支持的活跃度以及对(duì)改进和新应用的开放性。

放眼AI界,两条路径上都各有“头(tóu)号玩家”分布。闭源自不必说,海外有OpenAI旗下的ChatGPT,国内是百度 的文心一言(yán)以及风头(tóu)正(zhèng)劲的月之暗面(miàn)Kimi。

而开源方(fāng)面(miàn),除了Llama系列(liè),目(mù)前应用较广的开源大模型还包括非营利组织 LAION推(tuī)出(chū)的OpenFlamingo、Databricks的Dolly,以及MosaicML的(de)MPT等。国内则包(bāo)括,阿里巴巴的通义千问,智谱的(de)ChatGLM-4、百川智能的baichuan-7B中英文大(dà)模型、北(běi)京智源悟道3.0大模型(xíng)系列和(hé)面壁智能的CPM-Bee 10B中文基座大模型等。

形成这样的分化,很(hěn)多时候是(shì)受技术(shù)进步和商业模式迭代等的多重(zhòng)影响。

天使投资人、资深人工智能专家郭 涛认为,从技术(shù)角度来(lái)看,开源可以促进学术界的研究(jiū)和创新,而闭(bì)源则有助于在一定时间内保持技术领先优(yōu)势。

从商(shāng)业角度来看,开源(yuán)可以(yǐ)吸引开发者社区的贡献,促进技术的快速迭代和(hé)应用的(de)广泛传播,但可能会影(yǐng)响到公司的盈利模式。闭源(yuán)则可以保护知(zhī)识产权,为公司创造直接(jiē)的收入来源,但可能会限制技术的普及和生态的建设。

事实上一汽解放:一季度净利润1.69亿元 同比增长174%,在Llama3发布之前,中(zhōng)文互(hù)联网(wǎng)刚刚经历了一轮开闭源论战。

据媒体(tǐ)报道,百度CEO李彦宏近(jìn)日表态,认为大模型开源(yuán)意义(yì)不大,闭源模型性能(néng)会不(bù)断(duàn)提升。“有(yǒu)了文(wén)心大模型(xíng)4.0,我们可以根据需要(yào)兼顾效果、响应速度、推理成(chéng)本 等各种考虑,裁剪出适合各种场景的更小(xiǎo)尺寸模型,且支持精调和post pretrain。通过降维裁(cái)剪出的模型,比直接拿 开源调出来的模(mó)型,同等(děng)尺寸下效果(guǒ)更好,同等效果下成本明显更低。”

李彦宏一直是闭源路线的忠实拥趸,理由包括(kuò)但不限于(yú)认可闭源商业模(mó)式可以更好地 聚集人力和财力等。

而其反对者——360创始人周鸿祎言简意赅,“一句话(huà),今(jīn)天没有开源就没有(yǒu) Linux,没有 Linux 就(jiù)没有(yǒu)互联网(wǎng)。”

“源神”启动,影响几何?

“Llama 3的发布会带来市场格局的改变。”郭涛在接受21记者采访时指出(chū),其优(yōu)异表 现(xiàn)可能吸引更多(duō)的用户和投(tóu)资者,从而增加其市场份额。

官网显示(shì),Llama 3将(jiāng)有条件地开源给商业使用(月活用户超过7亿需要单独申请)。“不过这基(jī)本等于完全免费商(shāng)用了。”卡兹克表示。

此(cǐ)前,投(tóu)资人朱啸虎曾经就人(rén)工智能市场相关话题接受腾讯新闻采访。当被问及2023年大(dà)模型(xíng)发展(zhǎn)的关键节点时,他给出的回答正是Llama上线。这让中国在应用层 面创新有了基础(chǔ),降低了商(shāng)业化门槛。

当然,朱啸虎提到的变现是 指开源生(shēng)态内(nèi)的用户(hù)。对于开源大模型发布者的能否盈利,或(huò)者能等(děng)来盈利机会,很多时候并没有确定的答案。

闭(bì)源(yuán)大模型(xíng)通常通过授(shòu)权使用、订阅服(fú)务或者直接销售产品来盈利(lì)。其(qí)中的代(dài)表便是AI领域的(de)领跑(pǎo)者OpenAI,虽然其一 直有推进开源项目(mù)的 动作,但其处在核心地位的ChatGPT却(què)一直采取收取API许可费的方式向其他公司提供服务(wù)。在API服务过程,其他公司不会接触到ChatGPT模型(xíng)的细节和源(yuán)代码,仅仅通过API接口进行调用。

创业者(zhě)服务(wù)平台GoDaddy对全美1003家小型(xíng)企业的调查(chá)数据显示,ChatGPT以70%的应用率成为美国小型企业应用最(zuì)多的生(shēng)成式AI产品(pǐn),这说明OpenAI选择的闭源(yuán)模式的商(shāng)业化之路在一定程度已经跑通。

开源模型(xíng)如何寻求生存和发展(zhǎn)的机会?

首先是以开放的生态吸引用(yòng)户。国盛(shèng)证券研报就指出,开源大模型借助更 大标识符训练数(shù)据集、DeepSpeed、RLHF等(děng)方式,实现低训练(liàn)成本(běn)和高性能(néng),超大模型以下大模型的壁垒正(zhèng)在消(xiāo)失。

“在拥有用(yòng)户后,开源 大模(mó)型(xíng)通常通过(guò)提供增(zēng)值服务、定制开发、技术支持等方式来实(shí)现盈(yíng)利”。郭涛指(zhǐ)出(chū),公司可(kě)以在开(kāi)源模型的基(jī)础上提(tí)供专业的训练服务或者定制化的应用解决方案(àn)。

对于Meta甚至众多(duō)开源者(zhě)而言,开源的(de)野心不仅是短期的商业变现,其(qí)更想引领规则设计以及搭建生态。有业内专(zhuān)家分析,开源后壁(bì)垒并没有那么容(róng)易破(pò)除(chú),高 质量、标(biāo)注(zhù)过的训(xùn)练数据 集尤其(qí)是专业模型的壁垒。

星纪(jì)魅族集团数据合规(guī)执行总监朱玲凤表示,目前有些开源AI由头部公 司主导,“越多人使用,就(jiù)越能强化网 格效(xiào)应,而且不是真正的 开放(fàng),后(hòu)续需要使(shǐ)用它们的(de)配套工具、配套服务。头(tóu)部公司还(hái)可能利用监管豁免的(de)方式,获得寻租空间。”换言之,以开源为噱头的(de)巨头游戏(xì),可(kě)能会 进一步强化(huà)大公司的(de)垄断地位,反而不利于产业竞争。

据报道,去(qù)年(nián)4月,在扎 克伯格与分析师的一次电话会议中,他就谈(tán)到,如果行业能够在Meta使用的基础工具上达成标准(zhǔn)化 ,那么meta就能从其他人的改进中受益。同年5月,谷歌(gē)内部泄(xiè)露的文件《我们没有 护城河,OpenAI也没有》在(zài)SemiAnalysis网站上传播,其中的(de)观点包括,比起开源社区需要谷歌,谷歌更(gèng)需要开源社(shè)区等等。文章作者指出,不同开源模型所组成(chéng)的生态系统永远是OpenAI的潜在竞争对(duì)手,与开源AI竞争的(de)结(jié)果必然是(shì)失败。

Meta落子,战局生变。大模型的路线(xiàn)之争会(huì)不会迎来真正的胜利者(zhě)?

“开源(yuán)与闭源大模型之间不(bù)太可能分出(chū)绝对的输赢,因为(wèi)它们各自(zì)适合不同的应用和场景。”郭涛认为,开源大模型更适合(hé)那些需要快速创新和大规模协作的项目,而闭源大模型(xíng)可能(néng)更适合(hé)那些对性能和(hé)安全(quán)性有极高要求的商 业应用。

未经允许不得转载:神马影视 一汽解放:一季度净利润1.69亿元 同比增长174%

评论

5+2=