開(kāi)源VS閉源,Meta“格局打開(kāi)”的同時(shí)打開(kāi)了大模型競(jìng)賽新路
1998年,Christine Peterson首次提出“開(kāi)源軟件”(Open Source Software)概念,自此,開(kāi)源在全球蓬勃發(fā)展。二十多年過(guò)去,曾經(jīng)口口聲聲喊著“開(kāi)源軟件是毒瘤”的微軟成為了“開(kāi)源”的擁躉,Red Hat、SUSE等企業(yè)大力開(kāi)發(fā)“開(kāi)源”的樂(lè)土也由此獲得巨大的成功。
(資料圖片)
直至今日,我們看到開(kāi)源技術(shù)愈發(fā)成熟,開(kāi)源理念深入人心,越來(lái)越多的人投身于開(kāi)源生態(tài)的建設(shè)當(dāng)中。與此同時(shí),關(guān)于“開(kāi)源”與“閉源”之爭(zhēng)在各個(gè)領(lǐng)域也都輪番上演,永不停歇。
當(dāng)下,在全球的大模型競(jìng)賽中,也迎來(lái)了開(kāi)、閉源的一次“交鋒”。
上個(gè)星期,在微軟的Inspire 合作伙伴大會(huì)上,Meta宣布和微軟深化合作,正式推出新一代開(kāi)源大型語(yǔ)言模型Llama 2,并宣稱這一模型將免費(fèi)開(kāi)放給商業(yè)和研究使用。
Meta創(chuàng)始人扎克伯格在Facebook上發(fā)帖表示:“Meta有著悠久的開(kāi)源歷史,開(kāi)源推動(dòng)創(chuàng)新,它讓更多開(kāi)發(fā)人員能夠使用新技術(shù)進(jìn)行開(kāi)發(fā),同時(shí)提高了技術(shù)的安全性。我們相信如果生態(tài)系統(tǒng)更加開(kāi)放,將會(huì)帶來(lái)更多進(jìn)步,這就是我們開(kāi)源 Llama 2 的原因?!?
顯而易見(jiàn),Meta正在致力于打破OpenAI和谷歌正在構(gòu)建的技術(shù)高墻,力圖通過(guò)生態(tài)的開(kāi)放打造一個(gè)真正“open”的AI產(chǎn)業(yè)。由此,大模型的競(jìng)逐,也再次迎來(lái)了新的發(fā)展局面。
01
Llama 2:能力超越 GPT-3,不及 GPT-3.5
什么是 Llama 2?
Llama 2是Meta今年3月初發(fā)布的 Llama 大模型的“升級(jí)”版本,相較于Llama 1,新版Llama 2 在模型規(guī)模、訓(xùn)練數(shù)據(jù)量、數(shù)據(jù)質(zhì)量、訓(xùn)練技術(shù)、模型結(jié)構(gòu)、安全訓(xùn)練等多個(gè)方面進(jìn)行了全面提升。
(Llama 2與Llama 1對(duì)比)
首先在模型規(guī)模上,據(jù)扎克伯格介紹,Llama 2的參數(shù)分別為70億,130億和700億三個(gè)版本。Llama 2 預(yù)訓(xùn)練模型接受了2萬(wàn)億個(gè) tokens 的訓(xùn)練,上下文長(zhǎng)度是 Llama 1 的兩倍,其微調(diào)模型已經(jīng)接受了超過(guò) 100 萬(wàn)個(gè)人類注釋的訓(xùn)練。此外,其還將單條文本的最大長(zhǎng)度從2048個(gè)token 提升至4096 個(gè)token,更長(zhǎng)的文本輸入這也就意味著可以包含更多上下文信息,從而提升模型的理解能力。
在訓(xùn)練數(shù)據(jù)量上,官方數(shù)據(jù)顯示,Llama 2比Llama 1預(yù)訓(xùn)練的數(shù)據(jù)多40%,并對(duì)其架構(gòu)進(jìn)行了改進(jìn)。據(jù)悉,Llama 2 采用了分組查詢注意力機(jī)制(grouped-query attention),可以顯著降低計(jì)算和內(nèi)存需求,提高大型模型推理的可擴(kuò)展性及速度。
在安全性和質(zhì)量方面,Meta研究人員在一篇概述Llama 2的論文中表示:“我們已經(jīng)采取措施提高這些模型的安全性,使用特定于安全性的數(shù)據(jù)注釋和調(diào)整,以及進(jìn)行使用迭代評(píng)估。”據(jù)介紹,Llama 2應(yīng)用了有監(jiān)督的微調(diào)和RLHF。
Meta聲稱,Llama 2 在許多外部基準(zhǔn)測(cè)試中都優(yōu)于Llama 1和其他開(kāi)源大語(yǔ)言模型,包括推理、編碼、熟練程度和知識(shí)測(cè)試。
來(lái)自伯克利大學(xué)的人工智能專業(yè)博士Nathan Lambert在自己的博客中對(duì)Meta發(fā)表的Llama 2的論文發(fā)表了自己的看法。他表示,Llama 2模型評(píng)估結(jié)果令人興奮不已,在經(jīng)過(guò)基準(zhǔn)測(cè)試后,Llama 2已經(jīng)超越 GPT-3,在推理任務(wù)上,Llama 2 接近GPT-3.5,確定是第一個(gè)能達(dá)到ChatGPT水平的開(kāi)源模型。
Nvidia高級(jí)AI科學(xué)家Jim Fan估測(cè)Llama-2的訓(xùn)練費(fèi)用可能超過(guò) 2000 萬(wàn)美元,他表示,在“HumanEval”(標(biāo)準(zhǔn)編碼基準(zhǔn))上,Llama-2 還與GPT-3.5存在顯著差距,它還不如 StarCoder 或其他許多專門為編碼而設(shè)計(jì)的模型。
盡管在能力方面,Llama-2還不及GPT-3.5,但它的意義不止于此,最令業(yè)內(nèi)激動(dòng)的地方,在于它免費(fèi)開(kāi)放給商業(yè)和研究使用。
當(dāng)下, Meta已開(kāi)源了Llama 2預(yù)訓(xùn)練模型的代碼和參數(shù),并開(kāi)放了商業(yè)使用許可。值得注意的是,月活量超過(guò)7億的產(chǎn)品需要另外申請(qǐng)商用許可。
作為L(zhǎng)lama 2的首選合作伙伴微軟,Meta 表示,Llama 2 可在 Azure AI 模型目錄中使用,當(dāng)然,也可通過(guò)Amazon Web Services(AWS)、Hugging Face和其他提供商獲取使用。
02
格局打開(kāi)?大模型競(jìng)逐新局面到來(lái)
對(duì)于此次Meta將免費(fèi)將 Llama 2開(kāi)放給商業(yè)和研究使用,不少人評(píng)論道:“格局打開(kāi)了”,相較于走閉源路線的OpenAI,Meta真正做到了“Open”。
對(duì)于愈發(fā)激烈的大模型競(jìng)賽而言,這又意味著什么?
用圖靈獎(jiǎng)得主、Meta 首席人工智能科學(xué)家 Yann LeCun的話來(lái)說(shuō),Meta此舉或?qū)⒏淖兇竽P托袠I(yè)的競(jìng)爭(zhēng)格局。
如果說(shuō) OpenAI發(fā)起了大模型的競(jìng)賽開(kāi)始,那么,Meta則打開(kāi)了大模型競(jìng)逐的新局面,開(kāi)源大模型的新路由此開(kāi)辟。
開(kāi)源的意義在哪里?小米副總裁崔寶秋曾指出,開(kāi)源的本質(zhì)是協(xié)同和創(chuàng)新,協(xié)同是全世界所有人各方開(kāi)源力量的協(xié)同,創(chuàng)新是一個(gè)技術(shù)的創(chuàng)新。
簡(jiǎn)單來(lái)說(shuō),開(kāi)源大模型將能匯聚更多的技術(shù)創(chuàng)新力量,在這里,全球開(kāi)發(fā)者、研究機(jī)構(gòu)、科技企業(yè)將一同協(xié)同共建,大家一塊讓模型的數(shù)據(jù)更加豐富、模型更加優(yōu)化、工具更加完善、應(yīng)用更加全面...可以說(shuō)是“眾人拾柴火焰高”,從而加速大模型技術(shù)的迭代升級(jí)、應(yīng)用的豐富發(fā)展,為大模型的發(fā)展方向打開(kāi)更多的可能性,同時(shí)也惠及更多的人群。
此外,開(kāi)源也就意味著個(gè)人開(kāi)發(fā)者和中小型企業(yè)能夠以最低的成本調(diào)用Llama 2大模型,而不是花費(fèi)高昂的成本采購(gòu)閉源大模型,這也有利于開(kāi)源大模型用戶的吸納與培養(yǎng)以及大模型開(kāi)源生態(tài)的構(gòu)建。
據(jù)悉,當(dāng)下開(kāi)源社區(qū)Hugging Face已成為“頂流中的頂流”,其上面有超 25 萬(wàn)個(gè)模型,包括 Meta 的Llama 2、國(guó)內(nèi)搜狐創(chuàng)始人王小川創(chuàng)立的百川智能的大語(yǔ)言模型“百川”。
可以說(shuō),開(kāi)源是吸納、培養(yǎng)用戶、確定行業(yè)標(biāo)準(zhǔn)的重要途經(jīng),也是避免當(dāng)下AI大模型企業(yè)一輪又一輪重復(fù)造輪子、低成本試錯(cuò)的理想商業(yè)化手段。
03
開(kāi)源vs 閉源:兩者并非選擇題
開(kāi)源大模型出現(xiàn)后,隨之而來(lái)的便是一道選擇題:模型的底座選擇到底是開(kāi)源還是閉源?
盡管開(kāi)源“免費(fèi)的飯很香”,但也并非不存在問(wèn)題,或者說(shuō),在很多層面,閉源大模型仍保持著領(lǐng)先優(yōu)勢(shì)。
一方面,在模型質(zhì)量上,閉源大模型的質(zhì)量更高,比如說(shuō)最前沿的GPT-4便是閉源大模型,正如前文所言,哪怕是當(dāng)下可以說(shuō)是最強(qiáng)勢(shì)的Llama-2 還與GPT-3.5存在顯著差距。
數(shù)據(jù)顯示,在學(xué)術(shù)界廣為引用的、由斯坦福大學(xué)計(jì)算機(jī)系研究團(tuán)隊(duì)發(fā)表的《Holistic Evaluation of Language Models》論文中,對(duì)國(guó)外30個(gè)主流語(yǔ)言模型在準(zhǔn)確率、魯棒性、公平性、推理等主要指標(biāo)進(jìn)行評(píng)測(cè),便發(fā)現(xiàn):開(kāi)源(Open)模型在大多數(shù)指標(biāo)上表現(xiàn)弱于閉源(Close)或部分開(kāi)源(Limited)的模型。
另一方面,大模型最終指向的還是產(chǎn)業(yè)落地,在商業(yè)化落地上,閉源大模型的能力更強(qiáng)。大模型要想落地就必須與企業(yè)業(yè)務(wù)相結(jié)合,這需要專業(yè)的人提供專業(yè)的服務(wù)能力,讓大模型的能力與業(yè)務(wù)場(chǎng)景完美融合,并非一朝一夕的事情,需要長(zhǎng)期賦能,這不是免費(fèi)的開(kāi)源大模型能做到的事情。
此外,大多數(shù)的開(kāi)源大模型是“站在巨人肩膀上”推出的,也就是說(shuō)處于領(lǐng)先水平的開(kāi)源模型都是由大企業(yè)開(kāi)發(fā),話語(yǔ)權(quán)也都掌握在他們手中,繁榮的背后也存在著一絲不確定性。
換言之,著眼當(dāng)下,閉源大模型是大模型落地商業(yè)化更優(yōu)的選擇,但這不代表,只能選擇閉源大模型,放眼未來(lái),開(kāi)源大模型是讓AI普惠化實(shí)現(xiàn)的重要方向。
俗話說(shuō),小孩子才做選擇,大人的世界是全都要,開(kāi)源與閉源并非選擇題,也正如百川智能創(chuàng)始人王小川所言:“今天不能簡(jiǎn)單的說(shuō)我們未來(lái)大模型就是走向OpenAI——閉源的中心化的模型。開(kāi)源實(shí)際上是具備著很大的可能性,有可能蘊(yùn)含著極大商業(yè)模式和價(jià)值?!?
總言之,在大模型這場(chǎng)競(jìng)賽中,我們期待看到閉源大模型深扎產(chǎn)業(yè),讓AI的智能力量真正飛入“千萬(wàn)家”,也期待著開(kāi)源大模型根深葉茂,肆意生長(zhǎng)為大模型的迭代、AI產(chǎn)業(yè)的發(fā)展開(kāi)拓更多的想象空間。
關(guān)鍵詞:
您可能也感興趣:
今日熱點(diǎn)
為您推薦
外媒:美政客忽視槍支管控呼吁 美國(guó)如今已非真正的民主國(guó)家
破發(fā)股深圳瑞捷跌7.33% 2021年上市超募3億元
蘋果充電頭一定要買原裝的嗎
更多
- C視頻丨最后一圈高燃沖刺 中國(guó)選手夏雨雨獲成都大運(yùn)會(huì)田徑女...
- 快訊!俄媒:俄國(guó)防部稱,烏再次對(duì)俄海軍艦艇發(fā)動(dòng)無(wú)人艇襲擊...
- 兩部門緊急預(yù)撥1.1億元支持京津冀地區(qū)防汛救災(zāi)
- 恒豐銀行重慶分行黨建賦能高質(zhì)量發(fā)展
- 河北聯(lián)通與某大學(xué)簽訂了合作協(xié)議 公司一把手張春輝出席活動(dòng)
- 港股2日跌2.47% 收?qǐng)?bào)19517.38點(diǎn)
- 西媒報(bào)道:元宇宙泡沫破裂
- 簡(jiǎn)筆畫(huà)動(dòng)漫人物(蜘蛛俠英雄遠(yuǎn)征簡(jiǎn)筆畫(huà))
更多
- 近萬(wàn)名華為開(kāi)發(fā)者云集東莞 廣東首個(gè)開(kāi)發(fā)者節(jié)即將精彩來(lái)襲
- 中興通訊午后放量逼近漲停 股價(jià)創(chuàng)近3年新高
- 多項(xiàng)行為違規(guī),光大證券分公司、營(yíng)業(yè)部及相關(guān)負(fù)責(zé)人收6份監(jiān)管函
- V觀財(cái)報(bào)|永輝超市漲停后澄清:不存在京東洽談全資收購(gòu)
- 女足世界杯第14日:法國(guó)6-3小組頭名出線!巴西、意大利、阿根...
- 8月1日新股速遞
- 洪水水頭到達(dá)天津,如何防護(hù)保安全?另外,暑假這些事家長(zhǎng)需...
- 為攬生意竟毀綠開(kāi)路,執(zhí)法部門依法嚴(yán)查
排行
- 開(kāi)源VS閉源,Meta“格局打開(kāi)”的同時(shí)打開(kāi)了大模型競(jìng)賽新路
- 蘭州:房企和中介拒絕公積金貸款將被嚴(yán)懲
- 華夏幸福青訓(xùn)的深耕與遠(yuǎn)播
- 全國(guó)自由式滑雪雪上技巧冠軍賽奏響十四冬序曲
- 華晨宇身著2018春夏Ermenegildo Zegna Couture系列亮相
- 錢江晚報(bào):“月薪2萬(wàn)難招工”,不必太焦慮
- 5G走進(jìn)百姓家,還需邁好這三步
- 家電網(wǎng)購(gòu)市場(chǎng)持續(xù)升溫
- 熒屏熱播劇大叔在“霸屏” 靠演技碾壓流量小鮮肉
- “i深圳”APP上線5大公共法律服務(wù)板塊,提供一站式服務(wù)
最近更新
- 開(kāi)源VS閉源,Meta“格局打開(kāi)”的同時(shí)打開(kāi)了大模型競(jìng)賽新路
- 云南省昆明市2023-08-02 21:21發(fā)布雷電黃色預(yù)警
- T1宣布Faker選手回歸!今日首發(fā)迎戰(zhàn)KDF 對(duì)手戰(zhàn)績(jī)4-12
- 拼多多捐贈(zèng)3000萬(wàn)元,馳援京津冀抗汛救災(zāi)
- 上海地鐵首末班車時(shí)刻表2023(8月1日啟用)
- 九板村:不見(jiàn)“九板” 卻因“九板”得名
- 微視頻|涿州,涿州!救援,救援!
- 今日股票行情快報(bào):教育、景點(diǎn)旅游、銀行等板塊跌幅居前
- 貴州茅臺(tái)半年業(yè)績(jī)高于預(yù)告,20.76%的營(yíng)收增幅創(chuàng)5年新高顯茅臺(tái)速度
- 20人遇難!京津冀暴雨最憤怒一幕曝光,勸你別拿天災(zāi)開(kāi)玩笑!
- 2023浙江舟山市定海興發(fā)協(xié)作資產(chǎn)經(jīng)營(yíng)有限公司招聘企業(yè)正式合...
- 星源卓鎂收關(guān)注函:年內(nèi)股價(jià)漲近160%,自動(dòng)駕駛概念含金量幾何?
- 散養(yǎng)土雞200只需多大面積
- 濟(jì)南口碑好的養(yǎng)護(hù)院有哪些?濟(jì)南養(yǎng)護(hù)院名單
- 會(huì)暢通訊籌碼持續(xù)集中 最新股東戶數(shù)下降2.56%
- 男子驅(qū)車千里赴涿州幫救援隊(duì)修車:服務(wù)區(qū)沒(méi)修車的,所以就趕...
- 【陳皮姜絲冬瓜湯】有滋陰養(yǎng)血和行氣利水的功效
- 上海申請(qǐng)房地產(chǎn)開(kāi)發(fā)企業(yè)資質(zhì)三級(jí)
- 居民電動(dòng)車充電樁分時(shí)電價(jià)新規(guī):深谷時(shí)段每度0.222元
- 0.5米分辨率 我國(guó)光學(xué)衛(wèi)星成功減重:1200千克驟降至230千克
- (崩壞3)關(guān)于文職艦長(zhǎng)的我該怎么拯救世界這檔子事 (383)
- 電光科技:公司新廠房預(yù)計(jì)明年年初完成竣工
- 三桶油持續(xù)走弱 中國(guó)石油跌近5%
- 洪水無(wú)情,人有情:涿州抗洪背后的社會(huì)沖突與團(tuán)結(jié)
- 榮耀Play7T 手機(jī)聲音調(diào)小會(huì)省電嗎
- 榮耀Play7T Pro待機(jī)時(shí)間有十個(gè)小時(shí)嗎
- 碳中和板塊跌0.21% 華西能源漲10.14%居首
- 三棵樹(shù)跌4.23% 東北證券在其高點(diǎn)喊買入
- 蘋果充電頭一定要買原裝的嗎
- 重磅!平野美宇連敗國(guó)乒后想退役,網(wǎng)友高呼趕快嫁給張繼科
今日要聞
- 0.5米分辨率 我國(guó)光學(xué)衛(wèi)星成功減重:1200千克驟降至230千克
- 新疆塔里木河啟動(dòng)實(shí)施第24次第二階段下游生態(tài)輸水工作
- 近萬(wàn)名華為開(kāi)發(fā)者云集東莞 廣東首個(gè)開(kāi)發(fā)者節(jié)即將精彩來(lái)襲
- 預(yù)售25.98萬(wàn)起 全新紅旗HS7開(kāi)啟預(yù)售
- 郭明錤:iPhone 15需求或低于iPhone 14
- 張寧砍下17分9籃板3助攻 關(guān)鍵時(shí)刻8分1助引領(lǐng)12-2一波流
- 瓊山區(qū)6條精品旅游線路開(kāi)啟暑期狂歡
- 眼部化妝步驟(眼妝教程完美眼部化妝步驟分享)
- 中國(guó)八大美院之一(中國(guó)八大美院)
- 補(bǔ)時(shí)絕殺,官方:拜仁小將克雷齊希當(dāng)選與利物浦一役全場(chǎng)最佳