夜先锋av资源网站,国产精品极品美女在线观看免,欧美亚洲精品电影在线观看,日韩在线精品强乱一区二区三区

首頁 資訊 > 研究 > 正文

當(dāng)前快訊:全面開源??“悟道3.0”大模型系列發(fā)布

本報(bào)訊 (記者 張偉) 在6月9-10日舉行的2023北京智源大會(huì)上,北京智源研究院院長黃鐵軍發(fā)布《2023智源研究院進(jìn)展報(bào)告》,并發(fā)布了全面開源的“悟道3.0”系列大模型及算法,報(bào)告了在高精度生命模擬和有機(jī)大分子建模方面的最新進(jìn)展。

繼2021年悟道大模型項(xiàng)目連創(chuàng)“中國首個(gè)+世界最大”紀(jì)錄之后,智源 “悟道3.0 ”進(jìn)入全面開源新階段,帶來一系列領(lǐng)先成果:“悟道·天鷹”(Aquila)語言大模型系列、天秤(FlagEval)開源大模型評(píng)測體系與開放平臺(tái),“悟道 · 視界”視覺大模型系列,以及一系列多模態(tài)模型成果。

黃鐵軍介紹,在2021年3月的悟道1.0發(fā)布會(huì)上,智源研判人工智能已經(jīng)從“大煉模型”轉(zhuǎn)變?yōu)椤盁挻竽P汀钡男码A段,從此,“大模型”這個(gè)概念進(jìn)入公眾視野。


(資料圖片僅供參考)

至于何為大模型?他認(rèn)為,需要具備3個(gè)條件:一是規(guī)模要大,參數(shù)達(dá)百億規(guī)模以上;二是涌現(xiàn)性,能夠產(chǎn)生預(yù)料之外的新能力;三是通用性,不限于專門問題或領(lǐng)域,能夠處理多種不同的任務(wù)。

據(jù)介紹,悟道系列模型已發(fā)展到“悟道3.0”版本,涵蓋語言、視覺、多模態(tài)等基礎(chǔ)大模型。其中,“悟道·視界”視覺大模型系列,實(shí)現(xiàn)6項(xiàng)國際領(lǐng)先技術(shù)突破,點(diǎn)亮了通用視覺曙光?!拔虻馈ひ暯纭毕到y(tǒng)化解決了當(dāng)前計(jì)算機(jī)視覺領(lǐng)域的一系列瓶頸問題,包括任務(wù)統(tǒng)一、模型規(guī)?;约皵?shù)據(jù)效率等,包括在多模態(tài)序列中補(bǔ)全一切的多模態(tài)大模型 Emu,最強(qiáng)十億級(jí)視覺基礎(chǔ)模型 EVA,一通百通、分割一切的視界通用分割模型,首創(chuàng)上下文圖像學(xué)習(xí)技術(shù)路徑的通用視覺模型Painter,性能最強(qiáng)開源CLIP模型 EVA-CLIP,以及簡單prompt(提示)即可視頻編輯的 vid2vid-zero 零樣本視頻編輯技術(shù)。

悟道·天鷹(Aquila)語言大模型系列+天秤(FlagEval)評(píng)測體系,打造了大模型能力與評(píng)測標(biāo)準(zhǔn)雙標(biāo)桿。為推動(dòng)大模型在產(chǎn)業(yè)落地和技術(shù)創(chuàng)新,智源研究院發(fā)布了“開源商用許可語言大模型系列+開放評(píng)測平臺(tái)”兩大重磅成果,打造“大模型進(jìn)化流水線”,持續(xù)迭代、持續(xù)開源開放。

悟道·天鷹Aquila 語言大模型是首個(gè)具備中英雙語知識(shí)、支持商用許可協(xié)議、國內(nèi)數(shù)據(jù)合規(guī)需求的開源語言大模型。該模型在中英文高質(zhì)量語料基礎(chǔ)上從 0 開始訓(xùn)練,通過數(shù)據(jù)質(zhì)量的控制、多種訓(xùn)練的優(yōu)化方法,實(shí)現(xiàn)在更小的數(shù)據(jù)集、更短的訓(xùn)練時(shí)間,獲得比其它開源模型更優(yōu)的性能。

天秤(FlagEval)大模型評(píng)測體系及開放平臺(tái),旨在建立科學(xué)、公正、開放的評(píng)測基準(zhǔn)、方法、工具集,協(xié)助研究人員全方位評(píng)估基礎(chǔ)模型及訓(xùn)練算法的性能,同時(shí)探索利用AI方法實(shí)現(xiàn)對(duì)主觀評(píng)測的輔助,大幅提升評(píng)測的效率和客觀性。

據(jù)悉,天秤(FlagEval)評(píng)測體系是科技部2030旗艦項(xiàng)目重要課題,正與北京大學(xué)、北京航空航天大學(xué)、北京師范大學(xué)、北京郵電大學(xué)、閩江學(xué)院、南開大學(xué)、中國電子技術(shù)標(biāo)準(zhǔn)化研究院、中國科學(xué)院自動(dòng)化研究所等合作單位共建(按首字母排序),定期發(fā)布權(quán)威評(píng)測榜單

與此同時(shí),開源開放,F(xiàn)lagOpen 大模型開源技術(shù)體系升級(jí),大規(guī)模、可商用中文指令數(shù)據(jù)集COIG二期也于會(huì)上發(fā)布。

“大模型不是任何一家機(jī)構(gòu)或者一家公司壟斷的技術(shù),大模型技術(shù)體系是大家共建共享。我們要共建一個(gè)智力社會(huì)所需要的一套基礎(chǔ)的算法體系”。黃鐵軍院長介紹,基于此,智源研究院在打造開源生態(tài)方面做了許多努力。今年年初發(fā)布的FlagOpen大模型技術(shù)開源體系,經(jīng)過一段時(shí)間的發(fā)展,又有了一系列發(fā)展。這為大模型發(fā)展夯實(shí)底層技術(shù)棧,提供切實(shí)加速度。

如,F(xiàn)lagOpen平臺(tái)是智源建設(shè)的大模型技術(shù)開源體系。旨在打造全面支撐大模型技術(shù)發(fā)展的開源算法體系和一站式基礎(chǔ)軟件平臺(tái),支持協(xié)同創(chuàng)新和開放競爭,共建共享大模型時(shí)代的“新Linux”開源開放生態(tài)。

數(shù)據(jù)集方面,智源已開源首個(gè)大規(guī)模、可商用的中文指令數(shù)據(jù)集COIG。COIG一期已開放總計(jì)19.1萬條指令數(shù)據(jù),COIG二期正在建設(shè)最大規(guī)模、持續(xù)更新的中文多任務(wù)指令數(shù)據(jù)集,整合了1800多個(gè)海量開源數(shù)據(jù)集,人工改寫了3.9億條指令數(shù)據(jù),并提供了完善的數(shù)據(jù)篩選、版本控制工具。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.ossf.org.cn All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3