每日訊息!英特爾以強(qiáng)大產(chǎn)品力,迎接生成式AI的廣闊機(jī)遇
要點(diǎn)速覽:
【資料圖】
新聞:近日,頂級(jí)機(jī)器學(xué)習(xí)開(kāi)源庫(kù)Hugging Face分享性能結(jié)果,展示了Habana?Gaudi?2 AI硬件加速器針對(duì)1760億參數(shù)大模型卓越的運(yùn)行推理速度。同時(shí),該結(jié)果亦展現(xiàn)了在Gaudi2服務(wù)器上運(yùn)行主流計(jì)算機(jī)視覺(jué)工作負(fù)載時(shí)的能效優(yōu)勢(shì)。
重要意義:目前,ChatGPT等生成式AI工具正在為整個(gè)行業(yè)帶來(lái)全新的能力,而其模型所需的計(jì)算亦使性能、成本和能效成為眾多企業(yè)關(guān)注的焦點(diǎn)。
縱觀大局:隨著生成式AI模型變得越來(lái)越大,在數(shù)據(jù)預(yù)處理到訓(xùn)練和推理等一系列復(fù)雜的AI負(fù)載功能上,能效成為推動(dòng)生產(chǎn)力的關(guān)鍵因素。開(kāi)發(fā)人員需要一種靈活、開(kāi)放、高能效和更可持續(xù)的解決方案,即“一次構(gòu)建、隨處部署”的方法,使各種形式的AI(包括生成式AI)都能充分發(fā)揮其潛力。
下一步:AI已經(jīng)走過(guò)很長(zhǎng)的一段路,但仍有更多方面有待挖掘。英特爾致力于AI的真正民主化和可持續(xù)性,這將使人們能夠通過(guò)開(kāi)放的生態(tài)系統(tǒng)更廣泛地從該技術(shù),以及生成式AI技術(shù)中獲益。
總結(jié):一個(gè)開(kāi)放的生態(tài)系統(tǒng)讓開(kāi)發(fā)人員能夠利用英特爾對(duì)流行開(kāi)源框架、庫(kù)和工具的優(yōu)化,來(lái)構(gòu)建和部署AI。英特爾AI智能硬件加速器以及第四代英特爾?至強(qiáng)?可擴(kuò)展處理器的內(nèi)置加速器提升了性能和每瓦性能,以滿足生成式AI對(duì)性能、價(jià)格和可持續(xù)性的需求。
生成式AI能夠模仿人類(lèi)生成的內(nèi)容,在改變我們工作和生活方式的諸多方面提供了一個(gè)令人興奮的機(jī)會(huì)。然而,這種快速演進(jìn)的技術(shù)也揭示出,在數(shù)據(jù)中心成功利用AI需要極其復(fù)雜的計(jì)算。
英特爾面向未來(lái)進(jìn)行了大量投資,希望每個(gè)人都能利用這項(xiàng)技術(shù),并能輕松進(jìn)行大規(guī)模部署。同時(shí),英特爾正與產(chǎn)業(yè)伙伴接洽,以支持一個(gè)基于信任、透明和多種選擇的開(kāi)放式AI生態(tài)系統(tǒng)。
擁抱具有卓越性能的開(kāi)源生成式AI
生成式AI例如GPT-3和DALL-E等語(yǔ)言模型已經(jīng)存在一段時(shí)間了,但ChatGPT(一種可以進(jìn)行類(lèi)似人類(lèi)對(duì)話的生成式AI聊天機(jī)器人)則引發(fā)巨大轟動(dòng),讓人們開(kāi)始關(guān)注傳統(tǒng)數(shù)據(jù)中心架構(gòu)的瓶頸。ChatGPT還加快了對(duì)硬件和軟件解決方案的需求,這些解決方案使AI能夠充分發(fā)揮其潛力?;陂_(kāi)放方法和異構(gòu)計(jì)算的生成式AI使其更容易獲得,并更經(jīng)濟(jì)地部署最優(yōu)的解決方案。開(kāi)放生態(tài)系統(tǒng)允許開(kāi)發(fā)人員在優(yōu)先考慮功耗、價(jià)格和性能的同時(shí),隨時(shí)隨地構(gòu)建和部署AI,從而釋放生成式AI的力量。
網(wǎng)絡(luò)研討會(huì):英特爾將舉辦數(shù)據(jù)中心和人工智能事業(yè)部投資者網(wǎng)絡(luò)研討會(huì)
英特爾正在積極采取措施,并通過(guò)優(yōu)化主流的開(kāi)源框架、庫(kù)和工具來(lái)實(shí)現(xiàn)出色的硬件性能,同時(shí)消除復(fù)雜性,來(lái)確保自身是實(shí)現(xiàn)生成式AI的明智選擇。近日,頂級(jí)機(jī)器學(xué)習(xí)開(kāi)源庫(kù)Hugging Face發(fā)布的結(jié)果顯示了英特爾AI硬件加速器卓越的推理運(yùn)行速度,該結(jié)果基于對(duì)包含1760億個(gè)參數(shù)的BLOOMZ模型(一種基于轉(zhuǎn)換器的多語(yǔ)言大型語(yǔ)言模型(LLM)和包含70億參數(shù)的較小BLOOMZ模型進(jìn)行推理。其中,對(duì)于包含70億參數(shù)的較小BLOOMZ模型,Habana?第一代 Gaudi?具有明顯的性?xún)r(jià)比優(yōu)勢(shì)。此外,Hugging Face Optimum Habana庫(kù)簡(jiǎn)化了大型LLM的部署,用戶僅需對(duì)代碼進(jìn)行極小的修改。
英特爾研究院的研究人員還使用Habana Gaudi2在LMentry(一種最近提出的語(yǔ)言模型基準(zhǔn))零次學(xué)習(xí)設(shè)置下評(píng)估BLOOMZ。BLOOMZ的精度與GPT-3模型尺寸相似,如下圖所示,最大的176B BLOOMZ模型的性能優(yōu)于類(lèi)似大小的GPT-3模型。
在100K LMentry提示上,BLOOMZ模型(最多1760億個(gè)參數(shù))使用Habana Gaudi加速器對(duì)生成的語(yǔ)言輸出進(jìn)行的自動(dòng)評(píng)估。1
此外,Hugging Face亦介紹了Stability AI的Stable Diffusion,這是另一個(gè)用于從文本生成圖像的最先進(jìn)生成式AI模型之一,也是流行的?DALL-E圖像生成器的開(kāi)放訪問(wèn)替代方案,Stable Diffusion在內(nèi)置英特爾?高級(jí)矩陣擴(kuò)展(英特爾?AMX)的第四代英特爾至強(qiáng)可擴(kuò)展處理器上運(yùn)行的平均速度提高了3.8倍。這種加速是在不更改任何代碼的情況下實(shí)現(xiàn)的。此外,通過(guò)使用英特爾Extension for PyTorch?with Bfloat16(一種用于機(jī)器學(xué)習(xí)的自定義格式),自動(dòng)混合精度可以再提速一倍,并將延遲減少到5秒——比初始基線32秒快了近6.5倍。用戶可在Hugging Face網(wǎng)站上一個(gè)基于英特爾CPU(第四代至強(qiáng)處理器)的實(shí)驗(yàn)性Stable Diffusion演示中進(jìn)行自行嘗試。
Stability AI創(chuàng)始人兼首席執(zhí)行官Emad Mostaque表示:“在Stability AI,我們希望讓每個(gè)人都能構(gòu)建自己的AI技術(shù)。英特爾已經(jīng)使Stable Diffusion模型能夠高效運(yùn)行在他們的異構(gòu)產(chǎn)品上——從第四代Sapphire Rapids CPU一直到像Gaudi這樣的加速器,因此是實(shí)現(xiàn)AI民主化的一個(gè)絕佳合作伙伴。我們期待在下一代語(yǔ)言、視頻和代碼模型等方面與他們合作?!?/p>
OpenVINO進(jìn)一步加速了Stable Diffusion推理。結(jié)合使用第四代至強(qiáng)CPU,它的速度幾乎比第三代英特爾?至強(qiáng)?可擴(kuò)展CPU提高了2.7倍。Optimum Intel是OpenVINO支持的一個(gè)工具,用于加速英特爾架構(gòu)上的端到端管道,它將平均延遲再降低3.5倍,總共降低近10倍。
解決價(jià)格、性能和效率問(wèn)題
此外,為滿足減少用電量的關(guān)鍵需求及不斷增長(zhǎng)的性能需求,還需要提供更加可持續(xù)的解決方案。一個(gè)開(kāi)放的生態(tài)系統(tǒng)可以消除阻礙進(jìn)步的障礙,使開(kāi)發(fā)人員能夠在每一項(xiàng)工作中都能夠使用最好的硬件和軟件工具進(jìn)行創(chuàng)新。
Gaudi2與第一代Gaudi構(gòu)建在相同的高效架構(gòu)上,可助力大規(guī)模工作負(fù)載的性能和效率達(dá)到全新高度,并在運(yùn)行AI工作負(fù)載時(shí)展現(xiàn)出強(qiáng)大的能效優(yōu)勢(shì)。
大規(guī)模AI工作負(fù)載還需要達(dá)到“一次構(gòu)建、隨處部署”方式,這種方式基于靈活、開(kāi)放的解決方案,能夠?qū)崿F(xiàn)更好的能效。第四代至強(qiáng)處理器是英特爾最具可持續(xù)性的數(shù)據(jù)中心處理器,有著更高的能效和節(jié)能效果。憑借英特爾AMX這樣的內(nèi)置加速器,在廣泛的AI工作負(fù)載和使用案例中,推理和訓(xùn)練性能可提高10倍2,同時(shí)其每瓦性能相較英特爾前代產(chǎn)品最多可提升14倍3。
12023年3月24日進(jìn)行測(cè)量,使用部署于英特爾開(kāi)發(fā)者云上的Habana Gaudi2深度學(xué)習(xí)服務(wù)器,該服務(wù)器采用8個(gè)Gaudi2 HL-225H夾層卡和第三代英特爾至強(qiáng)處理器,運(yùn)行SynapseAI?軟件版本1.8.0,batch_size=1
2 參見(jiàn)intel.com/performanceindex:第四代英特爾至強(qiáng)可擴(kuò)展處理器部分的[A16]及[A17]
3 參見(jiàn)intel.com/processorclaims:第四代英特爾至強(qiáng)可擴(kuò)展處理器,E1
結(jié)果可能不同。
關(guān)于英特爾
英特爾(NASDAQ: INTC)作為行業(yè)引領(lǐng)者,創(chuàng)造改變世界的技術(shù),推動(dòng)全球進(jìn)步并讓生活豐富多彩。在摩爾定律的啟迪下,我們不斷致力于推進(jìn)半導(dǎo)體設(shè)計(jì)與制造,幫助我們的客戶應(yīng)對(duì)最重大的挑戰(zhàn)。通過(guò)將智能融入云、網(wǎng)絡(luò)、邊緣和各種計(jì)算設(shè)備,我們釋放數(shù)據(jù)潛能,助力商業(yè)和社會(huì)變得更美好。如需了解英特爾創(chuàng)新的更多信息,請(qǐng)?jiān)L問(wèn)英特爾中國(guó)新聞中心intel.cn/content/www/cn/zh/newsroom以及官方網(wǎng)站intel.cn。
關(guān)鍵詞:
您可能也感興趣:
今日熱點(diǎn)
為您推薦
機(jī)票里面包含保險(xiǎn)嗎?飛機(jī)保險(xiǎn)有必要買(mǎi)嗎?
遼寧擴(kuò)大緩繳社保費(fèi)政策實(shí)施范圍 補(bǔ)繳期間免收滯納金
更多
- 世界觀察:電池快速充電指南——第1部分
- 每日訊息!英特爾以強(qiáng)大產(chǎn)品力,迎接生成式AI的廣闊機(jī)遇
- 熱點(diǎn)評(píng)!Power Integrations推出LinkSwitch-TNZ可在智能家居...
- 當(dāng)前播報(bào):IAR推出的IAR Embedded Trust實(shí)現(xiàn)了強(qiáng)大的端到端...
- 每日快訊!大疆發(fā)布全新飛行眼鏡及穿越搖桿
- 數(shù)據(jù)存儲(chǔ)創(chuàng)新:節(jié)電、節(jié)水、省空間
- 全球消息!美國(guó)總統(tǒng)拜登視察 Wolfspeed 總部,作為“投資美...
- 環(huán)球熱推薦:J-Squared將在2023年美國(guó)西部國(guó)際安防展上推出與...
更多
- 全球快資訊丨《大空頭》原型:硅谷銀行危機(jī)或許很快就能解除
- 當(dāng)前熱訊:蕪湖宜居投資20億元小公募債券狀態(tài)更新為“已反饋”
- Kaiko:3月份Coinbase的市場(chǎng)深度腰斬,幣安下降13%
- 環(huán)球快資訊:汪濤:2月信貸增速再超預(yù)期
- 世界今日?qǐng)?bào)丨武漢地鐵發(fā)行10億元公司債 票面利率3.38%
- 利率下調(diào)仍受熱捧 年內(nèi)首批儲(chǔ)蓄國(guó)債開(kāi)售即告罄
- 全球滾動(dòng):北京城建集團(tuán)10億短期融資券即將兌付 利率1.76%
- 全球即時(shí):美的置業(yè)9.84億公司債將付年息 票面利率4.20%
排行
- 世界觀察:電池快速充電指南——第1部分
- 科技智庫(kù)需要進(jìn)一步加快智庫(kù)成果轉(zhuǎn)化
- 雄安設(shè)立兩年 290家京企“搶灘登陸”
- 女子拽男友公交車(chē)方向盤(pán)受審 涉嫌危害公共安全罪
- 成都實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略,將挖掘培養(yǎng)高素質(zhì)職工人才
- “人造雪粉”接觸眼睛或被誤食可能有危險(xiǎn)
- 這一年,我們?yōu)榭萍肌俺尺^(guò)的架”真不少
- “四成人不知電商法”該如何破題
- 監(jiān)督搭平臺(tái)信息都上網(wǎng) 打通精準(zhǔn)監(jiān)督‘最后一公里’
- 智能烹飪機(jī),選購(gòu)有講究
最近更新
- 世界觀察:電池快速充電指南——第1部分
- 每日訊息!英特爾以強(qiáng)大產(chǎn)品力,迎接生成式AI的廣闊機(jī)遇
- 博鰲次日,權(quán)威媒體關(guān)注美克生能源,董事長(zhǎng)魏瓊重磅發(fā)聲!
- 貸款不還會(huì)從其他銀行卡扣款嗎?銀行卡限額了還能扣款嗎?
- 10月24日程序員節(jié)圖片_10月24日程序員節(jié)
- 停息掛賬是真的還是假的?第三方法務(wù)協(xié)商延期還款靠譜嗎?
- 套路貸有什么特征?個(gè)人如何防范套路貸?
- 短訊!路由器輻射大怎么回事
- 路由器真的有輻射嗎
- 安慶銀保監(jiān)分局:“143”工作法助節(jié)能環(huán)保產(chǎn)業(yè)“延鏈補(bǔ)鏈強(qiáng)鏈”
- 天天新消息丨留學(xué)美英日,看病就醫(yī)這樣做
- 75%的酒精濕巾可以帶上火車(chē)嗎?
- 熱消息:提高財(cái)產(chǎn)保險(xiǎn)業(yè)風(fēng)險(xiǎn)減量質(zhì)效
- 世界微動(dòng)態(tài)丨【政策解讀】風(fēng)險(xiǎn)減量:風(fēng)物長(zhǎng)宜放眼量
- 全球短訊!城鐵上可以帶75%酒精濕巾嗎?
- 焦點(diǎn)短訊!新冠或流感?傳感器10秒出結(jié)果
- 環(huán)球動(dòng)態(tài):記者手記:做強(qiáng)服務(wù)體系 優(yōu)化發(fā)展生態(tài)
- 高鐵能攜帶一盒20片的酒精濕巾嗎?
- 角膜自體移植首次成功恢復(fù)失明者視力
- 銀保監(jiān)會(huì)精簡(jiǎn)中資商業(yè)銀行行政許可部分申請(qǐng)材料
- 精選!細(xì)菌“注射器”將蛋白輸入人體細(xì)胞
- 熱消息:Layer1 Sui推出永久測(cè)試網(wǎng),可在主網(wǎng)啟動(dòng)后繼續(xù)運(yùn)行
- 熱訊:兩部門(mén)命名首批全國(guó)嬰幼兒照護(hù)服務(wù)示范城市
- Coinbase:已正式禁止YFII、OMG、MIR等資產(chǎn)交易
- 蘇寧銀行微商貸如何辦理?蘇寧銀行的貸款可靠嗎?
- 公積金不夠月供還能辦理公積金貸款嗎?異地公積金貸款月供怎...
- 剛畢業(yè)可以申請(qǐng)貸款嗎?社保貸一般能貸多少錢(qián)?
- 新股申購(gòu)能撤單嗎?新股申購(gòu)一般中簽多少股?
- 新手小白怎么辦理股票開(kāi)戶?股票開(kāi)戶選哪個(gè)券商好?
- 終身重疾險(xiǎn)交滿10年可以退嗎?聰明人必買(mǎi)的三種保險(xiǎn)是什么?
今日要聞
- 博鰲次日,權(quán)威媒體關(guān)注美克生能源,董事長(zhǎng)魏瓊重磅發(fā)聲!
- 世界觀察:電池快速充電指南——第1部分
- 每日訊息!英特爾以強(qiáng)大產(chǎn)品力,迎接生成式AI的廣闊機(jī)遇
- 熱消息:Layer1 Sui推出永久測(cè)試網(wǎng),可在主網(wǎng)啟動(dòng)后繼續(xù)運(yùn)行
- Coinbase:已正式禁止YFII、OMG、MIR等資產(chǎn)交易
- 沙特阿美在華合資煉油石化綜合設(shè)施建設(shè)正式開(kāi)工
- 2023中國(guó)(溫州)預(yù)制菜產(chǎn)業(yè)大會(huì)將于3月31日在溫州舉辦!
- 36氪2022財(cái)年實(shí)現(xiàn)IPO后首次全年盈利,應(yīng)用AIGC技術(shù)大幅提升內(nèi)容生產(chǎn)效率和用戶互動(dòng)
- 肆拾玖坊孔雀令,一款適合女性的茅臺(tái)鎮(zhèn)醬香白酒!
- 環(huán)球聚焦:Lido將于8月1日停止在Polkadot、Kusama上的質(zhì)押計(jì)劃