浪潮發(fā)布高性能分布式存儲平臺AS15000G7,加速AI產(chǎn)業(yè)化變革
突破數(shù)據(jù)瓶頸,浪潮高性能存儲平臺加速產(chǎn)業(yè)數(shù)智化變革
(相關(guān)資料圖)
當(dāng)前,AIGC技術(shù)的爆發(fā),讓產(chǎn)業(yè)智能化和智能產(chǎn)業(yè)化進入高速發(fā)展期,數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素,正在成為這輪全球增長和科技創(chuàng)新的引擎。近日,浪潮參加由百易傳媒舉辦的2023全球閃存峰會,并在會上重磅發(fā)布高性能分布式存儲平臺AS15000G7,以在性能、管理、融合和效率方面追求極致的智慧存儲新品,構(gòu)筑智慧世界基石,推進AI產(chǎn)業(yè)化變革。
AI大模型對數(shù)據(jù)存儲產(chǎn)業(yè)帶來的機遇與挑戰(zhàn)
AIGC是當(dāng)前通用人工智能產(chǎn)業(yè)發(fā)展創(chuàng)新的核心技術(shù),其具備強大的認(rèn)知智能,在搜索引擎、藝術(shù)創(chuàng)作、影音游戲,以及金融、教育、醫(yī)療、工業(yè)等領(lǐng)域有著廣闊的應(yīng)用前景。Gartner預(yù)測,到2023年將有20%的內(nèi)容被AIGC所創(chuàng)建;到2025 年人工智能生成數(shù)據(jù)占比將達到10%。據(jù)分析師預(yù)測,到2032年,生成式AI市場規(guī)模將達到2,000億美元,占據(jù)人工智能支出總額的約20%,明顯高出當(dāng)前的5%。換言之,未來十年市場規(guī)??赡苊績赡昃蜁环?。
AIGC的爆發(fā),源自于大模型的逐漸成熟,大模型成熟的先決條件是大規(guī)模高質(zhì)量的數(shù)據(jù)、強大的算力和成熟優(yōu)化的算法,而其中,數(shù)據(jù)質(zhì)量和數(shù)量決定了算法的效果和性能。隨著參數(shù)量和數(shù)據(jù)量的極速膨脹,數(shù)據(jù)存儲與管理正在成為制約AIGC產(chǎn)業(yè)發(fā)展的瓶頸:一是要支撐基于海量多元異構(gòu)數(shù)據(jù)的歸集、標(biāo)注、訓(xùn)練、推理和歸檔全生命周期管理;二是要承載AIGC數(shù)據(jù)訓(xùn)練推理時的高性能、低延時、大容量、易擴展、自由流動的嚴(yán)苛需求。大模型訓(xùn)練數(shù)據(jù)多元、數(shù)據(jù)作業(yè)流程長、多態(tài)大模型數(shù)據(jù)量持續(xù)增長、多模計算大模型性能要求高,對當(dāng)前AI數(shù)據(jù)存儲基礎(chǔ)設(shè)施提出了新挑戰(zhàn):
數(shù)據(jù)歸集與準(zhǔn)備:大模型的數(shù)據(jù)包括從互聯(lián)網(wǎng)及數(shù)字圖書館上收集的海量文本型數(shù)據(jù),以及多渠道獲取的圖片型和視頻型數(shù)據(jù),對這些多元異構(gòu)海量數(shù)據(jù)預(yù)處理后才能用于大模型訓(xùn)練,在此作業(yè)流程中數(shù)據(jù)的搬運和加載,要去存儲系統(tǒng)多協(xié)議互訪互通,存儲成為應(yīng)用平臺的關(guān)鍵瓶頸;
數(shù)據(jù)訓(xùn)練:大模型海量多元異構(gòu)數(shù)據(jù)的訓(xùn)練,通常采用將數(shù)據(jù)加載到成百上千個節(jié)點內(nèi)存中并行計算的方法,此過程中頻繁地從數(shù)據(jù)集取Token,每個Token一般4字節(jié),實時高并發(fā)小IO性能需要極低的延遲,對數(shù)據(jù)存儲系統(tǒng)的吞吐性能提出了嚴(yán)苛的要求;
數(shù)據(jù)推理:機器學(xué)習(xí)大模型要求頻繁的參數(shù)調(diào)優(yōu),當(dāng)服務(wù)器故障、網(wǎng)絡(luò)故障造成節(jié)點中斷時,需要數(shù)據(jù)存儲提供高帶寬,確保Checkpoint機制可以快速訪問數(shù)據(jù),使數(shù)據(jù)能夠重新加載,訓(xùn)練能夠快速恢復(fù);
數(shù)據(jù)歸檔:越多的數(shù)據(jù)投喂結(jié)果越精準(zhǔn)的工作原理,決定了大模型訓(xùn)練存在深度學(xué)習(xí)網(wǎng)絡(luò)層數(shù)多、連接多、參數(shù)和數(shù)據(jù)集種類復(fù)雜、數(shù)據(jù)量大的特征,大模型訓(xùn)練過程中快速迭代,產(chǎn)生大量訓(xùn)練數(shù)據(jù)和人工標(biāo)注數(shù)據(jù),對這些資產(chǎn)高效存儲與管理,且最大化數(shù)據(jù)基礎(chǔ)設(shè)施投資回報比,成為數(shù)據(jù)基礎(chǔ)設(shè)施廠商必須解決的問題。
浪潮高性能分布式存儲平臺AS15000G7
產(chǎn)業(yè)發(fā)展的根本在于科技創(chuàng)新。浪潮作為最早布局AI產(chǎn)業(yè)的企業(yè)之一,圍繞智算中心業(yè)務(wù)布局,打造了算力、算法、數(shù)據(jù)全棧解決方案。在數(shù)據(jù)存儲領(lǐng)域,浪潮秉承"存儲即平臺"的產(chǎn)品理念,準(zhǔn)確識別客戶痛點積極布局面向AIGC應(yīng)用場景的數(shù)據(jù)全生命周期存儲解決方案,并基于業(yè)界對大模型訓(xùn)練的數(shù)據(jù)存儲在性能、管理、融合和效率方面更極致的需求,重磅發(fā)布高性能分布式存儲AS15000G7平臺,助力AIGC在金融、教育、醫(yī)療等領(lǐng)域突破海量多元異構(gòu)數(shù)據(jù)存力瓶頸,加速釋放數(shù)據(jù)價值。
關(guān)鍵詞:
您可能也感興趣:
今日熱點
為您推薦
惡性犯罪事件頻發(fā),韓國治安形勢惡化引發(fā)民眾擔(dān)憂
南方航空2023年上半年凈利-28.75億 虧損減少74.97%
劉麗亞:敬老院里的“好閨女”
排行
最近更新
- 浪潮發(fā)布高性能分布式存儲平臺AS15000G7,加速AI產(chǎn)業(yè)化變革
- “投降式睡姿”健康隱患多?
- Gitee DevOps與KeyarchOS完成浪潮信息澎湃技術(shù)認(rèn)證
- 新概念英語第一冊基礎(chǔ)語法:主語從句的用法
- 喜出望外的情景寫一段話(喜出望外)
- 夏天來臨,你也在為副乳而煩惱嗎?
- 黃金策略:黃金多空乃在拉鋸,黃金任然再選擇方向,晚間策略1...
- 投資超2.5億元!安徽晶凱年產(chǎn)50萬噸光伏石英砂+1萬噸高純砂項...
- 了解格式合同的重要表現(xiàn),做聰明租房人?
- 2023上海西虹橋商務(wù)開發(fā)有限公司自主招聘擬錄用名單公示
- 吃濕米粉要注意 高溫潮濕易生毒
- 設(shè)立210億元產(chǎn)業(yè)創(chuàng)新引導(dǎo)基金?廣西柳州加快建設(shè)國際新能源汽...
- 此次開售的華為Mate60 Pro或支持5G 已有人實測網(wǎng)速
- 四川省阿壩藏族羌族自治州小金縣2023-08-31 07:56發(fā)布暴雨藍色預(yù)警
- 天音控股2023上半年營收同比增長29.83% 主營業(yè)務(wù)穩(wěn)健發(fā)展
- 軟通動力:連續(xù)3日融資凈買入累計1966萬元(08-30)
- “健康”冰箱,名副其實嗎?
- 蘇文電能:融資凈買入841.89萬元,融資余額9499.65萬元(08-30)
- 2023成都車展進行時:車企忙銷售沖刺全年銷量目標(biāo)
- 辦公室什么花招財
- 筆記本顯卡長什么樣
- 荔枝過量食用易患“荔枝病”
- 皮格馬利翁賣花女結(jié)局(皮格馬利翁賣花女)
- 今日陳數(shù)主演的電視劇有哪些電視?。悢?shù)主演的電視劇有哪些)
- 48歲樂嘉被傳三婚三離,首次發(fā)聲正式辟謠,曝光3個孩子真實身世
- 阿迪達斯nba籃球系列 adidas nba
- 年中業(yè)績發(fā)布會上,四大行管理層回應(yīng)存量房貸利率等熱點
- 9月13日,蘋果發(fā)布會倒計時:iPhone 15系列售價透露
- 多家半導(dǎo)體封測企業(yè)二季度業(yè)績回暖 加速布局先進封裝技術(shù)
- 上升摩羯-下降巨蟹
今日要聞
- 皮格馬利翁賣花女結(jié)局(皮格馬利翁賣花女)
- Gitee DevOps與KeyarchOS完成浪潮信息澎湃技術(shù)認(rèn)證
- 文心一言率先全面開放 APP已上線各大應(yīng)用商店
- 浪潮發(fā)布高性能分布式存儲平臺AS15000G7,加速AI產(chǎn)業(yè)化變革
- 旅俄大熊貓丁丁生寶寶啦
- 華潤萬象生活上半年收入67.93億港元 股東應(yīng)占溢利同比增長36.5%
- “零元購”重創(chuàng)美國零售商
- 投資超2.5億元!安徽晶凱年產(chǎn)50萬噸光伏石英砂+1萬噸高純砂項目落戶安徽蕪湖
- 質(zhì)量效應(yīng)2dlc破解補丁_質(zhì)量效應(yīng)2dlc破解
- 我國首個萬噸級光伏綠氫示范項目全面建成投產(chǎn)