重塑未來!訊飛星火領(lǐng)跑國(guó)產(chǎn)大模型?
互聯(lián)網(wǎng)曾經(jīng)近乎重寫了所有行業(yè),通訊、購(gòu)物、支付、打車、點(diǎn)餐等等,人們生活的方方面面幾乎被重塑。
如今大模型再次給予人們充分的想象空間。
第一財(cái)經(jīng)提到,從樂觀的角度來看,ChatGPT可以取代一些重復(fù)性較強(qiáng)、規(guī)律性較為單一的工作,但同時(shí)它也可以釋放出更多的生產(chǎn)力,讓人們關(guān)注更有想象力、情感、思辨性的部分,并催生出AI提示工程師、AI調(diào)教師、AI創(chuàng)意師等一批新興職業(yè)。
【資料圖】
簡(jiǎn)單來說,大模型相當(dāng)于一個(gè)全新的系統(tǒng),這個(gè)全新的系統(tǒng)可以大幅降低很多行業(yè)的門檻,未來也會(huì)有很多產(chǎn)品構(gòu)建需要用到大模型,而人們的創(chuàng)造性勞動(dòng),將通過這個(gè)全新的系統(tǒng)得到大幅釋放。
根據(jù)中國(guó)科學(xué)技術(shù)信息研究所的不完全統(tǒng)計(jì),目前國(guó)內(nèi)已經(jīng)發(fā)布了70多個(gè)大模型,不少產(chǎn)品都展現(xiàn)出了驚人的爆發(fā)力。
拿科大訊飛來說,基于訊飛星火認(rèn)知大模型研發(fā)的功能落地學(xué)習(xí)機(jī)、辦公本等產(chǎn)品之后,科大訊飛今年再次突破高增速,618銷售額同比增長(zhǎng)125%,并在多個(gè)品類中摘獲銷售額冠軍。
這一點(diǎn),同樣體現(xiàn)在資本市場(chǎng)。6月20日,AI概念股表現(xiàn)搶眼,科大訊飛漲近7%,復(fù)權(quán)股價(jià)同樣創(chuàng)歷史新高??拼笥嶏w成交102億元,在兩市居首。
剛好筆者可以使用訊飛星火大模型了,最近也看到了不少有趣的測(cè)試,我們就一起看看現(xiàn)在的AI大模型發(fā)展到什么程度了。
1、錯(cuò)別字識(shí)別哪家強(qiáng)
高考作文想必大家都看膩了,前陣子看到《智商稅研究中心》的這篇校對(duì)測(cè)評(píng)的設(shè)問還挺特別。
篇幅有限,拎出幾個(gè)比較能拉開差距的問題,來跟大家一起分享看看。
首先是字詞方面。
“洛陽(yáng)親友如相問,就說我在岳陽(yáng)樓?!睂ⅰ跋鄦枴卞e(cuò)拼成“翔問”,考驗(yàn)一下各家大模型的基本功。
訊飛星火:
文心一言:
通義千問:
360智腦:
GPT4:
訊飛星火、文心一言、通義千問、GPT4都順利完成基礎(chǔ)的校對(duì),只有360智腦,追問之下仍表示無(wú)誤。
再來看語(yǔ)病方面。
校對(duì)語(yǔ)病的例子中整體表現(xiàn)不佳,不過讓AI直接識(shí)別判斷是否有歧義,還是能看出一點(diǎn)國(guó)產(chǎn)AI大模型之間的差距。
例如,“這句話有歧義嗎:在床上‘葛優(yōu)癱’了一天,他突然想起來了?!?/p>
訊飛星火:
文心一言:
通義千問:
360智腦:
GPT4:
這里雖然幾乎全軍覆沒,不過訊飛星火還是指出了“可能存在一些解讀上的歧義”,一直表現(xiàn)不錯(cuò)的GPT4沒能看出歧義還是有點(diǎn)意外。
最后看下指正校對(duì)錯(cuò)誤后,AI大模型能否承認(rèn)錯(cuò)誤接受指正。
訊飛星火:
文心一言:
通義千問:
360智腦:
GPT4:
這部分訊飛星火意外地跟GPT4表現(xiàn)得旗鼓相當(dāng),反應(yīng)迅速,簡(jiǎn)潔明了,承認(rèn)錯(cuò)誤后直接給出了校對(duì)后的句子;文心一言還要再進(jìn)一步給出指令才會(huì)給出答案;而通義千問和360智腦則是“積極認(rèn)錯(cuò),堅(jiān)決不改”。
校對(duì)文本錯(cuò)誤在某種層面上,反映了大模型的基礎(chǔ)能力,地基打好了,才能有更多上探的空間。
總體來說,在基礎(chǔ)的校對(duì)能力上,訊飛星火算是國(guó)產(chǎn)大模型中最接近GPT4水平的;其他表現(xiàn)也中規(guī)中矩;至于360智腦,用360掌門人周鴻祎在360首發(fā)時(shí)的話來說,360智腦還只是個(gè)“孩子”,距離完善使用還有相當(dāng)?shù)囊欢温芬摺?/p>
2、“數(shù)學(xué)高手”
寒窗苦讀十余年,無(wú)論教育制度怎么改,除了語(yǔ)文,還有一個(gè)怎么也躲不掉的,就是數(shù)學(xué)。
數(shù)學(xué)的重要性不言而喻,它培養(yǎng)了我們的邏輯思維能力。但相對(duì)于大模型擅長(zhǎng)的文本內(nèi)容,數(shù)學(xué)能力在一定程度上算是大模型的弱項(xiàng)
不過上個(gè)月才出的訊飛星火意外地表現(xiàn)有些驚喜。
訊飛星火首發(fā)后,知名科技行業(yè)觀察者《差評(píng)》,就曾對(duì)訊飛星火作出過全面測(cè)評(píng),在數(shù)學(xué)測(cè)驗(yàn)部分,也展示了訊飛星火基礎(chǔ)的數(shù)學(xué)能力,全部答對(duì)毫無(wú)壓力。
經(jīng)典的雞兔同籠問題,即使變換參數(shù)和問法也能全部答對(duì)。
用《差評(píng)》文中的話來說,訊飛星火做數(shù)學(xué)題,有一種過于強(qiáng)大,可以和GPT4掰掰手腕的感覺。
這種感覺,將國(guó)產(chǎn)大模型的回答都放一起后則更加強(qiáng)烈。
《科創(chuàng)板日?qǐng)?bào)》就曾在一篇文章中,對(duì)文心一言、科大訊飛、360智腦幾家比較有代表性的大模型進(jìn)行測(cè)評(píng)展示。
例如,“某次數(shù)學(xué)競(jìng)賽共20道題,評(píng)分標(biāo)準(zhǔn)是:每做對(duì)一題得5分,每做錯(cuò)或不做一題扣1分。小華參加了這次競(jìng)賽,得了64分。問:小華做對(duì)幾道題?”
正確答案應(yīng)該是14題,我們看一下各家大模型的作答。
文心一言:
360智腦:
訊飛星火:
可以看到只有訊飛星火答對(duì)了,文中展示的另一道小升初數(shù)學(xué)題,同樣也只有訊飛星火答對(duì)。
《科創(chuàng)板日版》在文章開頭也指出,科大訊飛星火認(rèn)知在數(shù)理能力表現(xiàn)尤為突出。
那到底能突出到什么程度呢?
我們繼續(xù)對(duì)訊飛星火加大難度看看。
大模型在數(shù)學(xué)領(lǐng)域的表現(xiàn)有著見微知著的效果,因?yàn)檫@需要結(jié)合大語(yǔ)言模型和計(jì)算引擎兩者的能力。在復(fù)雜邏輯條件下,學(xué)習(xí)多步驟推理,這對(duì)計(jì)算資源和數(shù)據(jù),有著海量需求,對(duì)算力也有著極高的要求。
訊飛星火在數(shù)學(xué)方面能力的展示,更是一家企業(yè)數(shù)據(jù)資源和算力水平的展示。對(duì)于國(guó)產(chǎn)大模型來說,數(shù)學(xué)能力是意義非常的。
不過,大模型不是一朝一夕就能訓(xùn)練完成的,如何落地?能不能落地?也是企業(yè)需要考慮的。
3、落地前景
大模型的出現(xiàn)注定是要破舊立新的,技術(shù)的發(fā)展回歸到現(xiàn)實(shí)生活中,還是要看它的實(shí)際應(yīng)用能力。
《娛樂資本論》做過一期市面上主流的5款大模型,一共90個(gè)回答的橫評(píng),想必耗費(fèi)了不少時(shí)間精力,整體評(píng)價(jià)也是比較中肯的,頗具參考意義。
可以先看一下這張最終測(cè)試評(píng)分表。
大模型這種屬于比較底層的框架,我們勢(shì)必要做出自己的由中文語(yǔ)料訓(xùn)練而成的大模型。所以我們不可避免地會(huì)與ChatGPT相比較。
從上圖來看,目前在落地應(yīng)用方面,訊飛星火在主流國(guó)產(chǎn)大模型中,離ChatGPT是最近的。
具體到案例中,我們截取小紅書帶貨的商業(yè)文案來看一下。
文案較長(zhǎng),內(nèi)容有所折疊,不過總的來說,文中展示的兩個(gè)作答還是比較貼切的。
星火自設(shè)了一款手機(jī)型號(hào)進(jìn)行更準(zhǔn)確的數(shù)據(jù)呈現(xiàn),內(nèi)容和邏輯這種長(zhǎng)處不作過多分析,主要拉開差距的地方還是要求中的emoji表情。
相較于文心一言和天工未能察覺出需要在文案和題中帶有emoji表情,星火的emoji甚至還有關(guān)聯(lián)性,直接拿去發(fā)小紅書基本也足夠了。
《TMT時(shí)報(bào)》的記者也對(duì)文心一言、通義千問、訊飛星火的商業(yè)文案能力做過測(cè)試。
文心一言:
通義千問:
訊飛星火:
文心一言雖然洋洋灑灑寫了不少,不過作為海報(bào)文案還需再精簡(jiǎn)一番;通義千問整體表現(xiàn)不錯(cuò),不過相對(duì)更側(cè)重中秋,而失了商業(yè)主體的主導(dǎo)作用;訊飛星火完成度依舊出色,也更突出所設(shè)定的AI醫(yī)療公司的保護(hù)健康的作用,是可以直接拿來使用的程度。
其實(shí)訊飛星火在落地應(yīng)用方面,還做出了不小的嘗試。
訊飛星火升級(jí)到V1.5版本后,新增了星火助手功能,人手一個(gè)賈維斯不再是幻想。
目前經(jīng)審核上傳的星火助手多達(dá)500多個(gè),遍及各個(gè)行業(yè)和細(xì)分領(lǐng)域,還支持自己創(chuàng)建,并不斷調(diào)試出符合自己需求的專屬小助理。
除了我們比較能想象到的日常辦公,筆者對(duì)其中的腦暴部分更加感興趣,比如這個(gè)“小說靈感記錄員”。
從動(dòng)物社會(huì)結(jié)構(gòu),到智慧與力量的平衡,再到文化傳承等等,這對(duì)創(chuàng)作類相關(guān)行業(yè)的增益可想而知。
星火助手發(fā)布時(shí)間還并不長(zhǎng),整體來看,仍有不少需要調(diào)試改進(jìn)的地方。
不過,隨著時(shí)間的推移,星火助手在落地能力以及前景等方面已經(jīng)展示出了相當(dāng)?shù)臐摿Α?/strong>
4、尾聲
中國(guó)科學(xué)技術(shù)信息研究所發(fā)布的一份報(bào)告顯示,從全球已經(jīng)發(fā)布的大模型分布來看,在大模型數(shù)量上,中國(guó)和美國(guó)超過全球總數(shù)的80%,中國(guó)從2020年進(jìn)入大模型快速發(fā)展期,目前與美國(guó)保持同步增長(zhǎng)態(tài)勢(shì)。
除了大模型,應(yīng)用端也呈現(xiàn)出爆發(fā)式增長(zhǎng)的態(tài)勢(shì)。
中國(guó)經(jīng)營(yíng)報(bào)在3月的一篇文中提到,天眼查數(shù)據(jù)顯示,截至當(dāng)時(shí),人工智能相關(guān)企業(yè)258.8萬(wàn)余家,其中,2022年新增注冊(cè)企業(yè)73.2萬(wàn)余家,新增注冊(cè)企業(yè)增速41.5%;近三年(2020~2022年)人工智能相關(guān)企業(yè)新增注冊(cè)企業(yè)增速均超過40%。
大模型以及大模型相關(guān)的企業(yè),正在如雨后春筍般涌現(xiàn)。
時(shí)代的機(jī)遇下,作為國(guó)產(chǎn)大模型的重要代表之一,訊飛星火也已經(jīng)隱隱有了燎原之勢(shì)。
關(guān)鍵詞:
您可能也感興趣:
今日熱點(diǎn)
為您推薦
全球球精選!鹽田港:子公司深汕運(yùn)營(yíng)公司經(jīng)營(yíng)的小漠港已逐步開展汽車整車滾裝業(yè)務(wù)
《陰陽(yáng)師》共赴尋森之涂活動(dòng)獎(jiǎng)勵(lì)介紹
新華人壽原董事長(zhǎng)萬(wàn)峰被開除黨籍:靠金融吃金融,收受巨額財(cái)物|世界播報(bào)
更多
- 公共場(chǎng)所英文標(biāo)識(shí)出現(xiàn)謬誤?廣州市民可來糾錯(cuò)贏好禮! 天天...
- 全球微資訊!特銳德:公司充電業(yè)務(wù)有一定的海外布局,但目前...
- 美國(guó)環(huán)保署(EPA)
- 原神|稻妻角色 花見坂的煙花工匠——宵宮(2) By:伽碼鹽澤...
- 半導(dǎo)體板塊跌3.07% 晶賽科技漲29.97%居首 環(huán)球聚看點(diǎn)
- 中央氣象臺(tái)6月21日18時(shí)發(fā)布高溫黃色預(yù)警-全球快資訊
- 微信帳單明細(xì)怎么刪除 微信帳單明細(xì)刪除時(shí)有個(gè)人臉識(shí)別怎樣去除
- 中國(guó)科學(xué)院連續(xù)十一年位列自然指數(shù)全球首位_今日聚焦
排行
- 環(huán)球快資訊丨【妙益科技參評(píng)】維科杯·OFweek 2023年度儲(chǔ)能...
- 凱德華北區(qū)與菜百股份將在開店拓展等多方面達(dá)成合作
- 前三季度商業(yè)地產(chǎn)租賃需求創(chuàng)新高,存量地產(chǎn)價(jià)值提升空間廣闊
- 零氪科技暫停赴美IPO,上市計(jì)劃被延期
- 永定門電烤串完成近千萬(wàn)元天使輪融資
- 廈門市黑色金屬產(chǎn)業(yè)招商又節(jié)碩果 金馬能源新項(xiàng)目落戶
- 東方雨虹上半年歸屬凈利潤(rùn)約14.81億元-15.90億元
- 格林酒店一季度經(jīng)營(yíng)利潤(rùn)為6139萬(wàn)元,同比增長(zhǎng)64.9%
- 愛立信正進(jìn)一步加大在中國(guó)本土研發(fā)的投入 推動(dòng)5G技術(shù)創(chuàng)新
- 途虎養(yǎng)車與德國(guó)馬牌簽署戰(zhàn)略合作協(xié)議
最近更新
- 重塑未來!訊飛星火領(lǐng)跑國(guó)產(chǎn)大模型?
- 大型無(wú)人機(jī)FH-98國(guó)內(nèi)首次夜航轉(zhuǎn)場(chǎng)成功
- 環(huán)球短訊!《好運(yùn)設(shè)計(jì)》的學(xué)與思
- 我國(guó)最大海上油田累計(jì)生產(chǎn)原油突破5億噸
- 人工智能賦能千行百業(yè) 領(lǐng)航數(shù)字生產(chǎn)力躍升蝶變_焦點(diǎn)快看
- 世界快報(bào):近30名外籍友人參訪呼和浩特:民眾熱情,喜歡這座城市
- 市十六屆人大常委會(huì)第十三次會(huì)議閉會(huì)-全球聚看點(diǎn)
- 承載式車身,三個(gè)版本可選,入門級(jí)轎卡Rampage正式發(fā)布
- 信息:這一新技術(shù),讓飛行模擬機(jī)代際升級(jí)!讓更多智慧“照進(jìn)...
- 全新一代凌云官圖發(fā)布!樹立中級(jí)性能SUV價(jià)值新標(biāo)桿|全球快訊
- 注意!21日至25日湘中湘南有持續(xù)性暴雨大暴雨 前沿?zé)狳c(diǎn)
- 每日視訊:房貸降息后以前的貸款跟著降嗎?一文簡(jiǎn)單探討房貸...
- 【全球快播報(bào)】“千萬(wàn)工程”調(diào)研行丨扮靚海上花園 煥發(fā)發(fā)展...
- 公共場(chǎng)所英文標(biāo)識(shí)出現(xiàn)謬誤?廣州市民可來糾錯(cuò)贏好禮! 天天...
- 招生錄取批次如何劃分?廣東省教育考試院詳解
- 最新:赴一場(chǎng)美食盛宴 找一段城市記憶 寶雞市渭濱區(qū)新民巷...
- 夏天梨形身材姑娘怎么穿?這幾款單品可以買起來,既遮腿粗還涼快
- 2023年端午檔大片云集,你最“粽”意哪一部?|每日熱門
- 溫州發(fā)布雷電黃色和暴雨橙色預(yù)警!接下來的端午假期……
- “千萬(wàn)工程”調(diào)研行丨扮靚海上花園 煥發(fā)發(fā)展活力——浙江溫...
- 天天熱文:中國(guó)天眼FAST發(fā)現(xiàn)軌道周期最短脈沖星系統(tǒng) 為經(jīng)典...
- 羅馬諾:阿森納接近簽下哈弗茨,球員轉(zhuǎn)會(huì)費(fèi)總額6500萬(wàn)鎊
- 熱門:《秀我中國(guó) | 新時(shí)代中國(guó)鄉(xiāng)村志(第四集):千年梯田...
- “中國(guó)天眼”發(fā)現(xiàn)軌道周期最短的脈沖星雙星系統(tǒng)
- 北部戰(zhàn)區(qū)空軍某臺(tái)站:差異化訓(xùn)練攻克體能短板_天天快消息
- 全球球精選!鹽田港:子公司深汕運(yùn)營(yíng)公司經(jīng)營(yíng)的小漠港已逐步...
- 分享酥皮月餅的做法及配方 ,我這樣做酥皮月餅(輕糖輕油)...
- 萬(wàn)科企業(yè)(02202.HK):王蘊(yùn)獲選舉為職工代表董事
- 昆工科技(831152):與云之端網(wǎng)絡(luò)(江蘇)股份有限公司簽訂戰(zhàn)略...
- 邱禮濤編劇《獵金之旅》正式立項(xiàng) 聚焦金融行業(yè) 新資訊
今日要聞
- 公共場(chǎng)所英文標(biāo)識(shí)出現(xiàn)謬誤?廣州市民可來糾錯(cuò)贏好禮! 天天最資訊
- 全球看點(diǎn):東阿阿膠因未按時(shí)履行法律義務(wù)被強(qiáng)制執(zhí)行1041萬(wàn) 一季度末賬上現(xiàn)金60億
- 世界快報(bào):近30名外籍友人參訪呼和浩特:民眾熱情,喜歡這座城市
- “酷暑經(jīng)濟(jì)”帶熱國(guó)產(chǎn)汽水,高毛利能否夾縫求生-環(huán)球滾動(dòng)
- 貴陽(yáng)高新區(qū):知識(shí)產(chǎn)權(quán)服務(wù)進(jìn)企業(yè)?“面對(duì)面”紓困解難促發(fā)展|每日速訊
- 去美國(guó)的機(jī)票大約多少錢_去美國(guó)機(jī)票一般多少錢
- 杭州高新區(qū)(濱江)AIGC發(fā)展論壇舉行
- 觀察:西部(重慶)科學(xué)城簽約重點(diǎn)招商項(xiàng)目14個(gè)??合同投資額227億元
- 全新一代凌云官圖發(fā)布!樹立中級(jí)性能SUV價(jià)值新標(biāo)桿|全球快訊
- 環(huán)球短訊!煙臺(tái)高新區(qū)2家企業(yè)入選山東省“一企一技術(shù)”研發(fā)中心