夜先锋av资源网站,国产精品极品美女在线观看免,欧美亚洲精品电影在线观看,日韩在线精品强乱一区二区三区

首頁(yè) 商業(yè) > 正文

重塑未來!訊飛星火領(lǐng)跑國(guó)產(chǎn)大模型?

互聯(lián)網(wǎng)曾經(jīng)近乎重寫了所有行業(yè),通訊、購(gòu)物、支付、打車、點(diǎn)餐等等,人們生活的方方面面幾乎被重塑。

如今大模型再次給予人們充分的想象空間。

第一財(cái)經(jīng)提到,從樂觀的角度來看,ChatGPT可以取代一些重復(fù)性較強(qiáng)、規(guī)律性較為單一的工作,但同時(shí)它也可以釋放出更多的生產(chǎn)力,讓人們關(guān)注更有想象力、情感、思辨性的部分,并催生出AI提示工程師、AI調(diào)教師、AI創(chuàng)意師等一批新興職業(yè)。


【資料圖】

簡(jiǎn)單來說,大模型相當(dāng)于一個(gè)全新的系統(tǒng),這個(gè)全新的系統(tǒng)可以大幅降低很多行業(yè)的門檻,未來也會(huì)有很多產(chǎn)品構(gòu)建需要用到大模型,而人們的創(chuàng)造性勞動(dòng),將通過這個(gè)全新的系統(tǒng)得到大幅釋放。

根據(jù)中國(guó)科學(xué)技術(shù)信息研究所的不完全統(tǒng)計(jì),目前國(guó)內(nèi)已經(jīng)發(fā)布了70多個(gè)大模型,不少產(chǎn)品都展現(xiàn)出了驚人的爆發(fā)力。

拿科大訊飛來說,基于訊飛星火認(rèn)知大模型研發(fā)的功能落地學(xué)習(xí)機(jī)、辦公本等產(chǎn)品之后,科大訊飛今年再次突破高增速,618銷售額同比增長(zhǎng)125%,并在多個(gè)品類中摘獲銷售額冠軍。

這一點(diǎn),同樣體現(xiàn)在資本市場(chǎng)。6月20日,AI概念股表現(xiàn)搶眼,科大訊飛漲近7%,復(fù)權(quán)股價(jià)同樣創(chuàng)歷史新高??拼笥嶏w成交102億元,在兩市居首。

剛好筆者可以使用訊飛星火大模型了,最近也看到了不少有趣的測(cè)試,我們就一起看看現(xiàn)在的AI大模型發(fā)展到什么程度了。

1、錯(cuò)別字識(shí)別哪家強(qiáng)

高考作文想必大家都看膩了,前陣子看到《智商稅研究中心》的這篇校對(duì)測(cè)評(píng)的設(shè)問還挺特別。

篇幅有限,拎出幾個(gè)比較能拉開差距的問題,來跟大家一起分享看看。

首先是字詞方面。

“洛陽(yáng)親友如相問,就說我在岳陽(yáng)樓?!睂ⅰ跋鄦枴卞e(cuò)拼成“翔問”,考驗(yàn)一下各家大模型的基本功。

訊飛星火:

文心一言:

通義千問:

360智腦:

GPT4:

訊飛星火、文心一言、通義千問、GPT4都順利完成基礎(chǔ)的校對(duì),只有360智腦,追問之下仍表示無(wú)誤。

再來看語(yǔ)病方面。

校對(duì)語(yǔ)病的例子中整體表現(xiàn)不佳,不過讓AI直接識(shí)別判斷是否有歧義,還是能看出一點(diǎn)國(guó)產(chǎn)AI大模型之間的差距。

例如,“這句話有歧義嗎:在床上‘葛優(yōu)癱’了一天,他突然想起來了?!?/p>

訊飛星火:

文心一言:

通義千問:

360智腦:

GPT4:

這里雖然幾乎全軍覆沒,不過訊飛星火還是指出了“可能存在一些解讀上的歧義”,一直表現(xiàn)不錯(cuò)的GPT4沒能看出歧義還是有點(diǎn)意外。

最后看下指正校對(duì)錯(cuò)誤后,AI大模型能否承認(rèn)錯(cuò)誤接受指正。

訊飛星火:

文心一言:

通義千問:

360智腦:

GPT4:

這部分訊飛星火意外地跟GPT4表現(xiàn)得旗鼓相當(dāng),反應(yīng)迅速,簡(jiǎn)潔明了,承認(rèn)錯(cuò)誤后直接給出了校對(duì)后的句子;文心一言還要再進(jìn)一步給出指令才會(huì)給出答案;而通義千問和360智腦則是“積極認(rèn)錯(cuò),堅(jiān)決不改”。

校對(duì)文本錯(cuò)誤在某種層面上,反映了大模型的基礎(chǔ)能力,地基打好了,才能有更多上探的空間。

總體來說,在基礎(chǔ)的校對(duì)能力上,訊飛星火算是國(guó)產(chǎn)大模型中最接近GPT4水平的;其他表現(xiàn)也中規(guī)中矩;至于360智腦,用360掌門人周鴻祎在360首發(fā)時(shí)的話來說,360智腦還只是個(gè)“孩子”,距離完善使用還有相當(dāng)?shù)囊欢温芬摺?/p>

2、“數(shù)學(xué)高手”

寒窗苦讀十余年,無(wú)論教育制度怎么改,除了語(yǔ)文,還有一個(gè)怎么也躲不掉的,就是數(shù)學(xué)。

數(shù)學(xué)的重要性不言而喻,它培養(yǎng)了我們的邏輯思維能力。但相對(duì)于大模型擅長(zhǎng)的文本內(nèi)容,數(shù)學(xué)能力在一定程度上算是大模型的弱項(xiàng)

不過上個(gè)月才出的訊飛星火意外地表現(xiàn)有些驚喜。

訊飛星火首發(fā)后,知名科技行業(yè)觀察者《差評(píng)》,就曾對(duì)訊飛星火作出過全面測(cè)評(píng),在數(shù)學(xué)測(cè)驗(yàn)部分,也展示了訊飛星火基礎(chǔ)的數(shù)學(xué)能力,全部答對(duì)毫無(wú)壓力。

經(jīng)典的雞兔同籠問題,即使變換參數(shù)和問法也能全部答對(duì)。

用《差評(píng)》文中的話來說,訊飛星火做數(shù)學(xué)題,有一種過于強(qiáng)大,可以和GPT4掰掰手腕的感覺。

這種感覺,將國(guó)產(chǎn)大模型的回答都放一起后則更加強(qiáng)烈。

《科創(chuàng)板日?qǐng)?bào)》就曾在一篇文章中,對(duì)文心一言、科大訊飛、360智腦幾家比較有代表性的大模型進(jìn)行測(cè)評(píng)展示。

例如,“某次數(shù)學(xué)競(jìng)賽共20道題,評(píng)分標(biāo)準(zhǔn)是:每做對(duì)一題得5分,每做錯(cuò)或不做一題扣1分。小華參加了這次競(jìng)賽,得了64分。問:小華做對(duì)幾道題?”

正確答案應(yīng)該是14題,我們看一下各家大模型的作答。

文心一言:

360智腦:

訊飛星火:

可以看到只有訊飛星火答對(duì)了,文中展示的另一道小升初數(shù)學(xué)題,同樣也只有訊飛星火答對(duì)。

《科創(chuàng)板日版》在文章開頭也指出,科大訊飛星火認(rèn)知在數(shù)理能力表現(xiàn)尤為突出。

那到底能突出到什么程度呢?

我們繼續(xù)對(duì)訊飛星火加大難度看看。

大模型在數(shù)學(xué)領(lǐng)域的表現(xiàn)有著見微知著的效果,因?yàn)檫@需要結(jié)合大語(yǔ)言模型和計(jì)算引擎兩者的能力。在復(fù)雜邏輯條件下,學(xué)習(xí)多步驟推理,這對(duì)計(jì)算資源和數(shù)據(jù),有著海量需求,對(duì)算力也有著極高的要求。

訊飛星火在數(shù)學(xué)方面能力的展示,更是一家企業(yè)數(shù)據(jù)資源和算力水平的展示。對(duì)于國(guó)產(chǎn)大模型來說,數(shù)學(xué)能力是意義非常的。

不過,大模型不是一朝一夕就能訓(xùn)練完成的,如何落地?能不能落地?也是企業(yè)需要考慮的。

3、落地前景

大模型的出現(xiàn)注定是要破舊立新的,技術(shù)的發(fā)展回歸到現(xiàn)實(shí)生活中,還是要看它的實(shí)際應(yīng)用能力。

《娛樂資本論》做過一期市面上主流的5款大模型,一共90個(gè)回答的橫評(píng),想必耗費(fèi)了不少時(shí)間精力,整體評(píng)價(jià)也是比較中肯的,頗具參考意義。

可以先看一下這張最終測(cè)試評(píng)分表。

大模型這種屬于比較底層的框架,我們勢(shì)必要做出自己的由中文語(yǔ)料訓(xùn)練而成的大模型。所以我們不可避免地會(huì)與ChatGPT相比較。

從上圖來看,目前在落地應(yīng)用方面,訊飛星火在主流國(guó)產(chǎn)大模型中,離ChatGPT是最近的。

具體到案例中,我們截取小紅書帶貨的商業(yè)文案來看一下。

文案較長(zhǎng),內(nèi)容有所折疊,不過總的來說,文中展示的兩個(gè)作答還是比較貼切的。

星火自設(shè)了一款手機(jī)型號(hào)進(jìn)行更準(zhǔn)確的數(shù)據(jù)呈現(xiàn),內(nèi)容和邏輯這種長(zhǎng)處不作過多分析,主要拉開差距的地方還是要求中的emoji表情。

相較于文心一言和天工未能察覺出需要在文案和題中帶有emoji表情,星火的emoji甚至還有關(guān)聯(lián)性,直接拿去發(fā)小紅書基本也足夠了。

《TMT時(shí)報(bào)》的記者也對(duì)文心一言、通義千問、訊飛星火的商業(yè)文案能力做過測(cè)試。

文心一言:

通義千問:

訊飛星火:

文心一言雖然洋洋灑灑寫了不少,不過作為海報(bào)文案還需再精簡(jiǎn)一番;通義千問整體表現(xiàn)不錯(cuò),不過相對(duì)更側(cè)重中秋,而失了商業(yè)主體的主導(dǎo)作用;訊飛星火完成度依舊出色,也更突出所設(shè)定的AI醫(yī)療公司的保護(hù)健康的作用,是可以直接拿來使用的程度。

其實(shí)訊飛星火在落地應(yīng)用方面,還做出了不小的嘗試。

訊飛星火升級(jí)到V1.5版本后,新增了星火助手功能,人手一個(gè)賈維斯不再是幻想。

目前經(jīng)審核上傳的星火助手多達(dá)500多個(gè),遍及各個(gè)行業(yè)和細(xì)分領(lǐng)域,還支持自己創(chuàng)建,并不斷調(diào)試出符合自己需求的專屬小助理。

除了我們比較能想象到的日常辦公,筆者對(duì)其中的腦暴部分更加感興趣,比如這個(gè)“小說靈感記錄員”。

從動(dòng)物社會(huì)結(jié)構(gòu),到智慧與力量的平衡,再到文化傳承等等,這對(duì)創(chuàng)作類相關(guān)行業(yè)的增益可想而知。

星火助手發(fā)布時(shí)間還并不長(zhǎng),整體來看,仍有不少需要調(diào)試改進(jìn)的地方。

不過,隨著時(shí)間的推移,星火助手在落地能力以及前景等方面已經(jīng)展示出了相當(dāng)?shù)臐摿Α?/strong>

4、尾聲

中國(guó)科學(xué)技術(shù)信息研究所發(fā)布的一份報(bào)告顯示,從全球已經(jīng)發(fā)布的大模型分布來看,在大模型數(shù)量上,中國(guó)和美國(guó)超過全球總數(shù)的80%,中國(guó)從2020年進(jìn)入大模型快速發(fā)展期,目前與美國(guó)保持同步增長(zhǎng)態(tài)勢(shì)。

除了大模型,應(yīng)用端也呈現(xiàn)出爆發(fā)式增長(zhǎng)的態(tài)勢(shì)。

中國(guó)經(jīng)營(yíng)報(bào)在3月的一篇文中提到,天眼查數(shù)據(jù)顯示,截至當(dāng)時(shí),人工智能相關(guān)企業(yè)258.8萬(wàn)余家,其中,2022年新增注冊(cè)企業(yè)73.2萬(wàn)余家,新增注冊(cè)企業(yè)增速41.5%;近三年(2020~2022年)人工智能相關(guān)企業(yè)新增注冊(cè)企業(yè)增速均超過40%。

大模型以及大模型相關(guān)的企業(yè),正在如雨后春筍般涌現(xiàn)。

時(shí)代的機(jī)遇下,作為國(guó)產(chǎn)大模型的重要代表之一,訊飛星火也已經(jīng)隱隱有了燎原之勢(shì)。

關(guān)鍵詞:

最近更新

關(guān)于本站 管理團(tuán)隊(duì) 版權(quán)申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.ossf.org.cn All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖I(lǐng)CP備2022009963號(hào)-3