謠言or真相?三個(gè)步驟告訴你 準(zhǔn)確率超八成
謠言or真相?三個(gè)步驟告訴你 準(zhǔn)確率超八成
阿里巴巴達(dá)摩院科學(xué)家造了一個(gè)識別謠言的神器
AI謠言粉碎機(jī),謠言識別準(zhǔn)確率達(dá)81%
昨天,一篇《為拯救爸媽朋友圈,達(dá)摩院造了“謠言粉碎機(jī)”》的文章,在朋友圈刷屏,引來一片鼓掌叫好:“這下終于不用費(fèi)勁勸導(dǎo)爸媽了!”
文章說的是,阿里巴巴達(dá)摩院的科學(xué)家,造了一個(gè)謠言粉碎機(jī),這是一個(gè)算法模型,可以識別真假新聞,未來也能應(yīng)用在各大領(lǐng)域。
這是怎樣一種算法?準(zhǔn)確率高嗎?真的可以終結(jié)謠言?記者聯(lián)系到了正在大洋彼岸的“謠言粉碎機(jī)”的創(chuàng)造者李泉志。
“粉碎機(jī)”的前生功能
是為記者提供可靠線索
《速轉(zhuǎn)!科學(xué)家發(fā)現(xiàn):一味中藥48小時(shí)可殺死60%癌細(xì)胞!》《晚上喝白開水的朋友,再不看就晚了!》《專家說了,這樣?xùn)|西千萬別吃!》……
你有沒有收到過父母發(fā)來的這些“關(guān)懷”?又有多少次是抱著“算了算了,你開心就好”的心態(tài)結(jié)束話題?
“不能保證百分之百準(zhǔn)確,但基本可以判斷是否為謠言。”李泉志,達(dá)摩院NLP團(tuán)隊(duì)的核心成員之一,畢業(yè)于清華大學(xué),后在美國獲得自然語言理解方向的博士學(xué)位,目前在達(dá)摩院的西雅圖辦公室工作。
在加入達(dá)摩院前,他曾是路透社重要的“情報(bào)官”:通過機(jī)器篩選成千上萬的網(wǎng)絡(luò)信息,為數(shù)千位一線記者提供可靠線索。
“AI謠言粉碎機(jī)”就是借助自然語言實(shí)現(xiàn)的。在剛剛結(jié)束的SemEval(自然語言處理領(lǐng)域的國際權(quán)威比賽,由國際計(jì)算語言學(xué)學(xué)會(huì)舉辦)全球語義測試中,“AI謠言粉碎機(jī)”創(chuàng)造了假新聞識別準(zhǔn)確率的新紀(jì)錄,達(dá)到了前所未有的81%。
判斷一個(gè)新聞?wù)婕?/strong>
要分三個(gè)步驟
“AI謠言粉碎機(jī)”要怎么去判斷是否為謠言呢?李泉志說,分三步——
首先,該模型會(huì)找到最初的信息源,分析用戶畫像,包括:專業(yè)領(lǐng)域,此前傳播或轉(zhuǎn)發(fā)過什么,是個(gè)人還是機(jī)構(gòu),注冊時(shí)間,活躍規(guī)律等,來判斷發(fā)布者是否“可靠”。最后根據(jù)不同態(tài)度的人群比例、各自的信譽(yù)度等信息,計(jì)算出此新聞的可信度。
第二步,尋找網(wǎng)上所有的信息源,看看鏈接的域名,是否來自可信網(wǎng)站,比如新華社、政府醫(yī)藥管理局等。
第三步,將正文里關(guān)鍵的論證提煉為知識點(diǎn),與知識圖譜里的權(quán)威知識庫做匹配驗(yàn)證。如果毫無聯(lián)系、自相矛盾,減分。
李泉志解釋,“AI謠言粉碎機(jī)”會(huì)考慮一部分人類的想法,更多的則是 AI的運(yùn)用。人工智能有很多人類比不了的地方,比如當(dāng)一個(gè)流言在社交網(wǎng)站上傳播很快的時(shí)候,我們很難去判斷真假,不知道誰接收到了,是出于什么原因轉(zhuǎn)發(fā),不同的人對此的評價(jià)是什么,而這些AI可以做到。“假如來一個(gè)流言,人可以通過網(wǎng)站去查證,但是AI可以快速把科學(xué)研究、新聞拉出來,加上后臺知識庫的對比,做一個(gè)驗(yàn)證。人腦中有基本判斷,但是沒有大型的知識庫。”李泉志說。
就拿“AI謠言粉碎機(jī)”的訓(xùn)練樣本來說,就要分至少兩個(gè)層面:首先拿底層的2億條信息,幾百萬條新聞,訓(xùn)練語言樣本;再將模型進(jìn)行謠言的真實(shí)性訓(xùn)練。“是一個(gè)復(fù)雜且費(fèi)時(shí)的過程。”李泉志表示。
誰制造謠言,論文是否抄襲
未來粉碎機(jī)還有更多功能
其實(shí),要建這樣一個(gè)數(shù)據(jù)模型,并不容易。李泉志坦言,他在前一家公司就開始研究,到如今,也還需繼續(xù)完善。他們有一個(gè)小團(tuán)隊(duì)專門在研究這一技術(shù),因?yàn)?,總體來說這不是一個(gè)單獨(dú)能列出來的技術(shù),是自然語言所有技術(shù)的綜合。
目前,該模型也并未應(yīng)用于阿里巴巴的任何業(yè)務(wù)中,李泉志坦言,數(shù)據(jù)模型需要不斷被“訓(xùn)練”,也需要得到社會(huì)的認(rèn)同,而這些,都不是短時(shí)間內(nèi)能解決的。
可以想象的是,“AI謠言粉碎機(jī)”未來將被應(yīng)用的多個(gè)場合。
比如,可以識別論文是否為抄襲,用技術(shù)從個(gè)人的寫作風(fēng)格、方法論、主題等多維度去判斷是否為抄襲。過去有人說某年輕作家后期的作品由人代筆,以后用AI就能分析得出結(jié)論。
另一方面,可以協(xié)助警方找到真正謠言的制造者。通過AI去追蹤傳播路徑,從傳播路徑中,將傳播分解,可以發(fā)現(xiàn)規(guī)律,比如傳播了哪些用戶,用戶是什么反應(yīng),是簡單的轉(zhuǎn)發(fā),還是贊成、反對,還是進(jìn)行了二次加工?
“當(dāng)然,該模型也還是需要更多的語言訓(xùn)練。比如有些用戶轉(zhuǎn)發(fā)時(shí),說的是反話、諷刺,有些是隱喻,不知是否是真實(shí)的情緒表達(dá),這些作為機(jī)器很難對此做出判斷,但是通過大量的訓(xùn)練,是可以實(shí)現(xiàn)的。”李泉志表示,他和團(tuán)隊(duì)會(huì)繼續(xù)研究該模型。(朱銀玲)
您可能也感興趣:
今日熱點(diǎn)
為您推薦
保險(xiǎn)打工人年終獎(jiǎng)多數(shù)和上年持平或下降,怎樣發(fā)才合理?
A股5家上市險(xiǎn)企去年保費(fèi)收入增長0.03% 行業(yè)整體增速放緩
8家險(xiǎn)企股權(quán)被掛牌轉(zhuǎn)讓,為何險(xiǎn)企股權(quán)不再被追捧?
更多
- 科技部和浙江發(fā)布《創(chuàng)新行動(dòng)方案》 構(gòu)建高標(biāo)準(zhǔn)技術(shù)要素市場...
- 蕪湖釋放創(chuàng)新“N次方”效應(yīng) 數(shù)字賦能驅(qū)動(dòng)產(chǎn)業(yè)升級
- 重慶:激發(fā)人才創(chuàng)新活力,到2025年創(chuàng)新要素活躍度顯著增強(qiáng)
- 西寧加快知識產(chǎn)權(quán)強(qiáng)市建設(shè)步伐 去年兌現(xiàn)資助資金200萬元
- 無錫錫山區(qū)全面啟動(dòng)實(shí)施“雙招雙引” 引進(jìn)高端創(chuàng)新資源
- 重慶巴南區(qū)落實(shí)創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略 以科技創(chuàng)新引領(lǐng)五大產(chǎn)業(yè)集...
- 朝陽北票經(jīng)開區(qū)加快推進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展 推動(dòng)體制機(jī)制創(chuàng)新
- 湖北省先進(jìn)低碳冶金產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)合體組建 打造五千億級產(chǎn)...
更多
- 遼寧省招商引資保持較高增速 今年將全力打造對外開放新前沿
- 指導(dǎo)企業(yè)鞏固傳統(tǒng)市場、開拓新興市場 促進(jìn)綠色貿(mào)易健康發(fā)展
- 去年湖南GDP同比增長7.7% 固定資產(chǎn)投資增長7.8%
- 深圳不斷提升對外投資水平 “走出去”服務(wù)水平顯著提高
- 去年實(shí)際使用外資達(dá)1.1萬億元 來源地投資穩(wěn)定增長
- 北京“十四五”投資實(shí)現(xiàn)良好開局 高技術(shù)產(chǎn)業(yè)投資亮眼
- 山東抓投資抓項(xiàng)目 新興領(lǐng)域投資規(guī)模持續(xù)擴(kuò)大
- 2021年各地引資成績單亮眼 迸發(fā)出巨大經(jīng)濟(jì)活力
排行
- 有機(jī)奶粉市場需求不斷加大 去年市場規(guī)模已突破100億元
- 我國穩(wěn)居世界第一制造業(yè)大國地位,高質(zhì)量發(fā)展邁上新臺階
- 新一線城市中13城GDP超萬億元 哪座城市更有沖勁?
- 房地產(chǎn)企業(yè)經(jīng)營業(yè)績良好 為何地產(chǎn)股價(jià)“跌跌不休”?
- 新老人:消費(fèi)觀感性與理性并存,購物從“老三場”轉(zhuǎn)移到“新...
- 中國奧園榮登福布斯全球2000強(qiáng)第849位 大幅躍升303位
- 數(shù)字化改革背景下,杭州以“產(chǎn)業(yè)大腦”賦能城市產(chǎn)業(yè)治理
- 江西將實(shí)現(xiàn)從“以票管稅”向“以數(shù)治稅”分類精準(zhǔn)監(jiān)管轉(zhuǎn)變
- 7月份規(guī)模以上工業(yè)增加值增長6.4%,前7月增長14.4%
- 疫情常態(tài)化大背景下,各地該如何發(fā)展旅游業(yè)?
最近更新
- 深圳:試點(diǎn)開展互聯(lián)網(wǎng)處方藥銷售,實(shí)現(xiàn)相關(guān)事項(xiàng)“一網(wǎng)通辦”
- 特斯拉報(bào)告顯示第四季度其比特幣持有量沒有變化
- 波音Q4財(cái)報(bào):787客機(jī)造成45億美元損失 三年來首次實(shí)現(xiàn)正現(xiàn)金流
- 受電視面板價(jià)格下跌影響 LG Display第四季度利潤同比下降30%
- 美聯(lián)儲(chǔ)3月份維持利率在0%-0.25%區(qū)間的概率為5%
- 美股快速下挫 現(xiàn)貨黃金回落至1820美元/盎司下方
- 無線電報(bào)的發(fā)展史
- 任意波形發(fā)生器簡介
- 傳感器工作原理
- 連續(xù)3個(gè)交易日下跌30% 華寶股份:實(shí)控人朱林瑤被監(jiān)察委員會(huì)立案
- 華潤啤酒預(yù)計(jì)2021年實(shí)現(xiàn)凈利潤同比增長110%-124%
- 數(shù)字電路基礎(chǔ)
- 氫氧燃料電池原理
- 最便宜USB延長線自己制作的做法(圖解)
- 完美微分電路之我見
- 詳解ROHS標(biāo)準(zhǔn)
- 電弧爐原理
- 水井坊:2021年凈利預(yù)增約64%,銷售量增長約四成全部來自中高檔酒
- 因凈利潤為負(fù)且營收低于 1 億,皇臺酒業(yè)或被實(shí)施退市風(fēng)險(xiǎn)警示
- 安勇旭:綻放人生,讓愛遠(yuǎn)行
- 一文讀懂FTX最新IEO項(xiàng)目「PsyOptions」
- 踐行綠色辦奧理念,遠(yuǎn)東電纜液冷大功率充電電纜亮相北京冬奧會(huì)
- 新增80項(xiàng)升級技術(shù)!深度解析解放J6V的升級之路
- 31省份2021年經(jīng)濟(jì)成績單揭曉:17省人均GDP超1萬美元
- ?茅臺擬41.1億投向醬香酒習(xí)水新項(xiàng)目,新增系列酒產(chǎn)能1.2萬噸
- 引領(lǐng)嬰幼兒奶粉高端品質(zhì) 雅士利率先獲得歐盟產(chǎn)品認(rèn)證
- 安徽電纜用“硬核”實(shí)力鑄就高端核級電纜“護(hù)城河”
- DeBank推出Web3社交平臺
- 基爾霍夫電流定律學(xué)習(xí)寶典
今日要聞
- 特斯拉報(bào)告顯示第四季度其比特幣持有量沒有變化
- 波音Q4財(cái)報(bào):787客機(jī)造成45億美元損失 三年來首次實(shí)現(xiàn)正現(xiàn)金流
- 受電視面板價(jià)格下跌影響 LG Display第四季度利潤同比下降30%
- 美聯(lián)儲(chǔ)3月份維持利率在0%-0.25%區(qū)間的概率為5%
- 美股快速下挫 現(xiàn)貨黃金回落至1820美元/盎司下方
- 無線電報(bào)的發(fā)展史
- 任意波形發(fā)生器簡介
- 傳感器工作原理
- 連續(xù)3個(gè)交易日下跌30% 華寶股份:實(shí)控人朱林瑤被監(jiān)察委員會(huì)立案
- 華潤啤酒預(yù)計(jì)2021年實(shí)現(xiàn)凈利潤同比增長110%-124%