一知智能算法團隊：去摘遙不可及的星

2023-03-01 09:47:58 來源: 榕城網

如果你問一知人最喜歡聽到的話是什么，那一定會是“你們的機器人也太像真人了吧！”。

從一句話通知到平均對話時長超過一分鐘，從“人工智障”到“金牌客服”，底層核心能力逐漸成熟，語音識別準確率穩(wěn)步提升，一點一滴的進步讓人工智能電話通道的有效觸達成為可能。而在對話體驗不斷提升的背后，站著的，是一群敢于摘星的人，他們就是一知智能算法團隊。

這是一個碩博率達到100%的部門，匯集了眾多業(yè)內頂尖的技術人才。其中有AI Lab主任姜興華等屢獲行業(yè)大獎的牛人，有薛弘揚博士等人工智能科學家，也有畢業(yè)于東京大學、美國加州大學洛杉磯分校、南安普頓大學、瑞典皇家理工學院、利物浦大學，浙江大學、中國科學技術大學、西安交通大學、華中科技大學等國內外頂尖院校的精英。

作為技術驅動型公司，一知智能始終保持對技術先進性的追求。一知智能算法團隊核心成員來自浙江大學人工智能研究所和國家重點實驗室，擁有強大的高校研發(fā)背景。創(chuàng)始團隊在校期間屢次在國際大賽中獲獎。2016年知識圖譜構建競賽（Knowledge Base Population，簡稱 KBP）領先IBM、科大訊飛、CMU等研究機構獲實體檢測任務（Mention Detection）國際綜合排名第一；2017年在機器閱讀理解大賽(Stanford Question Answering Dataset，簡稱SQuAD)中，領先谷歌、微軟、BAT、科大訊飛等名企，榮獲國際單模型組國際排名第二（國內第一）、國際多模型組國際排名第三；2017年SNLI機器閱讀理解大賽打敗了斯坦福、MIT、UIUC、清華等國際頂尖知名高校位列國際排名第一。2019年2月，一知智能與浙江大學聯(lián)合成立了浙大·一知人工智能研究中心。其中，與微軟亞研院聯(lián)合研發(fā)的FastSpeech算法合成速度比谷歌快260倍；SimulSpeech同聲傳譯算法為同等翻譯效果下業(yè)界最快實時性翻譯；FastLR唇語識別算法為目前世界上解碼速度最快的唇語識別系統(tǒng)，比第二名caseded算法快10倍。與此同時，算法團隊還擁有十余項自主研發(fā)的人機語音交互國家專利，語音人工智能領域國家專利數(shù)量在業(yè)內遙遙領先，在核心算法技術上自研已達到行業(yè)頂尖和國際前沿水平。

正是這樣一群人聚在一起，解決行業(yè)頂尖的技術難題，試圖摘取人工智能皇冠上的明珠，再通過技術落地讓每一次人機交互的體驗變得更好。2022年，一知智能算法團隊實現(xiàn)了意圖識別系統(tǒng)全面升級，在電商、反電詐、游戲等場景下均實現(xiàn)了超過96%的準確率，與此同時，他們還完成了新一代自研ASR系統(tǒng)，識別準確率大幅提升，也進一步優(yōu)化了語音人機交互對話體驗。

他們不僅是一知底層技術的挖掘者，也是站在行業(yè)前沿的“弄潮兒”。自2022年8月以來，為保護消費者隱私，各大電商平臺相繼推出虛擬號功能，將消費者的手機號碼改為虛擬號碼，現(xiàn)有的外呼手段無法觸達品牌相關用戶群體。而在短短一個月內，一知智能就實現(xiàn)了基于虛擬號的完整外呼方案，也是當時市場上唯一實現(xiàn)該外呼方式的廠商。一知智能算法團隊研發(fā)的分機號接通時刻判斷算法也獲得了國家發(fā)明專利，分機號輸入判斷模型和接通狀態(tài)判斷模型能夠在毫秒級（20ms）的時間內判斷何時輸入分機號以及用戶是否接起通話，準確率高達99%，在提升外呼效率的同時，也能確保運營商側能夠準確的接收分機號輸入。

另一方面，算法的優(yōu)化也大幅提高了AI訓練師的工作效率。目前，公司已研發(fā)意向等級自動判斷算法，平均可節(jié)約訓練師配置話術約20%的時間，并針對行業(yè)首創(chuàng)的生成式話術自動化算法完成算法驗證，該項技術為探索需要大批量話術交付的業(yè)務場景提供了可能性。

看看一知 Labs 的核心方向還有哪些！

持續(xù)突破底層核心技術

語音識別系統(tǒng)

一知智能自研ASR系統(tǒng)使用了最新的conformer模型，與之前版本的傳統(tǒng)模型相比，層數(shù)更多，效果更好。模型設計采用了U2++結構，統(tǒng)一了流式和非流式的模式。在業(yè)務使用中，采用CTC流式解碼，結合attention和語言模型rescore，能夠實時快速獲得識別的中間結果，并確保最終預測結果的準確率。與此同時，算法團隊還根據具體業(yè)務場景的實際使用情況，增加了專有名詞糾錯模塊，提高了ASR系統(tǒng)在各個定制領域中的識別準確率。

意圖識別算法

一知智能的意圖識別算法利用蒸餾算法，有效地減少了算法模型參數(shù)，在保持模型高識別率的前提下，大幅度提升算法模型的推理性能，有助于支撐一知業(yè)務量的增長。同時，一知智能算法團隊也長期致力于模型能力的提升，研究并發(fā)表了相關技術的發(fā)明專利。與此同時，利用少樣本學習技術，用少量的標注數(shù)據，訓練出具有相同性能的算法模型，將模型的通用能力和特定行業(yè)下的垂直場景進行高效融合，賦予了多樣場景快速平鋪的能力。

而近期ChatGPT的出現(xiàn)和火熱意味著深度學習意圖識別算法能力有了全新突破，除了ChatGPT這類直接面向終端用戶的產品以外，生成式AI還有更為廣闊的技術應用空間。ChatGPT及其相關的人工智能內容生成技術也與一知智能現(xiàn)有業(yè)務息息相關。一知智能的AI外呼產品已廣泛應用于電商、政企、出海等各個行業(yè)，引入ChatGPT的強大能力，協(xié)助AI訓練師的編寫話術腳本，能夠顯著提升工作效率，與此同時，將ChatGPT納入真實對話體系，提升對話廣度和深度，最大限度減少“答非所問”。AIGC通用模型能力的持續(xù)發(fā)展必將催生一場內容生成產業(yè)變革，也期待多模態(tài)人機交互能力能乘著這陣東風上更上一層樓。

快速響應客戶需求和痛點

意向等級判斷算法

在AI外呼場景中，當我們的AI機器人結束與客戶的通話后，了解該客戶的意向等級（意向強烈、意向一般、意向弱等）是AI外呼公司一項不可避免的緊迫任務，企業(yè)客戶對于意向等級判斷的效率和質量有著極高的要求。在算法介入之前，AI訓練師需要編寫大量的意向規(guī)則以匹配相關關鍵詞來判斷意向，該方式非常耗時且準確率也不高。

算法同學在分析該場景后發(fā)現(xiàn)，這一場景其實非常符合決策樹的邏輯，基于這一判斷，我們針對AI機器人話術和客戶話術分別訓練了分類算法模型，在拿到這些話術標簽后，依據話術標簽的轉換邏輯，從上至下遍歷整個話術，最終自動完成話術意向等級的判斷。這一算法的引入平均可節(jié)約訓練師配置話術約20%的時間，同時也能大幅提升準確率。

話術自動化系統(tǒng)

一知智能最新研發(fā)的話術自動化系統(tǒng)能夠根據用戶輸入的數(shù)據直接生成準確、通順的話術草稿。在算法層面，該系統(tǒng)分為兩部分：一是將話術編輯的專家知識解構成本體模型、語義推理規(guī)則體系、語用分類規(guī)則體系三個維度的數(shù)據；二是基于語義角色和語法規(guī)則的文本生成引擎。話術自動化系統(tǒng)能夠大大減少AI訓練師的早期工作量，并使大批量精細化場景的話術高效交付成為可能。

分機號外呼算法

為了保護個人隱私，天貓、美團等主流電商平臺，不再直接提供客戶的手機號，而是通過虛擬號的方式提供客戶信息。

對于一知智能這類外號平臺來說，最大的困難在于我們無法在客戶拿起電話的那一刻獲得信號信息，這就導致我們的AI機器人不知從何時開始和客戶對話。因此，一知智能算法團隊針對這一問題，自研了一套分機號接通時刻點判斷系統(tǒng)，成為業(yè)內最早支持此項技術的外呼廠商之一，同時該項技術也獲得了國家發(fā)明專利。分機號輸入判斷模型和接通狀態(tài)判斷模型均能在毫秒級（20ms）的時間內判斷何時輸入分機號以及用戶是否接起通話，準確率高達99%，在提升外呼效率的同時，還可以確保運營商側能夠準確接收分機號碼輸入。

向前一步探索第二曲線

數(shù)字人口型合成算法

一知智能自主研發(fā)的數(shù)字人產品采用了一知智能數(shù)字人業(yè)務研發(fā)團隊最新推出的由文本和語音驅動的數(shù)字人口型合成算法，并基于自然語言理解、語音識別、意圖識別、語音合成等一知智能底層核心技術能力，集成于一知大腦“Yi Brain”，可根據對話情境完成高度擬人化的對話交流，支持直播、人機交互大屏、終端機等多種交互場景。

利用口型合成算法，只需提前拍攝一個幾分鐘的視頻，即可為視頻中的人物生成虛擬形象。此后就可以使用任意文本和語音，驅動虛擬形象講述新的內容。在生成的視頻中，虛擬形象的面部表情和口型會與新的講述內容匹配一致，實現(xiàn)實時表情、音唇同步，如同重新拍攝的短視頻一般，具備極高的真實感；同時又省去了重新布置場景、拍攝真人短視頻的復雜工序和高昂成本。這項技術可廣泛應用于虛擬人短視頻口播、直播等豐富的商業(yè)化落地場景。

一知智能數(shù)字人研發(fā)團隊由多模態(tài)人機交互領域專家薛弘揚博士擔任負責人，薛弘揚博士在多模態(tài)可視化交互技術上的研發(fā)背景和應用研究經驗補上了一知智能全棧人機交互的最后一塊拼圖。數(shù)字人業(yè)務的開拓能夠補齊一知現(xiàn)有產品在公域獲客、提升品牌用戶心智的需求短板，為企業(yè)提供更多場景、更高水平的解決方案，幫助企業(yè)客戶在全域營銷擁有更多AI數(shù)字生產力。

2023年，一知智能算法團隊將持續(xù)研發(fā)語音、文本、圖像等多模態(tài)內容理解和內容生成算法，通過AI技術提升對話體驗，提升外呼機器人的實施效率。在深入研究多模態(tài)人機交互技術的同時，借助ChatGPT等大模型算法能力，構建屬于一知的技術護城河。

免責聲明：市場有風險，選擇需謹慎！此文僅供參考，不作買賣依據。

關鍵詞：

夜先锋av资源网站,国产精品极品美女在线观看免,欧美亚洲精品电影在线观看,日韩在线精品强乱一区二区三区

一知智能算法團隊：去摘遙不可及的星

您可能也感興趣:

今日熱點

藍牙耳機如何和手機配對？藍牙耳機可以同時連接兩個手機嗎？

中國算力發(fā)展指數(shù)白皮書發(fā)布廣東算力創(chuàng)新水平和研發(fā)投入居首

生命科技標準創(chuàng)新研討會舉行打通標準應用“最后一公里”

更多

更多

排行

最近更新

今日要聞

夜先锋av资源网站,国产精品极品美女在线观看免,欧美亚洲精品电影在线观看,日韩在线精品强乱一区二区三区

一知智能算法團隊：去摘遙不可及的星

您可能也感興趣:

今日熱點

藍牙耳機如何和手機配對？藍牙耳機可以同時連接兩個手機嗎？

中國算力發(fā)展指數(shù)白皮書發(fā)布 廣東算力創(chuàng)新水平和研發(fā)投入居首

生命科技標準創(chuàng)新研討會舉行 打通標準應用“最后一公里”

為您推薦

機票里面包含保險嗎？飛機保險有必要買嗎？

遼寧擴大緩繳社保費政策實施范圍 補繳期間免收滯納金

近十年財險業(yè)務快速發(fā)展 財產保險業(yè)風險保障水平不提升

增額終身壽險成銀保市場上的黑馬 中途退保恐會損失保費

更多

更多

排行

最近更新

今日要聞

藍牙耳機如何和手機配對？藍牙耳機可以同時連接兩個手機嗎？

中國算力發(fā)展指數(shù)白皮書發(fā)布廣東算力創(chuàng)新水平和研發(fā)投入居首

生命科技標準創(chuàng)新研討會舉行打通標準應用“最后一公里”

機票里面包含保險嗎？飛機保險有必要買嗎？

遼寧擴大緩繳社保費政策實施范圍補繳期間免收滯納金

近十年財險業(yè)務快速發(fā)展財產保險業(yè)風險保障水平不提升

增額終身壽險成銀保市場上的黑馬中途退保恐會損失保費