夜先锋av资源网站,国产精品极品美女在线观看免,欧美亚洲精品电影在线观看,日韩在线精品强乱一区二区三区

首頁 生活 > 正文

我們對AI大模型的誤解有多深?|天天信息

大模型可以無所不能嗎?怎樣讓模型少犯錯?企業(yè)應該部署多大的模型,一個超級大模型還是一堆專業(yè)模型?


(資料圖片僅供參考)

對于這些問題,第四范式聯(lián)合創(chuàng)始人、首席架構師胡時偉認為:類GPT模型是高級復讀機,有多少“人工”就有多少“智能”,絕非無所不能。模型100%會犯錯,一味地追求算力和數(shù)據(jù)并不能解決這個問題,因此模型之上必須要有運營兜底機制,知錯就改。算力決定參數(shù)規(guī)模,一堆專業(yè)模型比一個超級大模型更有落地可行性。

上述觀點源于6月10日新金融聯(lián)盟舉辦的“金融機構數(shù)智化轉型與大模型技術應用”內(nèi)部研討會。會上,新金融聯(lián)盟學術理事、工商銀行首席技術官呂仲濤,民生銀行數(shù)據(jù)管理部總經(jīng)理沈志勇、平安銀行數(shù)字資產(chǎn)管理與研發(fā)中心總經(jīng)理劉錦淼也做了主題發(fā)言。新金融聯(lián)盟理事長、中國銀行原行長李禮輝及中國信通院金融科技研究中心副主任趙小飛進行了點評交流。

56家銀行及非銀機構、55家科技公司的170多位嘉賓通過線上線下參會。會議由新金融聯(lián)盟秘書長吳雨珊主持,中國金融四十人論壇提供學術支持。會議實錄詳見→《如何釋放大模型對金融行業(yè)的價值?以下為胡時偉的發(fā)言全文,已經(jīng)本人審核。

企業(yè)大模型落地的幾個關鍵問題

文 | 胡時偉

大模型并非“無所不能”

現(xiàn)在各行各業(yè)都十分關注大模型這一話題。第四范式在自己的大模型產(chǎn)品“式說”2月份發(fā)布以來,與17個行業(yè)的114家企業(yè)進行了密集與深入的溝通,發(fā)現(xiàn)業(yè)界普遍對大模型存在一些誤解,需要糾偏。

第一,要相信科學。大家普遍認為大模型已經(jīng)具備“涌現(xiàn)”能力,可以無師自通。大模型的能力主要還是源于給它提供了什么樣的數(shù)據(jù),并不是直接“涌現(xiàn)”出來的。本質上講,類GPT模型的背后還是機器學習,需要高質量的數(shù)據(jù)訓練而來,并通過Fine-tuning(微調)進行調優(yōu)才能實現(xiàn)一些特定的能力。

第二,有多少人工,就有多少智能。生成式AI到底能解決什么問題?通俗地講,從基礎大模型到行業(yè)大模型甚至到場景定制,我們目前認為它可以用以完成一份文檔。在一個特定場景下正確地完成一個文檔,一定來自于人反饋的數(shù)據(jù)。就像GPT要用到非常多維基百科的數(shù)據(jù),是因為該數(shù)據(jù)質量更高。我們行業(yè)要做的是,一定要對大模型形成反饋閉環(huán)和迭代,即告訴大模型什么是好的,訓練它達到更好的效果。這件事情本質還是依賴人工。

第三,大模型生成一定會出錯。哪怕是GPT-4,在行業(yè)專業(yè)、嚴肅場景的應用也遠未達到工業(yè)可用的效果。這是技術本身的缺陷所致,靠算力和數(shù)據(jù)也無法從根本上解決這個問題。目前大部分企業(yè)的共識是模型之上必須加一層運營機制來兜底。

企業(yè)應該部署多大的模型?

企業(yè)在大模型落地過程中會面臨一個現(xiàn)實問題——預算有限,預算決定了算力,算力決定了參數(shù)規(guī)模。

因此,我們需要抉擇:應該部署一個超級大模型,期待它能夠把能力上升到一定程度,還是應該從解決問題出發(fā),部署一堆專業(yè)模型,讓它們各司其職。這里面涉及兩個不同的思路。

第一個思路是通過增加參數(shù)和堆砌算力,把所有參數(shù)都給NLP模型。但從實際落地的角度來看,根據(jù)No Free Lunch(沒有免費的午餐)定理,沒有哪一個模型能以最優(yōu)的方式解決所有問題。如果我們把所有的東西都放在一個模型里,最后會花出極大的代價,超級英雄成本很高,也很難管理。

因此,我個人認為會走向另外一個方向,即Learnware(學件)的思路,我們要做一堆參數(shù)過億的專業(yè)模型,來組成整體企業(yè)系統(tǒng),這種方式更利于模型迭代、維護,同時更利于控制成本。就如同一家公司里不能都是董秘,還得有銷售、產(chǎn)研、市場等各個專業(yè)線。

大模型可實現(xiàn)傳統(tǒng)軟件兩大升級

“介質”同樣是企業(yè)落地大模型的關鍵要素。

想象一下,如果沒有APP,推薦算法 能用嗎? 沒有搜索,廣告算法能用嗎?APP和搜索就是推薦算法和廣告算法的介質。同樣, 大模型在企業(yè)落地時,企業(yè)軟件就是大模型的介質如果介質沒有革新,只有算法革新,就像是一個人只有腦沒有手

因此,我們非常需要關注介質層面的革新。企業(yè)中大部分工作的完成都需要使用軟件,但是大量軟件交互的方式都非常低效、復雜,現(xiàn)在我們可基于大模型解決兩個升級:

第一,由生成式大模型負責軟件界面的升級人機交互要變成多模態(tài),通過大模型更強的語義理解能力,可以更直接調用企業(yè)內(nèi)部各種形式的信息、數(shù)據(jù)和模型。

第二,由判別式大模型負責軟件內(nèi)核的升級。以前的軟件主要圍繞數(shù)據(jù)庫做增刪 改查,現(xiàn)在可由判別式大模型對軟件進行智能化升級。

讓大模型成為知錯就改的小助手

由于GPT在技術上存在局限性,因而無法做到百分之百準確,尤其在應用于嚴肅的金融場景時,大模型之上必須要加一層運營體系兜底,讓模型的輸出和操作從不可用變成可用,并且能做到知錯就改。

知錯就改有三個機制疊加保障:一是專家給答案。雖然聽起來不是那么智能,但在專家能給答案的地方一定要給答案,因為這個是最準確的。二是專家給示例,模型進行一定的上下文學習也可以表現(xiàn)更好。三是模型自主學習,基于專家生成的知識反饋給模型,讓模型少犯錯。

生成式大模型加上“執(zhí)行可控、知錯能改”的運營體系,我們可以期待有一位善于理解、準確執(zhí)行的工作助手。這位助手需要讓用戶可以清晰了解哪些內(nèi)容是“100%準確”,哪些是“不確定的”,并且知錯能改。

總體來說,底層大模型不能解決所有問題,介質層及運營機制的革新對于數(shù)字化推動作用同樣重要。企業(yè)需重新打造決策類AI、生成式AI、應用層、介質層。我們目前探索落地的重點是讓生成式大模型結合介質,圍繞企業(yè)數(shù)字化轉型的目標,在企業(yè)里生成一堆Agent,分別用以查資料、查數(shù)據(jù)、準確操作軟件等,這可能是當下一個更加貼合實際、可落地的方向。

本文源自:新金融聯(lián)盟NFA

作者: 胡時偉

關鍵詞:

最近更新

關于本站 管理團隊 版權申明 網(wǎng)站地圖 聯(lián)系合作 招聘信息

Copyright © 2005-2023 創(chuàng)投網(wǎng) - www.ossf.org.cn All rights reserved
聯(lián)系我們:39 60 29 14 2@qq.com
皖ICP備2022009963號-3