滾動：OpenAI、谷歌雙標(biāo)玩得溜：訓(xùn)練大模型用他人數(shù)據(jù)，卻決不允許自身數(shù)據(jù)外流

2023-06-23 00:19:41 來源: 機(jī)器之心

機(jī)器之心編譯

編輯：杜偉、梓文

你的就是我的，我的還是我的。

在生成式 AI 盛行的全新時代，大型科技公司在使用在線內(nèi)容時正在奉行「照我說的做，而不是做我所做的」策略。在一定程度上，這種策略可以說是一種雙標(biāo)以及話語權(quán)的濫用。

(資料圖片)

同時，隨著大語言模型（LLM）成為 AI 發(fā)展的主流趨勢，無論是大型還是初創(chuàng)公司，都在不遺余力地開發(fā)自己的大模型。其中訓(xùn)練數(shù)據(jù)是大模型能力好壞的重要前提。

近日，根據(jù) Insider 的報道，微軟支持的 OpenAI、谷歌及其支持的 Anthropic 多年來一直在使用其他網(wǎng)站或公司的在線內(nèi)容來訓(xùn)練他們的生成式 AI 模型。這些都是在沒有征求具體許可的情況下完成的，并將構(gòu)成一場醞釀中的法律斗爭的一部分，決定了網(wǎng)絡(luò)的未來以及版權(quán)法在這一新時代的應(yīng)用方式。

這些大型科技公司可能會爭辯說他們是合理使用，是否真的如此有待商榷。但是他們卻不會讓自己的內(nèi)容被用來訓(xùn)練其他 AI 模型。所以不禁要問，為什么這些大型科技公司卻能在訓(xùn)練大模型時使用其他公司的在線內(nèi)容呢？

這些公司很聰明，但也非常虛偽

大型科技公司使用他人在線內(nèi)容卻不允許他人使用自己的，這種說法是否有確切證據(jù)，這可以從他們一些產(chǎn)品的服務(wù)和使用條款中看出端倪。

首先來看 Claude，它是 Anthropic 推出的類似于 ChatGPT 的 AI 助手。該系統(tǒng)可以完成摘要總結(jié)、搜索、協(xié)助創(chuàng)作、問答、編碼等任務(wù)。前段時間再次升級，將上下文 token 擴(kuò)展到了 100k，處理速度大大加快。

Claude 的服務(wù)條款是這樣的。你不得以下列方式（這里列舉出部分）訪問或使用本服務(wù)，如果這些限制的任何一項與可接受使用政策不一致或不明確，則以后者依從為先：

開發(fā)與我們的服務(wù)競爭的任何產(chǎn)品或服務(wù)，包括開發(fā)或訓(xùn)練任何 AI 或機(jī)器學(xué)習(xí)算法或模型

未經(jīng)條款允許，從我們的服務(wù)中抓取、爬取或以任何其他方式獲取數(shù)據(jù)或信息

Claude 服務(wù)條款地址：/s/9f502c93-cb5c-4571-b205-1e479da61794/#terms

同樣地，谷歌的生成式 AI 使用條款也是如此，「你不得使用本服務(wù)來開發(fā)機(jī)器學(xué)習(xí)模型或相關(guān)技術(shù)?！?/p>

谷歌生成式 AI 使用條款地址：/terms/generative-ai

OpenAI 的使用條款又怎樣呢？與谷歌類似，「你不得使用本服務(wù)的輸出來開發(fā)與 OpenAI 競爭的模型?！?/p>

OpenAI 使用條款地址：/policies/terms-of-use

這些公司很聰明，他們知道高質(zhì)量的內(nèi)容對于訓(xùn)練新的 AI 模型至關(guān)重要，所以不允許別人用這樣的方式使用他們的輸出也是合情合理的。但他們卻無所顧忌地利用他人數(shù)據(jù)來訓(xùn)練自己的模型，這又該如何解釋呢？

目前，OpenAI、谷歌和 Anthropic 拒絕了 Insider 的置評請求，并且沒有做出任何回應(yīng)。

Reddit、推特和其他公司：受夠了

實際上，其他公司意識到正在發(fā)生的事情時并不高興。今年 4 月，多年來一直被用于 AI 模型訓(xùn)練的 Reddit 計劃開始對其數(shù)據(jù)的訪問收費(fèi)。

Reddit 首席執(zhí)行官 Steve Huffman 表示，「Reddit 的數(shù)據(jù)語料庫非常有價值，因此我們不能把這些價值免費(fèi)提供給世界上最大的公司?！?/p>

同樣今年 4 月，馬斯克指責(zé) OpenAI 的主要支持者微軟非法使用 Twitter 的數(shù)據(jù)來訓(xùn)練 AI 模型。「訴訟時間到」，他在推特上寫道。

不過在回復(fù) Insider 的置評時，微軟表示「這個前提有太多的錯誤，我甚至不知道從何說起?！?/p>

OpenAI 首席執(zhí)行官 Sam Altman 試圖通過探索尊重版權(quán)的全新 AI 模型來深化這個問題。據(jù) Axios 報道，他于近期表示，「我們正在嘗試開發(fā)新的模式，如果 AI 系統(tǒng)使用了你的內(nèi)容，或者使用了你的風(fēng)格，你就會因此獲得報酬。」

Sam Altman

出版商（包括 Insider）都會是既得利益獲得者。此外，包括美國新聞集團(tuán)在內(nèi)的一些出版商已經(jīng)在推動科技公司付費(fèi)使用其內(nèi)容訓(xùn)練 AI 模型。

目前 AI 模型的訓(xùn)練方式「打破」了網(wǎng)絡(luò)

有前微軟高管表示這一定有問題。微軟老將、著名軟件開發(fā)者 Steven Sinofsky 認(rèn)為，目前 AI 模型的訓(xùn)練方式「打破」了網(wǎng)絡(luò)。

Steven Sinofsky

他在推特上寫道，「過去，爬取數(shù)據(jù)是用來換取點擊率的。但現(xiàn)在只是用來訓(xùn)練一個模型，沒有給創(chuàng)作者、版權(quán)所有者帶來任何價值?！?/p>

也許，隨著更多公司的覺醒，生成式 AI 時代這一不均衡的數(shù)據(jù)使用方式會很快被改變。

原文鏈接：/openai-google-anthropic-ai-training-models-content-data-use-2023-6

?THE END

轉(zhuǎn)載請聯(lián)系本公眾號獲得授權(quán)

投稿或?qū)で髨蟮溃篶ontent@

關(guān)鍵詞：

夜先锋av资源网站,国产精品极品美女在线观看免,欧美亚洲精品电影在线观看,日韩在线精品强乱一区二区三区

滾動：OpenAI、谷歌雙標(biāo)玩得溜：訓(xùn)練大模型用他人數(shù)據(jù)，卻決不允許自身數(shù)據(jù)外流

您可能也感興趣:

今日熱點

宋德勇|世界時訊

北礦科技：公司已在微信公眾號平臺開通官方賬號“北礦科技”_全球...

拉夫羅夫：美國正密謀干涉俄羅斯明年大選手段為大搞“顏色革命”_...

更多

更多

排行

最近更新

今日要聞

夜先锋av资源网站,国产精品极品美女在线观看免,欧美亚洲精品电影在线观看,日韩在线精品强乱一区二区三区

滾動：OpenAI、谷歌雙標(biāo)玩得溜：訓(xùn)練大模型用他人數(shù)據(jù)，卻決不允許自身數(shù)據(jù)外流

您可能也感興趣:

今日熱點

宋德勇|世界時訊

北礦科技： 公司已在微信公眾號平臺開通官方賬號“北礦科技”_全球...

拉夫羅夫：美國正密謀干涉俄羅斯明年大選 手段為大搞“顏色革命”_...

為您推薦

（圖表·漫畫）［法治］成效顯著 新要聞

新資訊：真的值！16G內(nèi)存跌破150元

環(huán)球觀速訊丨舞臺陷爭議、私生活被議論，誤解楊麗萍從說她“不雅”開始

熱文：離異夫妻上演“奪子戰(zhàn)”，法院傾情調(diào)解護(hù)童權(quán)

更多

更多

排行

最近更新

今日要聞

滾動：OpenAI、谷歌雙標(biāo)玩得溜：訓(xùn)練大模型用他人數(shù)據(jù)，卻決不允許自身數(shù)據(jù)外流

北礦科技：公司已在微信公眾號平臺開通官方賬號“北礦科技”_全球...

拉夫羅夫：美國正密謀干涉俄羅斯明年大選手段為大搞“顏色革命”_...

（圖表·漫畫）［法治］成效顯著新要聞

環(huán)球觀速訊丨舞臺陷爭議、私生活被議論，誤解楊麗萍從說她“不雅”開始

熱文：離異夫妻上演“奪子戰(zhàn)”，法院傾情調(diào)解護(hù)童權(quán)