干貨:深度學(xué)習(xí) vs 機(jī)器學(xué)習(xí) vs 模式識(shí)別三種技術(shù)對(duì)比
【編者按】本文來(lái)自CMU的博士,MIT的博士后,vision.ai的聯(lián)合創(chuàng)始人Tomasz Malisiewicz的個(gè)人博客文章,閱讀本文,你可以更好的理解計(jì)算機(jī)視覺(jué)是怎么一回事,同時(shí)對(duì)機(jī)器學(xué)習(xí)是如何隨著時(shí)間緩慢發(fā)展的也有個(gè)直觀的認(rèn)識(shí)。
本文引用地址:http://www.eepw.com.cn/article/201710/367541.htm以下為正文:
本文我們來(lái)關(guān)注下三個(gè)非常相關(guān)的概念(深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和模式識(shí)別),以及他們與2015年最熱門(mén)的科技主題(機(jī)器人和人工智能)的聯(lián)系。
圖1 人工智能并非將人放入一臺(tái)計(jì)算機(jī)中(圖片來(lái)源于 WorkFusion 的博客)
環(huán)繞四周,你會(huì)發(fā)現(xiàn)不缺乏一些初創(chuàng)的高科技公司招聘機(jī)器學(xué)習(xí)專家的崗位。而其中只有一小部分需要深度學(xué)習(xí)專家。我敢打賭,大多數(shù)初創(chuàng)公司都可以從最基本的數(shù)據(jù)分析中獲益。那如何才能發(fā)現(xiàn)未來(lái)的數(shù)據(jù)科學(xué)家?你需要學(xué)習(xí)他們的思考方式。
三個(gè)與“學(xué)習(xí)”高度相關(guān)的流行詞匯
模式識(shí)別(Pattern recogniTIon)、機(jī)器學(xué)習(xí)(machine learning)和深度學(xué)習(xí)(deep learning)代表三種不同的思想流派。模式識(shí)別是最古老的(作為一個(gè)術(shù)語(yǔ)而言,可以說(shuō)是很過(guò)時(shí)的)。機(jī)器學(xué)習(xí)是最基礎(chǔ)的(當(dāng)下初創(chuàng)公司和研究實(shí)驗(yàn)室的熱點(diǎn)領(lǐng)域之一)。而深度學(xué)習(xí)是非常嶄新和有影響力的前沿領(lǐng)域,我們甚至不會(huì)去思考后深度學(xué)習(xí)時(shí)代。我們可以看下圖所示的谷歌趨勢(shì)圖??梢钥吹剑?/p>
1)機(jī)器學(xué)習(xí)就像是一個(gè)真正的冠軍一樣持續(xù)昂首而上;
2)模式識(shí)別一開(kāi)始主要是作為機(jī)器學(xué)習(xí)的代名詞;
3)模式識(shí)別正在慢慢沒(méi)落和消亡;
4)深度學(xué)習(xí)是個(gè)嶄新的和快速攀升的領(lǐng)域。
2004年至今三個(gè)概念的谷歌搜索指數(shù)(圖來(lái)源于 谷歌趨勢(shì) )
1. 模式識(shí)別:智能程序的誕生
模式識(shí)別是70年代和80年代非常流行的一個(gè)術(shù)語(yǔ)。它強(qiáng)調(diào)的是如何讓一個(gè)計(jì)算機(jī)程序去做一些看起來(lái)很“智能”的事情,例如識(shí)別“3”這個(gè)數(shù)字。而且在融入了很多的智慧和直覺(jué)后,人們也的確構(gòu)建了這樣的一個(gè)程序。例如,區(qū)分“3”和“B”或者“3”和“8”。早在以前,大家也不會(huì)去關(guān)心你是怎么實(shí)現(xiàn)的,只要這個(gè)機(jī)器不是由人躲在盒子里面?zhèn)窝b的就好(圖2)。不過(guò),如果你的算法對(duì)圖像應(yīng)用了一些像濾波器、邊緣檢測(cè)和形態(tài)學(xué)處理等等高大上的技術(shù)后,模式識(shí)別社區(qū)肯定就會(huì)對(duì)它感興趣。光學(xué)字符識(shí)別就是從這個(gè)社區(qū)誕生的。因此,把模式識(shí)別稱為70年代,80年代和90年代初的“智能”信號(hào)處理是合適的。決策樹(shù)、啟發(fā)式和二次判別分析等全部誕生于這個(gè)時(shí)代。而且,在這個(gè)時(shí)代,模式識(shí)別也成為了計(jì)算機(jī)科學(xué)領(lǐng)域的小伙伴搞的東西,而不是電子工程。從這個(gè)時(shí)代誕生的模式識(shí)別領(lǐng)域最著名的書(shū)之一是由Duda Hart執(zhí)筆的“模式識(shí)別(Pattern ClassificaTIon)”。對(duì)基礎(chǔ)的研究者來(lái)說(shuō),仍然是一本不錯(cuò)的入門(mén)教材。不過(guò)對(duì)于里面的一些詞匯就不要太糾結(jié)了,因?yàn)檫@本書(shū)已經(jīng)有一定的年代了,詞匯會(huì)有點(diǎn)過(guò)時(shí)。
圖2 一個(gè)字符“3”的圖像被劃分為16個(gè)子塊。
自定義規(guī)則、自定義決策,以及自定義“智能”程序在這個(gè)任務(wù)上,曾經(jīng)都風(fēng)靡一時(shí)(更多信息,可以查看這個(gè) OCR 網(wǎng)頁(yè))
小測(cè)試:計(jì)算機(jī)視覺(jué)領(lǐng)域最著名的會(huì)議叫CVPR,這個(gè)PR就是模式識(shí)別。你能猜出第一屆CVPR會(huì)議是哪年召開(kāi)的嗎?
2. 機(jī)器學(xué)習(xí):從樣本中學(xué)習(xí)的智能程序
在90年代初,人們開(kāi)始意識(shí)到一種可以更有效地構(gòu)建模式識(shí)別算法的方法,那就是用數(shù)據(jù)(可以通過(guò)廉價(jià)勞動(dòng)力采集獲得)去替換專家(具有很多圖像方面知識(shí)的人)。因此,我們搜集大量的人臉和非人臉圖像,再選擇一個(gè)算法,然后沖著咖啡、曬著太陽(yáng),等著計(jì)算機(jī)完成對(duì)這些圖像的學(xué)習(xí)。這就是機(jī)器學(xué)習(xí)的思想。“機(jī)器學(xué)習(xí)”強(qiáng)調(diào)的是,在給計(jì)算機(jī)程序(或者機(jī)器)輸入一些數(shù)據(jù)后,它必須做一些事情,那就是學(xué)習(xí)這些數(shù)據(jù),而這個(gè)學(xué)習(xí)的步驟是明確的。相信我,就算計(jì)算機(jī)完成學(xué)習(xí)要耗上一天的時(shí)間,也會(huì)比你邀請(qǐng)你的研究伙伴來(lái)到你家然后專門(mén)手工得為這個(gè)任務(wù)設(shè)計(jì)一些分類規(guī)則要好。
圖3 典型的機(jī)器學(xué)習(xí)流程(圖來(lái)源于 Natalia KonstanTInova 博士的博客)。
在21世紀(jì)中期,機(jī)器學(xué)習(xí)成為了計(jì)算機(jī)科學(xué)領(lǐng)域一個(gè)重要的研究課題,計(jì)算機(jī)科學(xué)家們開(kāi)始將這些想法應(yīng)用到更大范圍的問(wèn)題上,不再限于識(shí)別字符、識(shí)別貓和狗或者識(shí)別圖像中的某個(gè)目標(biāo)等等這些問(wèn)題。研究人員開(kāi)始將機(jī)器學(xué)習(xí)應(yīng)用到機(jī)器人(強(qiáng)化學(xué)習(xí),操控,行動(dòng)規(guī)劃,抓?。?、基因數(shù)據(jù)的分析和金融市場(chǎng)的預(yù)測(cè)中。另外,機(jī)器學(xué)習(xí)與圖論的聯(lián)姻也成就了一個(gè)新的課題---圖模型。每一個(gè)機(jī)器人專家都“無(wú)奈地”成為了機(jī)器學(xué)習(xí)專家,同時(shí),機(jī)器學(xué)習(xí)也迅速成為了眾人渴望的必備技能之一。然而,“機(jī)器學(xué)習(xí)”這個(gè)概念對(duì)底層算法只字未提。我們已經(jīng)看到凸優(yōu)化、核方法、支持向量機(jī)和BoosTIng算法等都有各自輝煌的時(shí)期。再加上一些人工設(shè)計(jì)的特征,那在機(jī)器學(xué)習(xí)領(lǐng)域,我們就有了很多的方法,很多不同的思想流派,然而,對(duì)于一個(gè)新人來(lái)說(shuō),對(duì)特征和算法的選擇依然一頭霧水,沒(méi)有清晰的指導(dǎo)原則。但,值得慶幸的是,這一切即將改變……
延伸閱讀:要了解更多關(guān)于計(jì)算機(jī)視覺(jué)特征的知識(shí),可以看看原作者之前的博客文章:“ 從特征描述子到深度學(xué)習(xí):計(jì)算機(jī)視覺(jué)的20年 ”。
3. 深度學(xué)習(xí):一統(tǒng)江湖的架構(gòu)
快進(jìn)到今天,我們看到的是一個(gè)奪人眼球的技術(shù)---深度學(xué)習(xí)。而在深度學(xué)習(xí)的模型中,受寵愛(ài)最多的就是被用在大規(guī)模圖像識(shí)別任務(wù)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Nets,CNN),簡(jiǎn)稱ConvNets。
圖4 ConvNet框架(圖來(lái)源于 Torch的教程)
深度學(xué)習(xí)強(qiáng)調(diào)的是你使用的模型(例如深度卷積多層神經(jīng)網(wǎng)絡(luò)),模型中的參數(shù)通過(guò)從數(shù)據(jù)中學(xué)習(xí)獲得。然而,深度學(xué)習(xí)也帶來(lái)了一些其他需要考慮的問(wèn)題。因?yàn)槟忝鎸?duì)的是一個(gè)高維的模型(即龐大的網(wǎng)絡(luò)),所以你需要大量的數(shù)據(jù)(大數(shù)據(jù))和強(qiáng)大的運(yùn)算能力(圖形處理器,GPU)才能優(yōu)化這個(gè)模型。卷積被廣泛用于深度學(xué)習(xí)(尤其是計(jì)算機(jī)視覺(jué)應(yīng)用中),而且它的架構(gòu)往往都是非淺層的。
如果你要學(xué)習(xí)Deep Learning,那就得先復(fù)習(xí)下一些線性代數(shù)的基本知識(shí),當(dāng)然了,也得有編程基礎(chǔ)。我強(qiáng)烈推薦Andrej Karpathy的博文:“ 神經(jīng)網(wǎng)絡(luò)的黑客指南 ”。另外,作為學(xué)習(xí)的開(kāi)端,可以選擇一個(gè)不用卷積操作的應(yīng)用問(wèn)題,然后自己實(shí)現(xiàn)基于CPU的反向傳播算法。
對(duì)于深度學(xué)習(xí),還存在很多沒(méi)有解決的問(wèn)題。既沒(méi)有完整的關(guān)于深度學(xué)習(xí)有效性的理論,也沒(méi)有任何一本能超越機(jī)器學(xué)習(xí)實(shí)戰(zhàn)經(jīng)驗(yàn)的指南或者書(shū)。另外,深度學(xué)習(xí)不是萬(wàn)能的,它有足夠的理由能日益流行,但始終無(wú)法接管整個(gè)世界。不過(guò),只要你不斷增加你的機(jī)器學(xué)習(xí)技能,你的飯碗無(wú)憂。但也不要對(duì)深度框架過(guò)于崇拜,不要害怕對(duì)這些框架進(jìn)行裁剪和調(diào)整,以得到和你的學(xué)習(xí)算法能協(xié)同工作的軟件框架。未來(lái)的Linux內(nèi)核也許會(huì)在Caffe(一個(gè)非常流行的深度學(xué)習(xí)框架)上運(yùn)行,然而,偉大的產(chǎn)品總是需要偉大的愿景、領(lǐng)域的專業(yè)知識(shí)、市場(chǎng)的開(kāi)發(fā),和最重要的:人類的創(chuàng)造力。
其他相關(guān)術(shù)語(yǔ)
1)大數(shù)據(jù)(Big-data):大數(shù)據(jù)是個(gè)豐富的概念,例如包含大量數(shù)據(jù)的存儲(chǔ),數(shù)據(jù)中隱含信息的挖掘等。對(duì)企業(yè)經(jīng)營(yíng)來(lái)說(shuō),大數(shù)據(jù)往往可以給出一些決策的建議。對(duì)機(jī)器學(xué)習(xí)算法而言,它與大數(shù)據(jù)的結(jié)合在早幾年已經(jīng)出現(xiàn)。研究人員甚至任何一個(gè)日常開(kāi)發(fā)人員都可以接觸到云計(jì)算、GPU、DevOps和PaaS等等這些服務(wù)。
2)人工智能(Artificial Intelligence):人工智能應(yīng)該是一個(gè)最老的術(shù)語(yǔ)了,同時(shí)也是最含糊的。它在過(guò)去50年里經(jīng)歷了幾度興衰。當(dāng)你遇到一個(gè)說(shuō)自己是做人工智能的人,你可以有兩種選擇:要么擺個(gè)嘲笑的表情,要么抽出一張紙,記錄下他所說(shuō)的一切。
延伸閱讀:原作者2011的博客:“ 計(jì)算機(jī)視覺(jué)當(dāng)屬人工智能 ”。
結(jié)論
關(guān)于機(jī)器學(xué)習(xí)的討論在此停留(不要單純的認(rèn)為它是深度學(xué)習(xí)、機(jī)器學(xué)習(xí)或者模式識(shí)別中的一個(gè),這三者只是強(qiáng)調(diào)的東西有所不同),然而,研究會(huì)繼續(xù),探索會(huì)繼續(xù)。我們會(huì)繼續(xù)構(gòu)建更智能的軟件,我們的算法也將繼續(xù)學(xué)習(xí),但我們只會(huì)開(kāi)始探索那些能真正一統(tǒng)江湖的框架。
如果你也對(duì)深度學(xué)習(xí)的實(shí)時(shí)視覺(jué)應(yīng)用感興趣,特別是那些適合機(jī)器人和家居智能化的應(yīng)用,歡迎來(lái)我們的網(wǎng)站 vision.ai 交流。希望未來(lái),我能說(shuō)的再多一點(diǎn)……
作者簡(jiǎn)介:Tomasz Malisiewicz,CMU的博士,MIT的博士后,vision.ai的聯(lián)合創(chuàng)始人。關(guān)注計(jì)算機(jī)視覺(jué),在這個(gè)領(lǐng)域也做了大量的工作。另外,他的博客也富含信息量和價(jià)值,感興趣的可以瀏覽他個(gè)人主頁(yè)和博客。
關(guān)鍵詞: 深度學(xué)習(xí) 機(jī)器學(xué)習(xí) 人工智能
您可能也感興趣:
今日熱點(diǎn)
為您推薦
8家險(xiǎn)企股權(quán)被掛牌轉(zhuǎn)讓,為何險(xiǎn)企股權(quán)不再被追捧?
深圳最低工資標(biāo)準(zhǔn)調(diào)整為2360元/月 失業(yè)保險(xiǎn)金為2124元/月
遼寧實(shí)施失業(yè)保險(xiǎn)省級(jí)統(tǒng)籌 對(duì)缺口核定等作出詳細(xì)規(guī)定
更多
- 重慶:激發(fā)人才創(chuàng)新活力,到2025年創(chuàng)新要素活躍度顯著增強(qiáng)
- 西寧加快知識(shí)產(chǎn)權(quán)強(qiáng)市建設(shè)步伐 去年兌現(xiàn)資助資金200萬(wàn)元
- 無(wú)錫錫山區(qū)全面啟動(dòng)實(shí)施“雙招雙引” 引進(jìn)高端創(chuàng)新資源
- 重慶巴南區(qū)落實(shí)創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略 以科技創(chuàng)新引領(lǐng)五大產(chǎn)業(yè)集...
- 朝陽(yáng)北票經(jīng)開(kāi)區(qū)加快推進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展 推動(dòng)體制機(jī)制創(chuàng)新
- 湖北省先進(jìn)低碳冶金產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)合體組建 打造五千億級(jí)產(chǎn)...
- 重慶渝北將優(yōu)化創(chuàng)新生態(tài)環(huán)境 培育打造一批引領(lǐng)型的科創(chuàng)載體
- 南昌經(jīng)開(kāi)區(qū)高度重視科創(chuàng)平臺(tái)的建設(shè)工作 大力引進(jìn)各類創(chuàng)新創(chuàng)...
更多
- 山東抓投資抓項(xiàng)目 新興領(lǐng)域投資規(guī)模持續(xù)擴(kuò)大
- 2021年各地引資成績(jī)單亮眼 迸發(fā)出巨大經(jīng)濟(jì)活力
- 多地重大項(xiàng)目投資規(guī)模力度明顯加大 新基建項(xiàng)目成重要發(fā)力點(diǎn)
- 年內(nèi)湖北新開(kāi)工城建項(xiàng)目160個(gè) 集中在道路交通等方面
- 去年我國(guó)對(duì)外投資合作平穩(wěn)發(fā)展 境外經(jīng)貿(mào)合作區(qū)建設(shè)成效顯著
- 荊州集中簽約39個(gè)項(xiàng)目 重點(diǎn)涵蓋高端裝備制造、電子信息等領(lǐng)域
- 廣東打出一系列穩(wěn)外貿(mào)政策“組合拳” 外貿(mào)逆勢(shì)創(chuàng)新高
- 蘭州新區(qū)再獲“最具投資吸引力新區(qū)” 去年新增市場(chǎng)主體5427戶
排行
最近更新
- 去年快遞服務(wù)全程時(shí)限水平有較大提升 干線運(yùn)輸時(shí)限縮短
- 住建部:推動(dòng)長(zhǎng)江經(jīng)濟(jì)帶高質(zhì)量發(fā)展,打造區(qū)域協(xié)調(diào)發(fā)展新樣板
- 江蘇發(fā)布重大項(xiàng)目清單 增資擴(kuò)產(chǎn)項(xiàng)目明顯增多
- 山東抓投資抓項(xiàng)目 新興領(lǐng)域投資規(guī)模持續(xù)擴(kuò)大
- Gucci在2月將投放 10 個(gè)“SuperGucci”NFT
- 美國(guó)銀行:美國(guó)CBDC將保持美元作為世界儲(chǔ)備貨幣的地位
- 美股三大指數(shù)尾盤(pán)集體轉(zhuǎn)漲
- 光伏發(fā)電概念股有哪些?光伏發(fā)電概念龍頭股一覽
- The new iPad屏幕對(duì)比評(píng)測(cè)
- 電源接通延時(shí)器
- 汽車電子穩(wěn)定系統(tǒng)(ESP)詳解
- 聯(lián)想B520一體機(jī)拆解
- 焦炭相關(guān)股票有哪些?焦炭概念股票龍頭一覽
- 增強(qiáng)信號(hào) 3G無(wú)線上網(wǎng)卡改裝拆解全攻略
- 盤(pán)點(diǎn)全球五大智能手機(jī)生產(chǎn)商 華為聯(lián)想入圍
- 三星新平板 Galaxy Note 10.1全拆解
- 智能監(jiān)控防盜報(bào)警系統(tǒng)
- 格力電器未來(lái)三年股東回報(bào)規(guī)劃:每年累計(jì)分紅不低于當(dāng)年凈利潤(rùn)50%
- 消息稱京東科技計(jì)劃2022年在港IPO,募資10億至20億美元
- 恒大集團(tuán):呼吁境外債權(quán)人不采取任何激進(jìn)的法律行動(dòng)
- 海航董事長(zhǎng)劉璐因個(gè)人原因辭職,在海航已近28年
- 青青稞酒預(yù)計(jì)2021年?duì)I收增長(zhǎng)30%-40%,四季度凈虧損超1500萬(wàn)
- 2022年在港上市募資10億美元?京東科技:不予置評(píng)
- 財(cái)政部修訂出臺(tái)《財(cái)政行政處罰聽(tīng)證實(shí)施辦法》
- 賣房子需要交什么稅?賣房子必須攜帶哪些證件?
- 醫(yī)??ǖ氖褂梅秶心男垦a(bǔ)牙可以使用醫(yī)保報(bào)銷嗎?
- 小產(chǎn)權(quán)房能過(guò)戶嗎?購(gòu)買小產(chǎn)權(quán)房有什么風(fēng)險(xiǎn)?
- 奕東電子的實(shí)際控制人是誰(shuí)?奕東電子股票上市了嗎?
- 百合股份是一家什么公司?百合股份的股票何時(shí)上市?
- 浙江:爭(zhēng)取實(shí)施數(shù)字人民幣試點(diǎn)
今日要聞
- 去年快遞服務(wù)全程時(shí)限水平有較大提升 干線運(yùn)輸時(shí)限縮短
- 住建部:推動(dòng)長(zhǎng)江經(jīng)濟(jì)帶高質(zhì)量發(fā)展,打造區(qū)域協(xié)調(diào)發(fā)展新樣板
- 山東抓投資抓項(xiàng)目 新興領(lǐng)域投資規(guī)模持續(xù)擴(kuò)大
- Gucci在2月將投放 10 個(gè)“SuperGucci”NFT
- 美國(guó)銀行:美國(guó)CBDC將保持美元作為世界儲(chǔ)備貨幣的地位
- 美股三大指數(shù)尾盤(pán)集體轉(zhuǎn)漲
- The new iPad屏幕對(duì)比評(píng)測(cè)
- 電源接通延時(shí)器
- 汽車電子穩(wěn)定系統(tǒng)(ESP)詳解
- 聯(lián)想B520一體機(jī)拆解