《機(jī)器學(xué)習(xí)漸入佳境》由會(huì)員分享,可在線閱讀,更多相關(guān)《機(jī)器學(xué)習(xí)漸入佳境(6頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、機(jī)器學(xué)習(xí)漸入佳境
研究具備自我提升能力軟件的嘗試最早始于 20 世紀(jì) 60 年代,而經(jīng)常被稱之為“機(jī)器學(xué)習(xí)”的技術(shù)仍然基本停留 在學(xué)術(shù)研究階段,只有極少部分進(jìn)入商用市場(chǎng)的邊緣,例如 語(yǔ)音識(shí)別、信用卡詐騙偵測(cè)等領(lǐng)域。如今,專家認(rèn)為隨著更 好的算法、更強(qiáng)性能的計(jì)算機(jī)和更智能的應(yīng)用策略的相繼問 世,機(jī)器學(xué)習(xí)和自我訓(xùn)練軟件技術(shù)將開始進(jìn)入主流應(yīng)用。
贏得 200 萬(wàn)大獎(jiǎng)的機(jī)器學(xué)習(xí)
隨著此類技術(shù)的進(jìn)步和推廣,市場(chǎng)需求也將逐漸看漲。 “在過去,程序員可以針對(duì)一個(gè)問題編寫代碼,再進(jìn)行測(cè)試 和運(yùn)行, 并在以后人工調(diào)試和改進(jìn), 如此反復(fù)進(jìn)行循環(huán)測(cè)試, 美國(guó)斯坦福大學(xué)人工智能實(shí)驗(yàn)室主管 Sebastian T
2、hrun 教授說,
“這樣的問題在于, 軟件將變得越來(lái)龐大, 越來(lái)越難以管理。 由此產(chǎn)生了一種趨勢(shì),即讓軟件具備自動(dòng)調(diào)節(jié)和適應(yīng)能力, 這將是未來(lái)計(jì)算領(lǐng)域發(fā)生的一項(xiàng)重大革命。 ”
在美國(guó)國(guó)防部高級(jí)研究計(jì)劃署 (Defense Advanced
Research Projects Agency最近主持展開的一項(xiàng)競(jìng)賽中, Thrun 教授通過采用幾種新的機(jī)器學(xué)習(xí)技術(shù)的軟件,來(lái)驅(qū)動(dòng)一輛汽 車在沙漠中自動(dòng)駕駛了 132 英里的路程,從而為斯坦福大學(xué) 贏得了 200 萬(wàn)美元的獎(jiǎng)金。在新技術(shù)的幫助下,這輛汽車能 識(shí)別并記憶它所行駛過的路面特征。機(jī)器學(xué)習(xí)技術(shù)還使 Thrun 教授的研究團(tuán)隊(duì)極大地提高了工
3、作效率,據(jù)說他在過 去需要花半個(gè)月來(lái)完成的人工編程工作,現(xiàn)在只需要一天時(shí) 間就能讓軟件自動(dòng)完成。
讓軟件訓(xùn)練軟件
卡耐基 . 梅隆大學(xué)的自動(dòng)學(xué)習(xí)和探測(cè)中心主管 Tom Mitchell 說,對(duì)人類而言很容易完成的一些任務(wù) (例如語(yǔ)音和 圖像識(shí)別 ),要交給計(jì)算機(jī)來(lái)處理往往有較大的難度, 因?yàn)楹?難用軟件規(guī)則來(lái)將這些任務(wù)解釋和交代清楚,但機(jī)器學(xué)習(xí)技 術(shù)的運(yùn)用可以明顯改善這種情況。在機(jī)器學(xué)習(xí)技術(shù)的應(yīng)用案 例中,經(jīng)由人工編寫和標(biāo)記的測(cè)試平臺(tái)來(lái)“訓(xùn)練”軟件,并 分析和記錄軟件運(yùn)行結(jié)果的對(duì)或錯(cuò),不斷對(duì)其進(jìn)行校正,最 終將成熟的軟件派發(fā)出去解決現(xiàn)實(shí)中的問題。
為了試驗(yàn)這種概念, Mitchell 用
4、兩種學(xué)習(xí)算法來(lái)相互進(jìn) 行基本訓(xùn)練,以讓二者共同工作的效果好于單獨(dú)使用其中一 種。例如,一種搜索引擎算法通過分析網(wǎng)頁(yè)上的詞語(yǔ)來(lái)對(duì)其
進(jìn)行分類,而另一種算法則分析指向該頁(yè)面的超鏈接中的詞 語(yǔ),這兩種算法共享對(duì)同一個(gè)頁(yè)面的分析線索,并匯集出更 準(zhǔn)確的分析報(bào)告。試驗(yàn)結(jié)果表明,這種聯(lián)合訓(xùn)練方案能明顯 降低錯(cuò)誤率。它所取得的突破是:軟件的訓(xùn)練平臺(tái)不是由人 工編寫的,而是由另一種軟件完成的。
填補(bǔ)人工編程的盲區(qū)
加州大學(xué)伯克利分校的 Stuart Russell 教授正在試驗(yàn)一些 編程語(yǔ)言,程序員們經(jīng)常用它們來(lái)為某些任務(wù)編寫代碼,這 些任務(wù)很容易理解和編碼,但也容易產(chǎn)生許多無(wú)法處理的盲 區(qū)和縫隙。為了
5、填補(bǔ)這些縫隙,該試驗(yàn)引進(jìn)了諸如人工神經(jīng) 網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)技術(shù)。
Russell已經(jīng)將其“局部編程”概念運(yùn)用在一種稱之為
Alisp(Lisp 語(yǔ)言的擴(kuò)展 )的語(yǔ)言中?!芭e例來(lái)說其原理:如果我 想告訴你如何到達(dá)機(jī)場(chǎng),但我手上沒有地圖,哪該怎么辦 呢?” Russell 說,“我將編寫一個(gè)程序,告訴計(jì)算機(jī)來(lái)如何 到達(dá)目的地:‘沿著這條街持續(xù)走下去,穿過所有的路口, 直到在一個(gè)斜坡處進(jìn)入高速公路。在高速公路上一直走到有 機(jī)場(chǎng)出口的路牌處, 下了高速再駛?cè)肫胀ń值溃?直到機(jī)場(chǎng)。 在這個(gè)流程的編碼過程中,將會(huì)產(chǎn)生大量無(wú)法處理的縫隙, 但它仍然將是個(gè)非常有用的導(dǎo)航軟件。 ”在每個(gè)縫隙處,程 序員都會(huì)指定
6、相應(yīng)的學(xué)習(xí)算法, 但 Russell 的研究目標(biāo)是有朝 一日讓系統(tǒng)在每個(gè)縫隙處自動(dòng)選擇最佳的算法。
已經(jīng)商用的機(jī)器學(xué)習(xí)技術(shù)
計(jì)算技術(shù)對(duì)機(jī)器學(xué)習(xí)自然化的提升,激發(fā)了紐約州立大
學(xué)Yann LeCun教授的靈感,他發(fā)明了一種稱之為“回旋網(wǎng)絡(luò)”
的人工神經(jīng)網(wǎng)絡(luò)系統(tǒng),據(jù)稱它與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)相比,能用 更少的資源和工作量來(lái)更好地完成圖像識(shí)別等任務(wù)。通過大 量的神經(jīng)網(wǎng)絡(luò),軟件必須接受數(shù)量龐大的不同情況下的訓(xùn)練, 以讓其適應(yīng)多種不同情況――目標(biāo)的不同位置和不同大小、 不同的視角和背景等等,而這是項(xiàng)艱巨的挑戰(zhàn)。
LeCun發(fā)明的技術(shù)如今已被用于銀行門禁中的模式識(shí)別 閱讀器和機(jī)場(chǎng)的監(jiān)視系統(tǒng),它將監(jiān)測(cè)目
7、標(biāo)的每個(gè)圖像分解成 小塊區(qū)域 (例如鼻子、眼睛等 ),然后再拼接起來(lái),生成高水 平的特征信息, 這種系統(tǒng)更加靈活, 并且減少了訓(xùn)練的次數(shù)。
軟件也可“物競(jìng)天擇”
與此同時(shí),研究還推進(jìn)了機(jī)器學(xué)習(xí)的一個(gè)分支一一基因 編碼學(xué)(Genetic Programming , GP)的發(fā)展,這種技術(shù)讓軟件
的發(fā)展遵循像達(dá)爾文的生物進(jìn)化論一樣的規(guī)律。事實(shí)上,對(duì) 同一種問題的解決,往往會(huì)有多個(gè)不同版本的程序,甚至?xí)?同時(shí)出現(xiàn)成百上千個(gè)版本,而這很容易讓人們混淆。其中的 絕大多數(shù)是比較弱的,但進(jìn)化程序?qū)钠渲羞x擇兩個(gè)最優(yōu)的 出來(lái),并將二者組合成更優(yōu)秀的新一代程序。在沒有人工參 預(yù)的情況下,這種進(jìn)化過程將持續(xù)
8、進(jìn)行數(shù)百代,并且每次都 使程序得到優(yōu)化和提升。
斯坦福大學(xué)的電子工程學(xué)教授 John Koza是GP研究的先
驅(qū),他用這種概念來(lái)設(shè)計(jì)電路、控制器、光學(xué)系統(tǒng)和天線等 設(shè)備,結(jié)果與那些取得專利的傳統(tǒng)設(shè)計(jì)方法等效或優(yōu)于后者。 他完全用GP創(chuàng)建的一個(gè)控制器設(shè)計(jì)最近還獲得了一項(xiàng)專利。
不過,有點(diǎn)像生物進(jìn)化過程一樣, GP的研究進(jìn)展非常緩 慢。即使到了計(jì)算機(jī)速度超前發(fā)展的當(dāng)前, GP在解決復(fù)雜問
題的過程中所用得上的計(jì)算資源仍然是杯水車薪。在那項(xiàng)專 利設(shè)計(jì)工作中,Koza教授在他的筆記本電腦上所做的工作量 只有幾個(gè)小時(shí), 而完成控制器設(shè)計(jì)的 GP 進(jìn)程則在由 1000 個(gè) Pentium 處理器節(jié)點(diǎn)組成的集群環(huán)境下持續(xù)了 1 個(gè)月之久。
“我們從20世紀(jì)80年代后期開始了 GP研究,現(xiàn)在我
們所獲得的計(jì)算能力將比那時(shí)強(qiáng) 100萬(wàn)倍” ,Koza說,“預(yù)計(jì)
再過 10 年左右,我們的研究成果將在實(shí)際的工程設(shè)計(jì)領(lǐng)域 發(fā)揮作用?!?