一個人如何準(zhǔn)確地進(jìn)行機(jī)器學(xué)習(xí)/人工智能的研究?該研究是否基于對算法的開發(fā)和改進(jìn)?還是更專注于將算法應(yīng)用于解決特定的科學(xué)問題?

今年6月,我慶祝兩個杰出成就:我在這個星球上完成了第六個十年,也是我在AI / ML領(lǐng)域進(jìn)行活躍研究和學(xué)術(shù)出版物的第35年。我的第一篇學(xué)術(shù)論文發(fā)表在1985年的IJCAI上,我們剛剛獲悉,關(guān)于將強化學(xué)習(xí)擴(kuò)展到非平穩(wěn)的馬爾可夫決策過程的2020 ICML提交已被接受進(jìn)行演示和出版。在過去的35年中,我在AI和ML上發(fā)表了150多篇論文,這給了我一些回答您重要問題的觀點。

那么,如何進(jìn)行AI和ML研究呢?因此,如何在任何領(lǐng)域進(jìn)行研究?什么是“研究”?它與其他活動(例如,編寫Python編譯器或在汽車中換油)有何不同?

所有基礎(chǔ)研究的核心都是一個問題。最好用一個例子來說明。多年來,我一直以開創(chuàng)性的女性天文學(xué)家塞西莉亞·佩恩·卡波什金(Cecilia Payne-Gaposchkin)的故事作為我為研究生做博士學(xué)位論文的榜樣。在這個博士論文中,很少有研究能像這位杰出的女性一樣重要。

塞西莉亞·佩恩(Cecilia Payne-Gaposchkin)-維基百科

25歲時,她在哈佛大學(xué)的博士學(xué)位論文回答了以下問題:宇宙中最常見的化學(xué)元素是什么?她認(rèn)為這是氫,違背了普遍的科學(xué)智慧,也違背了博士導(dǎo)師的個人觀點,她的論文通過測量證明了自己是對的。las,我的第一篇學(xué)術(shù)論文無法與如此驚人的貢獻(xiàn)相提并論。

將AI和ML與物理學(xué)相提并論可能不公平。畢竟,人工智能和機(jī)器學(xué)習(xí)是更多的工程嘗試,研究人員傾向于構(gòu)建軟件工件來證明某些智能行為,而不是像塞西莉亞那樣發(fā)現(xiàn)宇宙的某些基本特性。但是,任何研究領(lǐng)域的科學(xué)目標(biāo)之間都有廣泛的相似之處。

研究中最重要且被忽略的部分是提出正確的問題。las,沒有人在課程或教科書中教您這一點。教科書包含知識。正如愛因斯坦常說的:

想象力使人們提出正確的問題。在AI和ML中,它們始終構(gòu)成計算算法的形式化形式。我以一個最著名的博士生為例,他于1984年從我的前UMass Amherst實驗室畢業(yè):理查德·薩頓(Richard Sutton)在安德魯·巴托(Andrew Barto)的指導(dǎo)下做了開創(chuàng)性的博士論文,探討了代理商如何學(xué)習(xí)解決“時間分配”問題。他的問題很簡單,但意義深遠(yuǎn):如果您只獲得延遲的反饋,例如在最后才知道的一場比賽中輸贏,那么在不知道最終判決的情況下,您如何在比賽中學(xué)習(xí)如何與對手比賽。

他不是第一個提出這個基本問題的人。IBM的開創(chuàng)性研究人員Arthur Samuel在1959年提出了相同的問題,并提出了第一個ML程序,該程序?qū)W會了在沒有鍵盤或顯示屏的IBM 701電子管上通過自彈奏跳棋的方法,并提出了相同的問題?;蚓幊陶Z言!

塞繆爾(Samuel)和薩頓(Sutton)都研究了相同的問題,時間信用分配和相同的算法,時間差異學(xué)習(xí),但里奇·薩頓(Rich Sutton)通過更深入的分析將TD學(xué)習(xí)的研究推向了新的數(shù)學(xué)高度。值得注意的是,以我的經(jīng)驗,這是史無前例的,Rich在36年后繼續(xù)致力于他的博士學(xué)位論文問題。在我看來,他比其他任何機(jī)器學(xué)習(xí)研究人員都更能舉例說明計算科學(xué)家的理想,他對智能行為的基本問題深感興趣。

因此,人們實際上是如何進(jìn)行ML或AI研究的。最重要的是,您需要熱情和奉獻(xiàn)精神。沒有多余的空間。Rich體現(xiàn)了這種奉獻(xiàn)精神。在過去的36多年中,他每天都在考慮TD學(xué)習(xí)。我保證你比其他任何人都更了解它,甚至包括他的前博士學(xué)位顧問和我的前UMass同事安德魯·巴托(Andrew Barto),我有幸與他共同領(lǐng)導(dǎo)了自主學(xué)習(xí)實驗室超過15年。沒有Rich的見解,Deep Mind在Alpha Go和Atari視頻游戲上使用深度強化學(xué)習(xí)所做的所有出色工作都不可能實現(xiàn)。

另一杰出的博士學(xué)位論文將增強學(xué)習(xí)的研究推向新的高度,由英格蘭國王學(xué)院的克里斯·沃特金斯(Chris Watkins)完成。克里斯的博士論文簡稱為“從延遲獎勵中學(xué)習(xí)”。Chris研究了與Samuel和Sutton相同的問題,但是將TD學(xué)習(xí)與運籌學(xué),動態(tài)規(guī)劃和Markov決策過程聯(lián)系起來至關(guān)重要。他的論文貢獻(xiàn)了基本的Q學(xué)習(xí)算法,這是第一種無模型的最優(yōu)控制方法。這說明了研究的另一個重要組成部分:將思想從一個領(lǐng)域連接到另一個領(lǐng)域。在Watkins博士論文發(fā)表30年后,Q學(xué)習(xí)仍然是強化學(xué)習(xí)中使用最廣泛的算法。在過去的三十年中,已經(jīng)撰寫了成千上萬篇有關(guān)Q學(xué)習(xí)的論文。

最后,我要最后談一談如何進(jìn)行研究。許多科學(xué)家深信簡單的重要性。愛因斯坦說得最好:一切都應(yīng)該盡可能簡單,但不要簡單。這通常被稱為Occam的剃刀。

Q學(xué)習(xí)的一個基本問題是,即使與簡單的線性函數(shù)逼近結(jié)合使用,Q學(xué)習(xí)也不可靠地收斂,更不用說Deep Mind的工程師喜歡使用的龐大的非線性神經(jīng)網(wǎng)絡(luò)了。我對這個問題的研究導(dǎo)致提出了一種新的Q學(xué)習(xí)公式,該理論探索了如何使用優(yōu)化理論中的強大工具(例如近端梯度)為該問題提供新的見解。我的前博士生在2015年的著名AI不確定性(UAI)會議上獲得了Facebook最佳學(xué)生論文獎,這是因為他關(guān)于該問題的論文,這導(dǎo)致了《 AI Research》上更長的期刊文章。

漸近時間差異學(xué)習(xí):具有多項式樣本復(fù)雜度的穩(wěn)定強化學(xué)習(xí)

梯度TD的這種新公式在數(shù)學(xué)上是優(yōu)雅的,但不容易理解。您需要深入了解優(yōu)化算法才能了解算法。不用說,這種復(fù)雜性與薩頓等計算科學(xué)家背道而馳。他提出了一種更簡單的TD公式,稱為TD,在線性函數(shù)逼近下更穩(wěn)定。

這說明了科學(xué)是如何工作的。科學(xué)家不是冷血而是熱情。他們爭論很多。他們持有強烈的意見。愛因斯坦直到臨終之日都拒絕相信量子力學(xué)。他最喜歡的評論是:

他在與量子理論先驅(qū)尼爾斯·布爾(Nils Bohr)的辯論中經(jīng)常這樣說,他最終激怒了愛因斯坦:不要告訴上帝該怎么做!

任何領(lǐng)域的科學(xué)研究最終都是一種精神體驗。對于任何經(jīng)歷過靈感的人來說,那一刻的靈感都是一種提升。一生無休無止的辛勞,終生沒有更好的回報。

我生動地記得大約15年前,當(dāng)時我試圖了解強化學(xué)習(xí)主體如何通過反復(fù)試驗探索其環(huán)境,從而發(fā)現(xiàn)其潛在的對稱性。簡而言之:結(jié)構(gòu)如何從隨機(jī)性中出現(xiàn)?這就是我一直在努力理解的問題。我的解決方案是一個稱為“原型值函數(shù)”的想法,與Q學(xué)習(xí)估計的常規(guī)值函數(shù)不同,它不是從特定于任務(wù)的獎勵中獲得的,而是與任務(wù)無關(guān)的領(lǐng)域幾何結(jié)構(gòu)派生的?;A(chǔ)數(shù)學(xué)使用了拉普拉斯算子的優(yōu)美思想,它被稱為數(shù)學(xué)和物理學(xué)中最美麗的物體。

拉普拉斯算子以其各種表現(xiàn)形式是所有數(shù)學(xué)中最美麗,最中心的對象。概率論,數(shù)學(xué)物理學(xué),傅立葉分析,偏微分方程,李群理論和微分幾何都圍繞著太陽旋轉(zhuǎn),它的光甚至穿透了諸如數(shù)論和代數(shù)幾何之類的晦澀區(qū)域?!薄釥柹瑥埩糠治觥?/span>

其他研究人員以許多有趣且新穎的方式擴(kuò)展了我關(guān)于原型值函數(shù)的ICML 2005論文。Deep Mind和阿爾伯塔大學(xué)的研究人員最近發(fā)表的一篇論文表明,與繼任表示有著很好的聯(lián)系,海馬中存在來自神經(jīng)科學(xué)的證據(jù)。

海馬作為預(yù)測圖

如您所見,數(shù)學(xué),物理學(xué),神經(jīng)科學(xué),人工智能和機(jī)器學(xué)習(xí)有時在研究中完美地結(jié)合在一起,而我很幸運地通過自己的研究看到了這種情況。

為了使故事走到盡頭,研究最終是關(guān)于對美麗和真理的追求,這是許多科學(xué)家的同義詞。沒有人比傳說中的詩人濟(jì)慈更擅長寫這首詩,這首著名的詩作是《希臘頌》。最后的節(jié)激勵了許多科學(xué)家。

約翰·濟(jì)慈的希臘c上的頌詩歌基金會

“美麗是真理,真理是美麗,這就是全部

你們在地球上知道,你們需要知道的一切?!?/span>

寶寶起名 起名

本站所有相關(guān)知識僅供大家參考、學(xué)習(xí)之用,部分來源于互聯(lián)網(wǎng),其版權(quán)均歸原作者及網(wǎng)站所有,如無意侵犯您的權(quán)利,請與小編聯(lián)系,我們將會在第一時間核實并給予反饋。
相關(guān)期刊推薦
湖北農(nóng)機(jī)化

湖北農(nóng)機(jī)化

農(nóng)業(yè)基礎(chǔ)科學(xué) - 省級期刊

中國果菜

中國果菜

合作期刊 - 國家級期刊

數(shù)碼世界

數(shù)碼世界

合作期刊 - 省級期刊

橡塑技術(shù)與裝備

橡塑技術(shù)與裝備

化學(xué) - 國家級期刊

戲劇之家

戲劇之家

合作期刊 - 省級期刊

中國文藝家

中國文藝家

中國文學(xué) - 國家級期刊

文化創(chuàng)新比較研究

文化創(chuàng)新比較研究

合作期刊 - 省級期刊

大眾投資指南

大眾投資指南

合作期刊 - 省級期刊

新農(nóng)業(yè)

新農(nóng)業(yè)

農(nóng)業(yè)綜合 - 省級期刊

大觀

大觀

中國語言文字 - 省級期刊

中國戰(zhàn)略新興產(chǎn)業(yè)

中國戰(zhàn)略新興產(chǎn)業(yè)

合作期刊 - 國家級期刊