人工智能的主題演講稿

欄目: 人工智能 / 發佈於: / 人氣:1.19W

我在的部門在百度叫做深度學習實驗室，這是2013年的時候在百度成立的專注於深度學習的實驗室，應該是全世界在工業裏面第一個專注於深度學習研究的實驗室。我今天要和大家分享的首先是看一下最近幾年來人工智能在圖像語言方面的最新的進展，以及分享一下我對人工智能目前它缺少的東西，以及以後我們未來可以去繼續工作的方向。

人工智能這個概念最近幾年非常火，我們看到人工智能傳統的一些研究方向，像計算機視覺，還有語音識別，這些方面在最近幾年都有了過去幾十年不可想象的巨大進展。尤其是上個月Googel的AlphaGo和李世石下的那盤棋以後，更是激起了大家對人工智能高度的熱情。為什麼人工智能在最近幾年有快速的發展呢?一個最重要的原因就是我們通過了幾十年的積累，我們現在已經有了非常可觀的計算能力，同時在這個計算能力的基礎上，可以在一個可接受的時間內處理大數據。我們最近幾年因為深度學習的發展，給我們提供了一個非常靈活的，非常具有建模能力的學習系統，正是因為這兩者的結合，它能夠把我們大數據後面藴藏各種豐富複雜的關係，能夠把它提取出來。從而成為我們人工智能快速前進的巨大推動力。

因為看到深度學習的巨大潛力，百度也投入了非常多的力量來開發一個深度學習的訓練和運算平台。這個平台叫做PADDLE。那它的目的就是為了把深度學習更好的應用到百度的各種產品裏面去，讓它更方便的，更好的提高我們的用户體驗，提高智能度。我們這個深度學習的平台能支持各種豐富的數據類型，比如説像二維圖像數據，或者是詞的訓練數據，尤其像工業界非常重要的上千億的稀疏數據，也能非常有效的支持。

另外也提供了非常靈活的建模表達能力，能非常方便地根據他應用的需求，配置出不同的深度學習的模型。比如説一個循環網絡，或者是處理圖像的卷積網絡，任何靈活的組合都可以在我們這個平台上面很方便的配置出來。

因為在百度我們有非常大量的運算資源，為了能夠充分的應用我們的運算資源，我們這個平台也非常高效的進行多機的訓練，這樣也能很有效的處理我們的大量的數據。

因為有了這麼一個非常高效，非常靈活的計算深度學習的平台。百度最近幾年把深度學習運用到了產品的方方面面。比如説核心的搜索和廣告這樣的產品，還有可能不太想到的，像數據中心的智能控制，病毒的查殺，這種產品裏面我們都成功的把深度學習應用到上面去，提高我們產品的體驗。

隨着深度學習的逐步在各種人工智能問題裏面的更深入的使用，我們現在開始看到機器在一些很特定的感知問題上，它的能力已經在逐漸接近甚至超過了人類的水平。比如語音識別，我們百度的語音搜索，在比較短的文字，和上下文沒有太大關係的語音識別這種任務，我們百度的語音識別系統做到明顯比人好的程度，錯誤率不到6%，而人的任務上的錯誤率可以是接近了10%。因為實際上在沒有上下文關係的情況下，這是非常難的任務。

還有另外一個例子就是人臉識別，也是隨着深度學習的使用，人臉識別這個東西也是最近幾年有了非常大的提升。人臉識別一個最核心的任務，就是給兩幅圖，你要判斷是否來自同一個人，包括百度在內的很多公司還有研究團體，都取得了明顯比人好的水平。能看到我們的機器錯誤率現在非常低，只有0.23%，而人的任務率是0.8%，現在已經不及機器了。

還有像其他一些圖像識別的任務，在最近幾年也都有了非常快速的進步。比如説細粒度圖像識別，在一類物體裏面我們還要區分它子類，比如説在狗裏面要區分各種不同的狗。這樣的任務實際上是比更普通的物體識別更難，因為要對物體細緻的特徵有區分。這樣一個任務上在2013年的時候，我們最好的系統錯誤率都還是50%，到了2015年錯誤率就降到20%，可到今年最新的結果錯誤率就降到10%幾。像這種細粒度的物體是別人是很困難的，人是很難認識200多種狗的。

下面我們談一些語言方面用深度學習的進展。我們知道其實語言是人類智力的核心的體現。我們是用深度學習的思想來處理語義理解的任務。傳統在語義理解的任務裏面，基本上是要分好幾步走的過程。首先要通過詞法解析、語法解析，然後構造各種人為的特徵，然後得出語義分析的結果。深度學習的理念就是端到端的，從最原始的數據開始的，這裏就是一個詞的序列開始的，我們不考慮任何的人為的特徵構建，就直接用一個完整的模型，得出我們想要的結果。我們人對這個問題的理解，主要是體現在我們模型的結構當中。這樣的思想，過去幾年在圖像識別、語音識別裏面都給他們帶來了巨大的提升。我們在語音理解這樣的任務裏面，也做到了比傳統方法好的結果。

另外一個非常好的，端到端的深度學習，在自然語言處理裏面非常成功的應用，就是機器翻譯。端到端的機器翻譯的做法，是2014年的Google首次提出來了，因為是一個新方法，大家認為很有潛力的。但是剛提出來的時候還是比傳統的方法有明顯的差距。但僅僅過了一年以後，就能夠達到了傳統方法的質量。今年的結果已經比傳統的方法好了。一旦我們用好了以後，就可以對它各種效果有非常快速的提升。

除了語言其實最近和語言相關的比較熱點的研究方向，就是把語言理解還有圖像識別，語言生成這些傳統的人工智能比較隔離的研究方向，有機的組合起來，用一個完整的深度學習模型來處理。通過這樣的一個整體的模型，我們機器就可以比較更自然的學到語言和它感知到的物理世界的聯繫。

像這樣的統一的視覺語言統一的模型，我們有一些例子。第一個就是看圖説話，給了圖以後，説出一個非常自然的描述，“一輛火車沿着森林間的鐵軌駛過”。也可以對圖像的自然語言的提問，給出一個合適的答案。甚至也可以理解視頻，看到一段視頻以後也可以給對這個視頻做出描述。這個工作我們在百度是屬於比較早的開始，現在也有很多研究機構在做這樣的視覺和語言統一的研究。

深度學習最近還有一個事，就是現在向更深的模式發展。在去年圖像識別比賽上面，我們看到獲獎最好的一個模型是微軟開發的深度達到150多層的深度模型。另外我們在翻譯上也發現，隨着模型深度的不斷加深，翻譯效果也是變得越來越好。

深度學習最近還有另外一些研究的熱點，就是所謂的推理、注意力、記憶，這方面是偏向於人類認知能力的，希望把這樣的一些機制能放在深度學習能力模型裏面來。特別是在這裏面注意力這樣的機制，在一些實際的應用裏面也取得了非常好的效果，比如細粒度的圖像識別，或者翻譯的任務。像記憶的機制，現在還是比較初期的階段。

深度學習給AI帶來了快速的進展，但我們還有很多的路要走。人工智能這個概念是1955年的時候John McCarthy提出的，同時還有3位重量級的研究人物。他們説了要用10個月花兩個月時間，對人工智能做一個非常巨大的進步，實際上我們現在看到他這個是遠遠低估了人工智能的難度。現在的人工智能還有很多的缺陷，人類智能一個最核心的點就是自我學習和創造的能力，我們看到現在有很多具體的智能的系統，比如説AlphaGo，它還缺乏一種自我學習和創造的能力。比如説來了一個新的棋給他學，還需要大量的人蔘與工作，才可以改造。而人就不需要，人可以自己主動的學習各種新的任務。

最重要的一點就是説現在人工智能還缺少一種從少量標註數據學習的能力，一個例子比如説圖像識別，ImageNet裏每個物體種類有幾百幅圖，一個小孩要認識一種東西可能幾幅圖足夠了。還有英法翻譯的訓練數據，人可能需要幾萬個小時能閲讀完，但如果你是説英語的，掌握法語的話可能只需要幾百小時。所以看到現在的深度學習缺乏少量標註學習的能力。

那麼最核心的一點就是我們需要有對環境的一個非常好的表示，就是説我們需要通過非常大量的數據太能學習出來，非監督學習的機制，才能讓我們有效的利用到大量的非標註的.數據，進行非監督學習方式的一個最行之有效的方法，就是用它來預測未來。我們知道預測未來的能力是人智力的核心體現。比如説物理學是一個對簡單系統的預測，人類的智力包括機器學習，是一個複雜系統的近似預測。如果我們通過這種預測未來的學習方式，就可以有效的掌握環境的規律，所以得到有效的表示。

我們現在的人工智能系統缺乏常識，剛才李院士也講了很多的自動車，我們在座的很多人開車可能開幾百公里就非常好了。但大家知道我們現在最好的Google的自動駕駛車，現在已經開了超過了200多萬公里，但既使是這樣，現在還是不能夠去駕車。最核心的問題是缺乏一種像人這樣的常識，就是説它遇到很多路況對人是非常簡單的，人看到就知道怎麼做。但機器缺乏常識性的理解，就只能通過人一條一條把每種路況導入系統裏去。要想解決這樣的問題，我覺得有效的方式就是放到真實的環境裏面學習，像這樣的概念最近在Facebook和微軟也提出了這樣的想法，他們提出創造一個虛擬的模擬環境，讓人工智能體在這個環境中自己去探索，然後就可以在這樣和環境的交互中，就能比較有效的建立它常識一樣的東西。

還有另外一個主要的侷限之處，就是通過數據來學習。我們現在所有的東西首先要考慮蒐集數據。我們人來學習，比如説要區分這樣兩種不同的鳥，需要收集大量的數據，從數據裏面自動總結出規律出來。實際上我們人會告訴他，可以看到這兩個圖的區別，人可以用非常精煉的語言告訴其他人。而現在的機器學習還非常缺少有效的能夠利用人的知識的途徑。

我認為如果要解決這樣的問題，我們需要把語言作為機器學習系統一個基礎的能力，否則的話我們就很難做到能夠把人類大量的知識傳遞到機器裏面去，然後同時來説我們需要這個機器能夠理解語言，這樣我們才能夠表達人類的需求，能夠幫助他的理解。旁邊這就是一個電影裏面的人在教機器人來學習讀書。

我們要做真正像人這樣的非常強大的人工智能，可能我們需要從最基礎的東西開始做起。我們需要做的是像幼兒一樣，讓他自主在一個環境裏面去學習感知，學習他的行動的一些基礎的技能，同時把學習語言作為一個最核心的東西，包含在這樣的一個系統裏面。這些就是大概我的分享，我們還有非常多的困難，但是我覺得也給我們帶來非常多的機會，我也希望有更多人和我們一起探索人工智能非常有意思的問題，去創造我們人工智能的未來，謝謝大家。

Tags：演講稿人工智能主題