和許多新生事物一樣,人工智能(AI)近期的發展同樣經歷了一些起伏和波折。在前不久舉行的一場被廣泛認為是人工智能領域里程碑事件的人機對弈比賽中,人工智能取得了對人類前世界冠軍的勝利。然而也就在一周之前,在國外社交網站推特上一個旨在通過與真實的人類進行對話并能夠從中學習的“聊天機器人”卻因為網民們的惡意調侃而迅速“學壞”,很快變得滿嘴污言穢語,還充斥著種族主義思想,以至測試方只能趕忙將它下線處理。
這些事情究竟是如何發生的?它們對于迅速發展中的人工智能領域研究將產生什么樣的作用?
在今年3月初,由谷歌公司設計的圍棋對弈系統“阿爾法狗”擊敗了韓國的前圍棋世界冠軍李世石。圍棋對弈的復雜性被認為遠超國際象棋,因此在此之前常常被研究人員用來評估人工智能能夠達到的水平高度。而在谷歌的“阿爾法狗”亮相之前,大部分專家都認為人工智能如果想要在圍棋領域擊敗人類頂尖水平選手恐怕還需要數十年時間的發展。
但就在這場里程碑式的勝利之后不久,微軟公司推出了一款名為“Tay”的推特線上聊天機器人,其設計能夠模仿一名19歲的美國少女。推特用戶可以與Tay在線聊天,微軟公司表示Tay能夠通過這樣的對話學習真實人類的說話方式并不斷完善自己,并更好地與人類交流。但就在Tay上線之后僅僅16小時之后,微軟就不得不將其緊急下線處理,因為這款聊天機器人開始頻繁爆出粗口,其中不乏種族歧視、侮辱女性以及污穢不堪的詞句。在緊急下線之后微軟公司很快就此事向公眾表達了歉意,同時指責這一事件是一次“針對這一技術探索項目”的“薄弱點”所開展的“有組織的攻擊”。
不過盡管微軟公司將這一令人失望的狀況歸結為黑客攻擊行為。但人工智能專家,美國康奈爾大學的計算機科學教授巴特·賽爾曼(Bart Selman)博士則認為,微軟所稱的這種所謂“技術薄弱點”似乎更像是一種過濾機制的缺陷,那就是Tay往往傾向于直接獲取別人對她說過的詞匯并為自己所用,而在此過程中并不加以適當的過濾。賽爾曼博士表示,他對此感到非常驚訝,因為微軟竟然沒有建立足夠有效的安全措施來防止此類事件的發生,但他也表示,這一事件凸顯了人工智能領域目前所面臨的一大弱點:語言能力。
教授AI
賽爾曼博士表示,人工智能非常擅長句子解構,它們能夠找出隱藏在文字背后的語法模式。這種能力讓Tay這樣的聊天機器人能夠創建出一種符合人類語言語法習慣的句子。這種能力也正是谷歌和Skype軟件翻譯功能背后的技術基礎。但是賽爾曼同時也指出:“但說到對于語句意義的理解就是另外一回事了。”
近幾年來人工智能的迅速發展在很大程度上得益于一種被稱之為“深度學習”的技術的進步,這項技術可以說在某些地方模仿了人類大腦內神經系統的運作模式。當輸入海量信息時,它非常擅長從中找出某種模式,這也解釋了為何人工智能領域近幾年來一些最成功的突破都發生在知覺任務領域,如圖像或語音識別等方面。
英國牛津大學計算機科學系助理教授西蒙·威特森(Shimon Whiteson)指出,傳統技術方法中,研究者必須“告訴”人工智能去看什么,它們才能去學習。而相比之下,深度學習的優勢就在于這類系統能夠自動發現其中的模式。
人工智能的決策網絡第一層被設計用于在數據中識別一些最基本的模式,比如圖像中某個物體的邊界。隨后這一結果被輸入到第二層決策網絡,后者將繼續搜尋更為復雜的模式,如方形或者圓形。這一過程不斷遞進迭代,每一層決策網絡都能夠識別比上一層更加復雜的模式,于是隨著時間推移,人工智能的模式識別能力不斷提升,比如它能夠借助低層次決策網絡得到的機構外觀信息最終準確地鑒別出一些物體,如一輛汽車或是一輛自行車。
威特森表示:“借助深度學習技術,你能夠將海量數據輸入一個大型神經網絡,然后它自己就能完成從頭到尾的自我訓練。”
巨大的回報
這一技術的發展已經產生了一些擁有超人般能力的人工智能。賽爾曼表示深度學習系統已經被證明能夠在醫學核磁共振影像判讀方面超越人類專家。另外還有一種技術被稱為“增強學習”(reinforcement learning),該技術主要原理是機器通過獎勵信號來不斷修正自己的最優策略并不斷進步的技術方法。加拿大人工智能初創公司“Maluuba”的首席技術官兼聯合創始人卡希爾·蘇勒曼(Kaheer Suleman)表示,當將深度學習與增強學習兩者相結合,機器還能夠進行精確的虛擬仿真。谷歌公司的人工智能系統“阿爾法狗”正是通過自己與自己對弈超過數百萬局,并不斷總結這些對弈中學習到的方法,提升自己的技術與策略,從而迅速成為水平甚至能夠擊敗人類最頂尖大師的圍棋專家。
蘇勒曼表示:“人工智能面臨的重大挑戰還在于那些缺乏大規模標記數據集的領域,或者難以對相關環境進行較好模擬的領域。”他說:“語言就是這種領域的一個很好例子。互聯網上包含有無窮無盡的網頁,但上面全都是文字,沒有一個地方找得到以機器能夠理解的形式所書寫的關于這些文字‘意思’的內容。”
“Maluuba”公司目前正致力于開發一種算法,其能夠閱讀文字并回答關于這段文字的問題,但蘇勒曼表示語言的一些特點讓這項工作變得尤其困難。僅舉一例,語言的復雜性難以想象——某一段文字可以有不同深度上不同的意思,其中的每一個字、每一個詞和每一句句子都有著各自的含義。這些不同的含義可以相互組成成近乎無限多的組合,而且不同的人使用語言的方式和風格又不一樣。
除此之外,所有的語言都是抽象的:文字只是真實世界中事物的抽象標記,而所有這些真實世界中的事物對于機器來說都是它從未經歷過的。威特森表示:“從機器學習的角度來看,學習完成后的機器水平也不過是和你輸入其中的數據量所能提供的信息相當。”
由于缺乏對真實世界的體驗數據以及人類社會已經積累起來的數量巨大的社會互動經驗,很容易理解為為何微軟公司的聊天機器人Tay無法很好地理解什么是“Holocaust”(大屠殺),以及為何否認它是一種不合適的行為。
未來發展
但盡管面臨這樣或是那樣的挑戰,Maluuba公司在上個月在論文預印本網站arXiv上貼出一篇論文,描述了該公司目前開發出的一款智能系統已經能夠以大約70%的正確率閱讀一篇它不熟悉的文章,并回答關于這段文章的多選題。這樣的準確率水平已經超出同類其他系統最高水平15%以上。Maluuba公司研究人員所采用的技術方法結合了深度學習與神經網絡結構,通過這兩者之間的相互作用輸出非常初級的推理結果。這家公司目前同樣還致力于機器語音對話系統的開發,其設計目標是能夠非常自然流暢地介入與人類之間的正常對話。
賽爾曼表示,未來在一些主題內容較為有限的領域,側重語言能力的人工智能將擁有極大的應用前景。比如說一些技術支持熱線在未來可能就將逐漸由人工智能代替,另外一些常規性的管理崗位,其職責主要就是升級一些表格并發送一些格式化的郵件,那么這樣的工作就很可能可以由人工智能代替,并且它們或許可以做的更好。
賽爾曼說:“而在一些不受控制的,非常開放環境下的設置中,履行任務將需要借助人類智力的多種維度,并且需要你真正理解他人。在這樣的領域,人工智能就會出現非常明顯的局限性。”
但威特森也指出,即便在這些方面,進步仍然是明顯的。比如谷歌公司正在開發的全自動無人駕駛汽車就是一個很好的例子。與真實的人類駕駛員所駕駛的車輛在同一條公路上行駛,計算機所需要掌握的顯然并不僅僅是交通法規,它還需要能夠理解并遵循一些不成文的社會準則并在避讓碰撞風險時應對一些道德層面的兩難問題。
正如人工智能和機器人領域的技術進展大大增加了真實世界中機器的使用量一樣,機器與人類的自然互動也將不再只是停留在科幻領域。研究人員目前正在尋找新的途徑來幫助機器不僅能夠感知,還能夠理解它周圍的世界。
威特森表示:“深度學習是一項偉大的技術,但它并非萬能。還有很多事情有待完善,因此自然而然的下一步,也就是人們目前正在做的事情就是,如何在深度學習中加入更多的東西,從而使它能夠具備更多功能。”他說:“現在所有這些問題,包括我們需要機器做些什么,以及我們如何教會它們去做這些事,因為這些事具有現實的重要性,因此人們現在對它們更加重視了。”