還記得電影《盜夢空間》中的“造夢師”嗎?
他們可以制造出多層夢境,把某種意念植入人的大腦,還能從人的夢中竊取情報。
前不久,就有人發明出了一個名叫“XDREAM”的算法,可以通過圖像刺激大腦神經活動,從而控制某些特定神經元。這一次他們的對象,只是猴子。
AI造夢:還原猴子眼中的世界
5月2日,頂級學術期刊《CELL》(《細胞》)發表了一篇論文,哈佛大學的科學家把猴子的大腦與傳感器和神經網絡連接起來,向猴子播放AI系統生成的圖像,采集并分析猴子看到不同圖像時的神經元活動,并根據猴子的反應強度來實時調整和生成新的圖像。
最終的實驗成果顯示,AI系統已經能夠自動生成激活單個腦區的圖像,刺激到猴子大腦的特定神經元(實驗中是識別面部)。
這項研究的特別之處在于,算法生成的圖像,比起對照組中的自然圖像,對腦補神經元的刺激程序更好。換句話說,這些看起來像是真實世界扭曲版本的圖片,可能才是猴子最興奮的畫面。
論文的第一作者卡洛斯·龐斯,在項目中時是哈佛醫學院瑪格麗特·利文斯通實驗室的博士后研究員,現在則是圣路易斯華盛頓大學的一名教師。他表示,使用這個算法工具生成的圖片時,“(猴子大腦的)細胞活躍度提高到了我們前所未見的水平。”
這個圖顯示了自然圖像(右)和猴子神經元進化的圖像(左)
被命名為XDREAM的算法,是由威爾·肖在兒童醫院加布里埃爾·克賴曼實驗室開發的,并得到了美國國立衛生研究院和國家科學基金會的資助,這是第一次在真實的神經元上進行測試。
它對一系列圖像進行變異與重新組合,變成了一堆奇怪的東西,比如穿著外科手術服的熟人、動物房間里的漏斗……和人類夢境中奇怪的事物有點異曲同工之妙。
XDREAM生成的圖片更像是神經元之間相互溝通所使用的語言,有的東西甚至根本不存在。難怪作者龐斯說,“如果細胞會做夢,那么這些可能就是細胞夢見的景象。”
GAN再立新功,
繪制夢境有何難?
系統生成的圖像比真實的事物更讓猴子感到興奮,這項發現能夠帶來哪些想象空間?
想要回答這個問題,我們可能需要再往前一步,先探尋視覺神經元的底層機理。
腦科學領域的研究者們已經通過無數神經元測試實驗證明了,大腦視覺神經元會對某些圖像反應更強烈,這種“不均衡響應”使我們能夠在茫茫人海中被某些特定形狀、顏色或輪廓所吸引,從而快速識別出那些特別的事物,比如在火車站找到熟人,高速路旁的廣告牌文字等等。
但是,視覺神經元究竟是如何對這些特定事物產生反應的,至今仍然是一個謎。
以往,在研究視覺神經元偏好的研究中,人們往往會使用真實存在的圖像。這就帶來了兩個問題:
一是只能研究那些現實世界中存在的刺激源。但實際上,人在快速眼動(REM)睡眠期間還保持著高頻的腦部活動。美國威斯康辛大學麥迪遜分校的Giulio Tononi及同事記錄了32個被試對象睡著時的腦電圖,證明參與真實感官刺激(比如面部和語言)處理的腦區的高頻活動增加了,而且只在夢境中出現這些元素時增加。但做過夢的人都知道,夢境是很難完整回憶和復現的,也并不與現實世界完全一致。無法得知夢境的樣子,就使得腦神經研究丟失了一塊重要陣地。
二是令腦神經研究帶有上了研究人員的主觀選擇,有一定的片面性。舉個例子,大家都知道卷積神經網絡的發展從大腦神經中得到了很多啟發,也因此產生了很多模擬人類腦活動的算法,比如基于注意力的標注模型,它會關注圖片中的一些重點并對其進行文字描述,比如對下面這張圖片:
對圖案中的特征進行有選擇的提取,于是我們得到了一個帶有“海上沖浪者”標簽的圖片。
在模型預訓練時,設計人員都會根據自己的理解和大多數人類的偏好,對圖片特征賦予一定的權重進行預訓練,讓系統優先注意到那些希望它注意到的地方。但這種選擇真的萬無一失嗎?從科學的角度講,我們無法肯定地回答這個問題,但以前我們也沒有證據能夠證明,有的大腦可能不是這么想的,有的大腦比起面孔就是更容易對文字產生興奮。