AI 新聞與投資
決策、不確定性和大腦:神經經濟學

第9章 進化論、機率和經濟學

10 / 16

望,只可能透過外推的方法進行,並且總的來說絕對不可能是一種絕對性的結果。在這一過程的任何一個階段,大腦只能對各種可能的結果提供一種類似於機率表的縱覽。 正是透過這種方式,生物體的行為正好契合於或然性未來模型⋯• (Bernstein,1961) 雖然作為一個團體,行為生態學家迴避了對神經生物學的解釋,但事實並不一定就是這樣。經濟學模型可以被用來定義行為的目標,而這些行為目標又可以作對大腦的功能進行生理學研究的起點。我們可以透過生理學來識別能夠實現以經濟學方法確定的行為目標的計算模組。 僅僅是為了說明這一點,我們接下來將介紹一個生理學方面的案例研究:對靈長類動物眼球運動控制系統中感覺運動過程的研究。 註釋 [1]今天,大部分行為生態學家確定了搜尋食物的動物面對的六個在數學上互不關聯的問題。針對這些問題,格雷厄姆•比克(Graham Pyke)寫了一篇出色的評論(比克,1984)。然而,解決這六個問題的基本觀點是建立在恰爾諾夫和奧裡安所檢驗的兩個最初的問題之上的。 [2] 讀者如果對實際推導感興趣,可以參閱斯蒂芬和克雷布斯 (1986)的全文。 [3] 在對很多有不同進化血統的物種的實驗檢驗中,都沒有觀察到 0—1規則。這說明,這可能是具有趨同性的進化過程的一個特徵。它使我們相信,對動物來說,這個結果可能是一個最優策略,但是以我們現在的知識,還不能完全理解它。 • 181•

225 第10章機率、價值和神經網路:一個案例分析本章是一個案例研究,記述了包括我自己在內的一些研究團隊是如何努力弄清楚一種特殊的神經網路的。50多年來,神經生理學家一直試圖解釋頂葉皮質在由感官事件引導的運動生成過程中的作用。在這些研究者中,圍繞著頂葉皮質應該被看作是專門對感覺訊號進行處理的等級分明的一系列結構中的最後一環,還是應該被看作是透過最終共同路徑產生運動的第一步展開了激烈的爭論。儘管圍繞這個問題已經進行了很多具有創造性的實驗,但至今還沒有人可以給出令人信服的答案。事實上,很多年輕的研究者認為,這場爭論提出了一個無法回答的問題,更有甚者,有人認為這根本就是一個無關緊要的問題。 • 182•

第10章機率、價值和神經網路:一個案例分析在本章中我要指出的是,頂葉皮質在這裡到底起到了什麼作用這一問題,既不是無法回答的,也不是無關緊要的。在傳統研究方法能夠提出的問題中,將頂葉皮質組織起來所依據的計算問題並不包括在內。我認為如果將爭論的焦點重新聚集於機率、價值等概念上,確定頂葉皮質的計算功能的實驗將會得到豐碩的成果。 因此這一章的論述共有三重目的。首先,我想說明對頂葉皮質中感覺運動過程的現代生理學研究是怎樣傾向於堅持以反射為基礎的傳統概唸的。本章的第二個目的是說明機率論和價值理論能夠運用於頂葉皮質研究中所遇到的生理學問題,而這些問題通常被認為完全屬於確定性反射理論的範疇。本章的最後一個目的是要揭示,這些以經濟學為基礎的方法一旦被採用,我們就可以得出關於大腦計算結構方面令人吃驚並且很具有啟發性的結論。 為了達到這三個目的,我想介紹一下與第五章中紐瑟姆和謝德林的研究工作密切相關的有關控制眼球移動的研究。正如那些實驗所表明的,在理解動物怎樣從外部世界中收集視覺資料並且用這些資料來規劃和控制眼球運動方面,人們已經取得了很大進步。毫無疑問,在對脊椎動物大腦神經系統的研究中,靈長類動物的視覺系統是被研究得最多的,因此靈長類動物眼球運動的控制系統也是我們最熟悉的運動控制系統。正是由於這個原因,人們已經把對猴子大腦中視覺感覺系統與眼球移動控制系統之間聯絡路徑的研究,看作是理解感覺一運動過的基本模型。有關這些聯絡路徑的研究,以及它們在頂葉皮質內的相互聯絡, 則構成了本章的主要內容。 為了理解有關頂葉皮質的感覺一運動功能的研究是怎樣進行的,我們將首先給出一個大體的框架,利用它來介紹靈長類動物大腦中的視覺和眼球運動的控制線路。只有在這些基本的方案明確以後,我們才能進一步考察現有的關於這兩個區域之間聯絡的研究,並且對解決感覺一運動領域應該如何聯絡的問題的概念化方法提出挑戰。 10.1 視覺—掃視處理過程概述靈長類動物大腦中的視覺處理過程像所有的哺乳類動物一樣,猴子從它們的左右視網膜接收視覺信息。它們眼球的內表面就像一張照相軟片,每個視網膜是由大約10億 • 183• 226

227 決策、不確定性和大腦一一神經經濟學個感光器組成的感光面。“這些感光器的活動是在視網膜中進行的,並且透過一類被稱作視網膜神經節細胞的神經元,經過視神經傳送到外側膝狀體神經元,或者說 LGN(見圖 10-1)。 LIP VI 前葉眼區外側膝狀體神經元腦幹圖10—1 視覺處理的主要路徑猴子的LGN是一個薄片狀的結構,由六片薄餅狀的神經元相互堆積而成,每一片接收來自兩個視網膜中任何一個的按地形組織的一系列投射。這裡的按地形組織是指在某一個特定的位置,比如說,在外側膝狀體的第二層,所有的神經元均從某一個視網膜上單一固定的位置接收資訊的傳輸。由於視網膜上的每一個位置都對應著視覺空間中的一個位置(就像攝影底片中的每一個位置一樣),因此外側膝狀體的每一個位置是與視覺世界的一個具體位置相對應的。 這個視覺過程還表明,任何給定的外側膝狀體中的鄰近位置接收視網膜上相應的鄰近位置的投射。這種鄰近的地形繪圖意味著外側膝狀體的每一層形成了一個完全的、有地形組織的螢幕,視網膜的活動就折射到這個螢幕上,因此,每一個外側膝狀體神經元有一個自己的接收區 228域。從這個意義上說,謝林頓也許已經使用過了這個名詞。當視網膜上一個合適的區域受到某種特定型別的刺激時,神經元的活動就會發生。 反過來,這些外側膝狀體會投射到主要的視覺皮層。主要的視覺皮層位於頭蓋骨的背面,也叫V1區域,由大約400萬個神經元組成。這 400萬個神經元組成了它們自己的關於視覺世界的複雜的地形圖,每一平方毫米的組織都專門用來對落在視網膜具體區域的所有型別的光線做 • 184•

第10章機率、價值和神經網路:一個案例分析出基本的分析。在這種由許多個“一平方毫米”組成的皮層中,單個神經元顯示出高度的專業化。比如,當光亮與黑暗之間產生的垂直界限落在某些神經元監視的視網膜上時,這些神經元就會變得活躍起來。而其他的一些神經元則專門負責被稱為左邊或右邊的光線—黑暗的兩端。 一些神經元只對其中一個視網膜的資訊輸入有反應,另一些神經元則對兩個視網膜的資訊輸入有相同的反應。另外,還有些神經元優先對有顏色的刺激產生反應。V1 區域中感受性(或接受區域性質)的這種複雜方式在概念上是極為重要的。它表明來自於視網膜的資訊在被傳遞到其他視覺區域之前,已經被分類、分析和編譯。 V1區域中的地形圖(或視網膜地形圖)又會投射到同樣可以對視覺世界編制類似圖形的區域中。被人們稱作 V2、V3、V4 和 MT 等的眾多區域中,對視覺環境的圖形表示也許要經過30次以上迷宮式的向上和向下的投射。[2這些傳輸圖形的網路就是我們感知周圍世界的硬體。 儘管學術界對每個區域的具體功能還存在著重大的分歧,但是幾乎所有的神經生理學家都認為這些區域是負責處理感覺訊號的。這些區域之間可能存在著十分緊密的聯絡,而且它們也許要進行大量的計算分析,但是它們的任務就是描繪視覺世界的特徵。它們作為巨大的接收區域,其中一些只對最特殊的視覺事件組合有反應,但是毫無疑問的,正如絕大多數人所認為的那樣,它們是感覺結構的組成部分(為了對靈長類動物的視覺系統有一個大體的瞭解,參見瑞德,1999)。 眼球的運動與靈長類動物的大腦感覺一運動線路的另一端是控制眼球運動的線路,該線路控制著6 塊肌肉的運動,並且透過這些肌肉的運動使眼球在眼窩裡轉動。儘管眼球的所有運動都由這6塊肌肉產生,但是眼球的運動能夠區分為具有一定獨立性的兩種類別。平穩注視運動透過改變兩個眼球的視線來精確地彌補由動物自身運動所造成的視覺移動;當我們在現實世界中運動時, 平穩注視運動穩定了我們視網膜上的視覺世界。矯正注視運動指的是視網膜上專門的具有較高解析度的部分,即凹窩,針對視覺世界中感興趣的物體做出的反應。當我們看某些東西的時候我們會利用這些運動。矯正注視運動又可以進一步分為兩個子類:掃視和平滑追逐運動。掃視運動快速地將兩眼視線從視覺世界中的一個地方變換到另一個地方,其回轉速率達到每秒1000次。當我們欣賞圖畫或風景時,我們的眼球透過這些定向運動可以使我們進行往復觀察。平滑追逐運動使眼睛保持某個 • 185

決策、不確定性和大腦——神經經濟學速率轉動並且與所看到的運動目標保持相同方向,從而使目標在視網膜上的投影穩定化。當我們追蹤馬路上運動著的小汽車時,我們就會用到這種運動。 我們最為熟悉的眼球運動型別無疑是掃視。現在我們對在掃視產生過程中起著關鍵作用的大腦中相互聯絡的區域已經有了詳細的瞭解。因此掃視運動控制系統看來是我們理解一般意義上的運動控制的理想素材 (見圖10—2)。 VI 車路水平的供店箭葉眼區腦幹圖10-2 掃視處理過程的主要路徑當一個掃視運動產生後,控制每一隻眼球位置的6塊肌肉被6組位於腦幹(BS)深處的運動神經元啟用,而這些。運動神經元又被位於腦幹中的另外兩個系統所控制,一個系統控制掃視時眼睛的水平位置, 另一個系統則控制掃視時眼睛的垂直位置。這兩個控制中心接收來自於兩個相互連線的掃視控制區域—上丘(SC)和前葉眼區 (FEF)——的資訊。像以上描述的視覺區域一樣,上丘和前葉眼區也 280 是按照地形構建的。在這個例子中,它們的組成神經元構成了眼球所有可能運動的地形圖。為了理解它是如何執行的,我們可以想象一張風景照。在它的上面覆蓋一張透明的座標網柵,這樣就可以測度我們為了看清下面照片上的任何一點,眼球必須同時進行的水平運動和垂直運動。 上丘和前葉眼區都包含著與這些透明的座標網柵非常相似的圖。上丘上一個特定位置的神經元的活動會產生一個特定幅度和方向的掃視。如果這個活動點在丘腦圖上移動,那麼由此引致的掃視的幅度和方向也會以 • 186•

第10章機率、價值和神經網路:一個案例分析一種合乎規定的方式變化,而這種方式則是由座標網柵上縱橫交錯的線條組織起來的地形圖確定的。上丘和前葉眼區神經元構成了按地形組織的指揮陣列,每一個神經元在影象上的位置由它所產生的掃視的方向和幅度決定。 我個人認為(當然不一定必然正確),從前葉眼區到眼睛肌肉本身, 將所有的掃視控制結構都看作是運動控制領域,關於這一點是沒有太多281 爭議的。它們大多都以複雜的方式相互聯絡著,並且毫無疑問的,每一個區域都進行著不同的而且相當複雜的計算。但是大多數神經生理學家傾向於認為,這些區域應該是產生掃視運動的最終共同路徑(為了對眼球運動控制系統有一個大體的瞭解,參見 Glimcher,1999)。 10.2 視覺與掃視的結合考慮一個相當典型的實驗情形。一隻口渴的猴子注視著正前方,凝視著在它前面三英尺處的投射到螢幕上的一個微小的黃色光點。在無法預知的某個時候,一個紅色光點出現在猴子注視點的右邊10度的地方, 接著,最初的黃色光點消失了。此時如果猴子透過掃視將它的視線轉向紅色光點,那麼它就會得到一杯草莓果汁(一種猴子很喜歡的果汁)作為獎勵。當我們做這個實驗時,猴子的視線確實轉向了紅色光點,而且它在大約四分之一秒的時間內完成了這個動作。那麼,猴子的大腦是怎樣在這四分之一秒的時間內利用紅色光的視覺刺激來產生右移10度的掃視呢(見圖10—3)? 我們知道,正前方偏右10度的亮光會啟用每個視網膜上的一個特定位置。這種啟用運動將會傳遞到支線膝狀體神經元的6張圖中的某個具體的地形位置,然後再傳遞到主要的視覺皮層的某個具體位置。從那裡,這個運動將在相互聯絡的視覺皮質圖中擴散。在每個影象的相應位置,這個紅色的目標將會引起一小束神經元的活動。 我們還知道,在猴子的掃視行為做出之前,上丘和前葉眼區的視野圖中對應於向右偏移10度的特定位置將被啟用。這個活動反過來引起了腦幹中水平掃視控制中心的神經元的活動。接著,這個水平控制中心將會啟用兩組a運動神經元。a運動神經元控制著每隻眼睛外側和中間的直肌的張力從而引起眼球的轉動。 那麼,這些隨著紅色光線產生的活動是怎樣引起了眼球運動的呢?2.32 • 187

決策、不確定性和大腦一神經經濟學較高水平的皮層外側膝狀神經元視網膜會較高水平的 SC 233 眼區上丘前葉眼區圖10—3 當右邊的目標引致眼球向右運動時神經元活動的方式這個問題的最簡單的答案是,視覺系統的神經元沿著某種“簡單明確的路徑”,把運動系統的神經元啟用。如果我們把掃視控制區域當作掃視的最終共同路徑,並且設想視覺一感覺區域是一個非常精緻的謝林頓感受器,那麼這兩個系統就是由一個連線性的神經元聯絡在一起的。以這種方式進一步推理,我們可以合理地提出下面的疑問:是否可以找到靈長類動物視覺掃視系統中感覺和運動系統之間的聯絡的證據,該證據可以證明當簡單的視覺掃視反應產生時視覺掃視系統被啟用了,而其中起聯絡作用的一定是產生感覺運動反應的中間元素。 尋找這種聯絡的一個可能的方法就是在純粹的解剖學層面上,識別大腦中將視覺皮層與上丘和前葉眼區聯絡在一起的那些區域。當我們開始檢驗視覺和運動系統之間在解剖學上的聯絡時,後部頂葉皮質的一些區域引起了人們的注意。其中一個已經成為備受矚目的研究物件,這就 • 188•

第10章機率、價值和神經網路:一個案例分析是腦頂內溝的兩側區域,或者被稱為 LIP 區域。 頂葉皮質的視覺掃視功能 20世紀50年代以前,絕大多數的頂葉皮質在神經學教科書中被叫做聯絡區域。當時,人們認為腦皮層有三種最基本的用途:感覺、運動和聯合。“聯絡”一詞來自於對條件反射的研究,在那個研究中,巴甫洛夫用這個詞來代表伴隨刺激產生的一種新的反應過程。 那時,對頂葉皮質聯絡區域受損害的神經患者的研究已經清楚地表明,大塊的頂葉圓形突出部無論對產生感覺還是產生運動,都不是必不可少的。頂葉受損患者的視覺和聽覺都能相當完好地保持原來的功能, 而且他們的四肢和雙眼也都能以非常正常的方式活動。但是,這些病人完成某些任務的功能似乎受到了損害,為了設計一個動作,他們需要使用一個或多個感覺器官。科學家們透過以上這些觀察結果,以及人們在猴子身上所觀察到的類似的結果,得出了以下結論:頂葉皮質既不完全屬於感覺也不完全屬於運動。這就不可避免地引出了下面的結論:它一定是用來產生感覺運動聯絡的。然而,不幸的是,當時還缺乏關於頂葉皮質聯絡區域功能的更為精確的理論。 這種對頂葉皮質聯絡區域功能幾乎完全無知的狀態在很大程度上是由於技術方面的限制。20世紀50年代,人們已經可以記錄被麻醉的動物大腦中單個神經細胞的活動了。這對於渴望研究感覺系統的生理學家來說,無疑是一項關鍵的技術,因為有了這項技術,生理學家們就可以研究不同組的神經元在感覺資料處理過程中所起的作用。在一個典型的實驗中,神經學家擊打一隻麻醉貓的前臂,同時使用微電極透過神經系統來追蹤那次打擊所產生的活動方式。使用類似的方法,科學家們也可以透過微電極來觀察小組神經細胞的活動,從而研究麻醉動物的運動控制過程。透過這些實驗,科學家們可以瞭解到這些細胞是怎樣影響肌肉的張力的。但是,聯絡區域卻不能透過簡單地研究麻醉動物來了解,因為麻醉動物不能產生聯絡功能(或做其他類似的事情)。20世紀50年代,研究有知覺的動物的單個神經細胞是不可能的,因為當時根本就不存在這樣的技術。這是一個關鍵的限制,因為它意味著不能夠以一種有意義的方式對聯絡區域進行研究。 20世紀50年代末,加拿大蒙特利爾神經病學研究所的赫伯特•賈斯帕 (Herbert Jasper)和美國國家健康研究所的愛德華 •伊瓦特斯 (Edward Evarts),對這項重要技術問題進行了研究。這兩個人都認為, • 189• 234

235 決策、不確定性和大腦—神經經濟學神經生物學必須能夠在不傷害或者打亂動物正常行為活動的情況下,記錄有知覺的動物大腦內單個神經元的活動。做到這一點似乎是有可能的,因為我們知道,大腦本身並不具有疼痛或觸覺的感受器,因此,如果把細微的電線插人有知覺的動物大腦中,它們也不會發覺。賈斯帕希望用這個方法來研究在正常情況下,猴子形成記憶時單個神經細胞的活動,伊瓦特斯則希望透過研究運動皮層的神經元活動來了解胳膊運動是如何產生的。 1958年,賈斯帕發表了對這項技術的研究報告,毫無爭議地證明了記錄有知覺的動物大腦是完全可行的,並且動物也能夠忍受這種方式。接著,伊瓦特斯把此項技術又推進了一步,極大地完善了這項技術,改進後的技術與當前我們廣泛應用的方法幾乎完全一樣。這項技術的發展非常關鍵,因為它意味著,我們最終將有可能對頂葉皮質聯絡區域展開研究。 命令假說最先使用這項新技術研究頂葉皮質的是弗農 •茂特凱索(Vernvn Mountcastle) 在巴爾的摩市約翰 • 霍普金斯大學的研究團隊。使用微電極來研究麻醉動物的體覺皮層,也就是對觸覺刺激做出反應的皮層, 為茂特凱索贏得了很高的聲譽。他和他的學生進行了一項標誌性的研究,該研究不僅為有關一般意義上大腦皮層如何工作的現代理論奠定了基礎,而且也為有關特的體覺系統如何工作的現代理論奠定了基礎。 茂特凱索是神經科學的領導人物,他決定利用有知覺的動物的單個神經細胞記錄去研究聯絡區域是關鍵性的一步。他的研究為生理學家利用後來被稱作“喚醒一行為準備”的方法進行認知神經科學的研究提供了堅實的科學基礎。 茂特凱索和他年輕的生理學家小組對猴子進行了靜坐訓練(茂特凱索等,1975),使它們在面對視覺和觸覺刺激時能安靜地坐著。他們同時還訓練猴子把特殊的視覺刺激當作訊號,從而產生行為反應。當然, 如果猴子的行為是正確的,它們就會得到獎勵。比如,他們訓練一隻猴子只要在燈被點亮時就跑上前去,而不管這個燈被安置在它周圍空間的哪個位置。如果猴子跑向燈光,那麼它將得到一杯果汁;或者,他們訓練猴子在沿著某個軌道運動的同時,伸手去觸控某個按鈕。1975年, 茂特凱索的團隊發表了一篇里程碑式的論文,公佈了這些實驗的結果 (見圖10—4)。 • 190•

第10章機率、價值和神經網路:一個案例分析 236 圖10—4 茂特凱索的實驗設定資料來源:茂特凱索、林奇、喬戈保羅斯、坂田昌一、阿庫納:《猴子的後部頂葉聯絡皮層:超個體空間內的操作指揮功能》,載《神經生理學雜誌》,38:871~908頁。 從上述觀察中,我們得到的主要結論是:在後部頂葉聯絡皮層中存在一系列神經元,它們是圍繞在超個體空間中的手的行為和視覺行為的指揮機構。 頂葉皮質的突起和控制手運動的神經元本質上既不屬於感覺系統也不屬於運動系統,但是它們參與一類特殊運動中的指揮過程。 我們想要強調以下幾點:我們的“指揮中心”概念明確地假設在中樞神經系統中存在許多對運動機構進行指揮的源頭。儘管參與不同活動的外部肌肉組織實際上是相同的,但是指揮的源頭及其本質在不同的行為反應中是明顯不同的。 我們認為,在人和猴子的頂葉皮質圓形突出部受到損害以後出現的幾個反常的功能可以被理解為意志的缺乏,缺乏用手和眼去探索另一側的空間區域的意志,而且這個缺乏是因失去了存在於頂葉聯絡皮質中 •191•

237 238 決策、不確定性和大腦—神經經濟學的對這些探索的指揮操作。(Mounlcastle,1975) 透過對這些單個神經元的研究,茂特凱索和他的同事提出,在頂葉皮質中存在一個既非感覺也非運動的過程,他們把這個過程叫作指揮過程。儘管他們認為,從本質上說,這個過程不應該被認為是感覺或者是運動過程,但是,與感覺訊號過程相比,這個過程與運動的聯絡更加緊密,僅憑“指揮中心”這個詞就可以說明這一點。 茂特凱索實驗室發表這個報告不久,也就是提出存在一個頂葉指揮過程不久,就出現了越來越多的研究證據對這個結論提出挑戰。最初的挑戰來自於科學家邁克爾•戈德堡(Michael Goldberg,後來在美國國家健康研究所任職),他提出了一個替代性的概念以理解感覺訊號如何產生運動。 注意力的增強就在茂特凱索公佈命令假說的前幾年,戈德堡已經和他的同事兼良師益友鮑伯 • 武茲(Bob Wurtz)一起,利用喚醒一行為準備的技術, 首次描述了上丘中與眼球運動相聯絡的行為特徵。這項技術是武茲在美國國家健康研究所做博士後研究時,從愛德華•伊瓦特斯那兒學到的 (見圖10--5)。 在戈德堡和武茲最初關於上丘中的神經元的實驗中,猴子被訓練去完成兩個行為任務。首先,在他們所稱的注視實驗中,猴子被訓練去凝視正前方的視覺刺激,與此同時第二個刺激在其他的位置出現了。第二個刺激會突然消失,如果猴子完全忽視了第二個視覺刺激的存在,那麼它將被獎勵。其次,在掃視實驗中,正當猴子凝視著正前方中央的刺激時,第二個刺激將會出現而中央的刺激將消失。在這些實驗中,猴子如果在中央目標消失之後去看第二個目標,那麼它將被獎勵。 每天,當戈德堡和武茲把電極放在單個的丘腦神經元附近時,他們就馬上開始確定那個神經元在丘腦地形圖中的位置。因這可以使他們準確地將第二個刺激訊號定位在該神經元負責的視覺(或運動)空間中的某個確切的位置。一旦第二個目標被固定在那個位置以後,他們就對猴子進行一組注視實驗,然後再進行一組掃視實驗。在注視實驗中,他們發現,當第二個刺激出現時,丘腦神經元會處於微弱的活躍狀態。而在第二個刺激消失之後這個微弱的活躍狀態也會逐漸消失。當他們轉換到對猴子進行掃視實驗時,他們發現神經元最初的微弱反應在實驗的後期也就是在猴子正準備移動眼睛之前變得很劇烈。使他們感到吃驚的 • 192•

第10章機率、價值和神經網路:一個案例分析注視任務 1. 時間—> 掃視任務 1. 2 時間圖10—5 戈德堡和武茲的注視任務和掃視任務注:猴子旁邊的示波器顯示出在每個階段的任務中上丘的活動。 是:當猴子一次接一次地進行掃視實驗之後,它對於第二個目標剛出現時的初始反應變得越來越強。就好像猴子越是確信第二個刺激是它的掃視目標,神經元的初始反應就越劇烈。 因為這種增強了的初始反應的大小和時間選擇對運動沒有明顯的影289 響,因此戈德堡和武茲推論,這個初始反應的活動不可能是一個運動控制訊號。儘管在每一次注視實驗中目標都保持相同,但是這種初始反應的程度卻是隨著追蹤次數而逐漸增加的。因此,他們得出結論:這種增強了的初始反應從本質上看不可能屬於純粹的感覺。 在茂特凱索實驗室發表命令假說之前,他們已經對這個訊號進行了幾年的研究,那麼這個既非感覺又非運動的訊號到底是什麼呢?戈德堡和武茲發現沒有必要像茂特凱索那樣假設存在指揮中心來解釋他們的結果。相反他們認為這種強化可以被看作是經過注意力因素修正的感覺訊號。 他們的基本觀點是,無論什麼時候,當猴子打算去看第二個特定的 • 193•

決策、不確定性和大腦——神經經濟學目標時,與在注視任務中完全忽視第二個目標相比,它一定會對第二個目標的出現付出更大的注意力度。他們推論,當猴子進行了一次又一次的掃視實驗之後,它對於第二個目標的特殊重要性的確信程度會加強, 因而它會越來越好地注意第二個刺激。戈德堡和武茲假定這個注意力會以某種方式增加上丘中神經元的初始反應的強度,而且,這種初始反應強度的增加與他們所觀測到的情況幾乎完全一樣。在他們的分析中,注意力是這樣的機制,它可以使感覺反應發生變化從而使這些神經訊號既不屬於真正的感覺也不屬於真正的運動,而是強化了感覺世界的表現。 茂特凱索和他的同事已經提出,在後部頂葉皮質中存在著一個指揮過程,並且用它來解釋這種既非真正的感覺又非真正的運動的訊號的存在。與此同時,戈德堡則發現了頂葉訊號與他所檢測的丘腦訊號之間存在著緊密的聯絡。因此,戈德堡和他的兩個新同事戴維•李•羅賓森和格雷戈裡 •斯坦頓,立即使用戈德堡在丘腦研究中所開創的實驗方法, 開始研究後部頂葉皮質中的強化效用的影響。這些實驗完成於 1978年 240(羅賓森、戈德堡和斯坦頓,1978),並且大部分實驗結果與茂特凱索的相同。但是由於戈德堡的早期工作,他們得到了與茂特凱索截然不同的結論。 由於在他們(茂特凱索)的實驗中,與運動相聯絡的神經元似乎不容易因被動的視覺或體覺刺激而興奮,因此他們假設頂葉皮質執行著指揮功能,指揮手和眼的運動,去探索視覺和體覺環境。他們強調,後部頂葉皮質中的神經元沒有感覺反應,並且假設腦部的這個區域為運動系統提供了完整的命令訊號。此外,他們還認溝,這種整體命令的觀,點應該替代傳統的關於後部頂葉皮質起聯絡作用的觀,點。 在先前對上丘和前葉眼區的視覺反應神經元的研究中,我們證明了,當接收區域的一個視覺刺激將成為眼球運動的目標時,這些神經元的視覺反應是增強的。我們決定檢驗後部頂葉皮質中的神經元,來弄清楚伴隨視覺引導的眼球運動的細胞是否可以被更好地理解為受行為修正的神經元,而不是“指揮神經元”。在此項研究中,我們記錄了第7個區域(後部頂葉皮質中與掃視有關的區域)的289個細胞的活動。與運動相聯絡的每一個神經元都有感覺反應,但是這個反應並不屬於運動。 這些實驗證明,後部頂葉皮質應該被看作是一個感覺聯絡區域,這裡的細胞將來自環境的視覺和體覺資訊與有可能是內生的行為資料結合到一起。行為資訊承擔修改感覺輸入的任務。如果一個刺激很重要,就 • 194

第10章機率、價值和神經網路:一個案例分析像運動的.目標一樣,那麼,在神經系統中,與一個類似的但是不重要的刺激相比,它將會產生更大的影響。 茂特凱索和他的合作者提出,後部頂葉皮質的神經元具有命令眼睛和手運動的功能。他們描述了履行與運動相關的任務的神經元,但是它們不能夠為被動的資訊所驅動。我們發現:我們在後部頂葉皮質中所遇到的每一個神經元都與運動有關,並且也可以被某些獨立於運動的感覺刺激所啟用。 我們認為,可以根據頂葉神經元的感覺特性,而不是根據它們與運動在現象上體現出來的關係,來對它們進行最好的描述。(Robinson, Goldberg and Stanton,1978) 在某種程度上,戈德堡和茂特凱索定義神經生理學模型而競爭著,並把該模型作為理解感覺和運動訊號之間聯絡的模板。茂特凱索認為,為了理解這種聯絡就需要在概念上有一個新的過程,該過程既不是運動也不是感覺,而是指揮過程。戈德堡則認為後部頂葉皮質中的感覺和運動的聯絡應該用現有的聯絡感覺和運動訊號的觀點來加以分析。感覺與運動訊號之間的連線可以透過調整感覺訊號的強度來完成。當感覺訊號被注意力過程推到某個關鍵的水平之後,最終共同路徑就被激活了。 從本質上來看,戈德堡的主張體現了巴甫洛夫的必要性格言。在某些任務條件下,由刺激引發的感覺活動可以引起運動,而在其他情況下則不會產生運動。透過對產生運動的實驗反應更加強烈,聯絡性元素產生了這種效應。一個刺激越是有可能產生運動,感覺反應就越強烈,因此最終共同路徑越是有可能被啟用。這些聯絡性因素反映出一個事實: “如果一個刺激是重要的,比如說是一個運動的目標,那麼它將比一個同樣的但是不重要的刺激對神經系統產生更大的影響”。這種方法的優點在於它的簡易和它對巴甫洛夫必要性觀念的體現。一般意義上,戈德堡模型是對笛卡兒的關於頂葉皮質以及皮質感覺運動問題的研究方法的外推。 與戈德堡相比,茂特凱索的方法則有著本質的不同。他提出,在對後部頂葉皮質的研究中,應該拋棄反射論的方法,並且他認為應該存在一種全新的感覺運動成分。但是茂特凱索提出的模型充其量也只是一個不完全的模型—確切地講,這些指揮功能是什麼?它們是如何完成任務的?它們又試圖解決什麼樣的計算問題? • 195• 241

決策、不確定性和大腦——神經經濟學那時,茂特凱索和戈德堡的爭論正在進行之中,而且瑪爾的書幾年後才得以出版。所以,用一個嚴格的模型來明確地解釋頂葉皮質具有哪些功能的需要也許不像現在這樣清楚。以這個模型的實際特徵來看,概率論和經濟學的方法剛剛開始透過生態學科進入到生物學的研究中來, 248 在茂特凱索和戈德堡發表論文的這些年間,艾裡克•恰爾諾夫發表了他的第一個正式模型。也許正因為所有的這些原因,爭論迅速地從對被爭論的一般模型的直接分析中轉移開來,集中到了從實驗上對茂特凱索和戈德堡做出的具體斷言發起挑戰。 243 注意力與目的毋庸置疑,戈德堡和他的同事們提出的指揮功能概念對於我們直接理解頂葉皮質沒有多大幫助。一個偏離中心的視覺刺激出現後,在某些情況下,猴子會注意它,在某些情況下則不會。至少在表面上,這是一個不確定的過程,是一個用經典的笛卡兒模型很難解釋的過程。因此, 有人可能會懷疑,是否需要一個附加的不確定性過程來解釋這個現象, 但是戈德堡卻非常聰明地以一種不需要依靠不確定性的方式解決了這一明視訊記憶體在不確定性的問題。感覺訊號到運動控制路徑的直接聯絡透過一個門控系統來調節,這個系統就是感覺注意力。感覺注意力透過強化的生理學機制會使一些感覺訊號傳送到運動系統,同時卻阻止另外一些信號。這個過程之所以顯得不確定只是因為我們不知道注意力過程是如何進行的。 戈德堡模型確實可以解釋生理學家所觀測到的現象。到了20世紀 70年代末,茂特凱索實驗室開始發現了一些證據,證明正如戈德堡所提出的那樣,同運動事件相比,頂葉皮質的訊號與感覺事件的聯絡更加緊密。基於這個原因(當然還有其他原因),茂特凱索的團隊開始把電極從後部頂葉皮質移出並放入體覺皮質中。但是在電極完全被放到體覺皮質中之前,理查德•安德森必須完成他的博士後研究(見圖10-6)。 當安德森在茂特凱索的實驗室時,他對感覺和運動神經系統分介面周圍的神經迴路如何把物體的位置和運動軌道編譯成碼產生了興趣。想象一下安德森所做的實驗,當一隻猴子注視正前方時,在它所注視位置右邊5度的地方,出現了一個亮點。這個視覺刺激啟用了猴子的視網膜、支線膝狀體以及視覺皮質的地形圖上正前方偏右5度位置上的神經元。為了能夠按照刺激調整它的視線,猴子轉動它的眼球直到使眼球朝向正前方偏5度的方向,這樣它就啟用了按地形組織的運動控制圖上正 • 196•

第10章機率、價值和神經網路:一個案例分析圖10—6 安德森的協調轉換實驗前方偏右5度的位置。 接下來考慮這樣一個例子。一個相同的亮點出現在視覺空間裡相同的位置上,但是此時猴子正注視著它的正前方偏右10度的位置。在相同位置相同亮度的情況下,這個視覺刺激會啟用猴子視網膜上正前方偏左5度的點。隨後,所有代表正前方偏左5度位置的感覺圖上的點都會被啟用。但是如果猴子想看到那個光點,它必須重新調整它的眼球方向從而使眼球停留在正前方偏左5度的位置上。 令安德森感興趣的問題是:許多感覺的表面,比如視網膜、皮膚或者貓的耳朵,在現實世界中都是運動的。這就意味著在它們控制之下的感覺系統地形圖和運動系統地形圖之間的校正必然是可變的。安德森認識到,連線感覺和運動訊號的任何系統都有一個關鍵的功能(不管它如何完成那個連線),那就是解決這一問題。 安德森在茂特凱索實驗室的任務主要集中於理解感覺和運動是怎樣244 聯絡到一起的,這種任務把他引向了區域7(後部頂葉皮質的一個子區域),該區域專門負責感覺—運動互動並且還與眼睛的掃視運動相聯絡。 這項任務在幾年後成為了一個分水嶺,安德森(當時已經是薩克研究所的教授)和格瑞格•艾席克、拉爾夫•西格爾一起發表了一篇名為《被視覺刺激和眼球運動行為啟用的區域7的神經》的頗具影響力的論文。 有幾個實驗室都記錄到了活動中猴子的後部頂葉皮質區域7a(區域7的一個子區域)中單個神經元的活動情況,並且,透過把這些細胞的活動與感覺和運動事件相聯絡,他們在瞭解Ta的功能方面取得了重大進步。在最早的實驗中,茂特凱索和他的同事發現,動物的某些行啟用了很多細胞,這些行為包括掃視、注視、平滑追逐的眼球運動,以 • 197•

決策、不確定性和大腦——神經經濟學及四肢的伸展運動等。但是,他們還發現,這些細胞並沒有對視覺刺激或體覺刺激產生反應。由此,他們認為,區域7參與了對眼球和四肢運動的一般運動控制。 在隨後進行的實驗中,羅賓森、戈德堡和他們的同事發現,區域? 的很多細胞對視覺或肉體的刺激都有反應。他們認為,茂特凱索及其同事發布的與行為有關的反應可能透過以下的原因來解釋:既可能是來自於運動目標的視覺刺激引起了行為反應,也可能是由運動所產生的視覺或體覺刺激導致了行為反應。他們同時提出,區域7a 參與了感覺運動過程,但是它並不在運動過程中扮演茂特凱索及其同事所認為的那種角色。在隨後的一份報告中,摩特爾(Motter)和茂特凱索注意到有些細胞好像對眼球運動和光比較敏感,他們認為在與嚴格的眼球運動反應有關的細胞和與單獨的視覺反應有關的細胞之間存在著一個過渡。 在當前的研究中,我們設計了一些實驗來區分掃視和注視神經元反應中的視覺成分和運動成分。我們發現這兩種類別的神經元中細胞的活動既與感覺刺激有關也與眼球運動行為有關。眼球運動的實質和注視 (即眼球的位置)訊號說明,它們在保持空間不變性方面發揮著重要的作用,而不是引起眼球的行為。(Andersen,Essick and Siegel, 1987) 安德森和他的同事們緊接著又提出:後部頂葉皮質最根本的任務是要解決這樣一個問題,該問題遠比感覺一運動系統怎樣相互連線界定得 245 明確。隨著眼球、四肢和頭的運動,感覺世界的地形圖和運動系統的地形圖之間的聯絡也在不斷地發生著變化。不管我們怎樣判定哪種刺激將會引發反應,我們必須設法判定刺激將會引發什麼樣的反應。安德森在 1987年把如何連線大腦中變化著的感覺和運動地形圖視為後部頂葉皮質的主要功能。 但是就在第二年,安德森和他的同事們在頂葉皮質中發現了一個意想不到的特性,這迫使他們對命令假說重新進行了考量。吉姆•戈納德特 (Jim Gnadt)在安德森的實驗室做博士後研究時,他訓練猴子進行有記憶的掃視任務(Gnadt and Andersen,1988;見圖10—7)。在那個任務中,當猴子注視中心的視覺刺激時,第二個視覺刺激會很快出現, 然後消失。猴子的任務就是當戈納德特取消了中心刺激之後,將注意力轉移至第二個視覺刺激。在第二個視覺刺激消失後,戈納德特通常會使中心刺激維持較長的時間。在最長可達1.5秒的延遲時間內,猴子必須記住它們應該去做些什麼。戈納德特和安德森透過這個實驗來研究區域 7 的掃視子區域中神經元的活動時,也就是現在被稱為LIP 區域的神經 • 198•

第10章機率、價值和神經網路:一個案例分析元的活動時,得到了一個驚人的發現。他們發現被第二個瞬時刺激啟用的神經元在視覺刺激消失後依然保持活躍,而且這種啟用狀態一直會持續到猴子根據刺激的記憶位置調整注視方向並進而做出掃視運動。 記憶掃視注視開始目標出現目標消失 246 3. 視線偏移持續的神經元活動猴子轉移視線 5, 持續的神經元活動圖10—7 戈納德特和安德森的記憶掃視實驗我們已經指出,在腦頂內溝的兩側存在與記憶相聯絡的活動,而且腦頂內溝是與特定方向和範圍的眼球掃視活動相聯絡的。這個活動能夠與引導眼球運動的視覺刺激相分離⋯⋯因此,這些細胞的活動好像與運動之前的掃視計劃有關,在此我們將它稱作運動意圖。運動意圖一詞在這裡具有將行溝事件(例如掃視)與神經活動聯絡起來的含義,而不是說神經訊號是產生眼球運動的充分必要條件。 靈長類動物後部頂葉皮質中包含的神經訊號適合於建立視覺目標空間地形圖,也適合於與記憶相聯絡的運動規劃以及伴隨掃視而來的反饋活動。這些發現有力地證明了,頂葉皮質與眼球掃視運動的引導和運動計劃有著密切的關聯。(Gnadt and Andersen,1988) 安德森用一種改進了的方式復興了命令假說。他證明了戈德堡的247 • 199•

決策、不確定性和大腦——神經經濟學 “強化活動”在缺少感覺刺激時依然可以持續下去。安德森認為這一點與戈德堡的“根據它們的感覺特徵,頂葉神經元可以被最好描述”的主張是不相容的。 戈德堡和他的兩個新同事—卡羅爾•科爾比(Carol Colby)和簡•瑞內 •杜阿姆(Jean-Kene Duhamel)對 LIP 區域的重新考察正是對這一新發現做出的回應。他們想要知道,戈納德特和安德森發表的這些結論是否與他們關於後部頂葉皮質本質上是一個感覺結構的觀點一致。另外他們還想搞明白,如果二者不一致的話,LIP 區域在感覺運動過程中到底扮演著什麼樣的角色。 為了開始他們新一輪的研究,科爾比、杜阿姆和戈德堡(Colby, Duhamel and Goldberg,1996)重新訓練了一批猴子來完成另一組任務 (見圖10-8)。當然他們教會了這些猴子怎樣完成戈納德特和安德森曾經實驗過的記憶掃射任務,不過除此之外,他們還訓練猴子完成了另外一套非常重要的任務,這套任務產生了很大的影響並且使他們對戈納德特和安德森的發現做出了新的解釋。這兩個任務中,一個是戈德堡曾經實驗過的注視任務,另一個則是被他們稱為外圍注意力任務的新任務。 你也許還能回想起來,在注視任務中,猴子被要求注視正前方的一個持注視任務外圍注意力任務醬圖10—8 科爾比、杜阿姆和戈德堡的外圍注意力任務 • 200•

第10章機率、價值和神經網路:一個案例分析續發光的中心目標,這時會出現第二個視覺刺激,猴子的任務就是對第二個視覺刺激不予理會。 外圍注意力任務與此幾乎完全相同:同樣是中心目標被照亮,同樣不允許猴子產生掃視行為。唯一不同的只是在新的任務中,猴子注視正前方時,第二個視覺刺激出現,如果猴子發現第二個刺激變暗時需要按一下槓桿。戈德堡和他的同事認為,從眼球運動控制的角度說,這兩項任務是相同的,因為在這兩項任務中都沒有產生眼球運動。這兩項任務最主要的差異就是其中的一個需要猴子集中注意力。在注視任務中反應區域內與異常刺激是不相干的,但是在外圍注意力任務中這個相同的刺激卻變得高度相關。 戈德堡和他的同事們在做這個實驗時發現,與注視任務相比,頂葉神經元在外圍注意力實驗中更為活躍。儘管這兩項任務都沒有要求產生任何運動,但是它們卻引起了 LIP 區域中的神經元兩種截然不同的反應。對於許多科學家來說,這似乎是比較明顯的證據,證明LIP 區域的活動(在更一般的情況下可以推廣到後部頂葉皮質的活動)不可能只是一個單純的運動命令,並且它也不能反映產生運動的意圖。相反,它似乎說明LIP 區域的活動與動物高度關注的感覺事件是相互聯絡的。 不過在與他人交流這些結果的時候,科爾比、杜阿姆和戈德堡採取了一種比較委婉的方式,這也許是因為在持續的爭論中他們與安德森及其同事們的關係變得越來越緊張的緣故。 首先,我們發現,最初對區域7在掃視前得到強化的描述只是刺激剛出現時對視覺反應的一種特殊的加強。其次,在掃視任務中,視覺反應的加強是與純粹的注視(不存在運動)任務的強化程度有關係的。 (然後,作者們繼續介紹了兩個發現,進一步說明掃視開始前瞬間的活動與隨後產生的運動存在緊密的聯絡。) 現有的結果表明,L.IP 區域神經元的活動具有多面性,並且受到諸如關注、預期等認知因素的調節。LIP 區域神經元具有獨立的感覺反應和與掃視相關的脈衝。更進一步,對空間位置的關注調整了對刺激首次出現時的感覺反應。不能認為這些神經元只是專門對視覺刺激進行分析,因為在近期沒有受到刺激時,它們在掃視前就已經開始活動了。也不能認這些神經元只負責進行掃視計劃,因為它們在掃視被禁止的任務中仍然做出了強烈的響應。理解這些型別迥異的活動的一種方法是考慮它們的交叉點:特定神經元的可取的刺激位置和掃視共同決定的空間 • 201• 249

決策、不確定性和大腦—神經經濟學位置。我們認為,LIP區域神經元的活動是把一個特定的空間位置編譯成程式碼。(Colby,Goldberg and Duhamel,1996) 作為對這些資料的回應,安德森和他的同事們提出了一個驚人的但是又十分有趣的假說,這個假說對戈德堡的地位提出了進一步的挑戰。 他們提出在科爾比研究的注意力鎖定任務中,猴子們實際上正打算去看第二個刺激,即便是它們最後並沒有這樣去做。他們還認為,科爾比實驗中的猴子對那些被認為能夠導致掃視的第二刺激點(實際上)已經看了上萬次。也許LIP 中神經元活動的強度並不能反映注意力的加強, 而是反映了動物是否打算進行掃視的確定性。 為了證實這個假說,安德森和他的一個學生馬丁•佈雷斯韋爾 (Martyn BracewelI)開始訓練猴子完成另外一項任務。這一次,猴子在開始時需要注視正前方中心的亮光,然後第二個視覺刺激開始短暫地閃現並消失。就像在記憶性掃視任務中一樣,猴子的任務是耐心地等待,直到中心的亮光消失,然後將視線轉向第二個目標出現的地方。但是在有些實驗中,在猴子等待的這一段時間內,佈雷斯韋爾和安德森會讓另一盞燈在第三個位置閃現。在這種情況下,猴子被要求改變它們原” 來的打算,也就是在那盞固定的燈熄滅之後,它應該將視線轉向第三個刺激出現的位置。 佈雷斯韋爾和安德森發現,當他們訓練猴子改變它們的計劃時, LIP 區域中地形圖上啟用的位置發生了變化。與轉向第二個目標相聯絡的神經元不再活躍,而與轉向第三個目標相聯絡的神經元則被激發。他們注意到,正是與第二個目標相聯絡的神經元活動的存在性,揭示了 L.IP 區域中的神經元能夠為猴子打算進行的運動編碼,即便是這一活動沒有發生時也是如此。 安德森和他的同事認為這至少是對科爾比、杜阿姆和戈德堡結論的部分否定。也許在外圍注意力任務中猴子確實在計劃一個沒有被實施的運動,正如在任務改變實驗中觀察到的結果一樣。戈德堡對此做出了適度的反應,他指出安德森團隊從任務改變實驗中得到的資料也可以看作是以下觀點的證據:猴子對目標的關注也會發生變化,它由加強對第二個目標的注意力變為加強對第三個目標的注意力。他認為這些資料並不能證明運動計劃或者意圖的存在。 • 202•

第10章機率、價值和神經網路:一個案例分析 10.3 如何解決關注和意圖之爭? 對於我們大多數旁觀者來說,安德森和戈德堡關於頂葉皮質功能的爭論似乎已經陷入了一種語義之爭。很明顯,戈德堡基本上被迫放棄了他最初的“後部頂葉皮質應該被看作是一個感覺聯絡區域”的假說。同樣,安德森也被迫放棄了茂特凱索最初的命令假說,轉而支援更弱的意圖假說。那麼所有的這一切—-就神經系統如何解決感覺輸人和運動輸出之間聯絡這一問題來說—到底能告訴我們什麼呢? 幾乎與此同時,邁克爾•普拉特(Michael Platt)和我天真地認為:我們可以設計一個實驗來直接比較戈德堡的感覺解釋和安德森的運動解釋,並重新引起人們關注對頂葉皮質功能的爭論。如果我們可以設計出一個實驗,能夠對安德森的運動計劃假說和戈德堡的注意力加強假說獨立地進行控制,那麼將會出現什麼樣的結果呢?這樣我們就可以同時檢驗兩個相互競爭的假說:(1)LIP 區域輸送注意力訊號;(2)LIP 區域輸送意圖訊號。為了達到這一目的,我們設計了另外一組任務,該任務將科爾比、杜阿姆與戈德堡使用的注意力鎖定方法和安德森與佈雷斯韋爾使用的計劃改變方法結合到一起。 在此我需要停下來說明一下,簡單地說,這是一個愚蠢的主意。普拉特和我除了複製已經被做過的事情以外沒有做任何其他的事情。在理論上沒有任何新的見解,我們卻透過一套新任務一頭扎進了這場難以駕馭的語義爭論的中心。我們所做的這個實驗帶給我們的僅僅是安德森和戈德堡的爭論史上的一個腳註而已。我想將這最後一個傳統的頂葉皮質功能實驗告訴你們的原因就是:實驗得到的結果使我們確信決定做這個實驗是一件愚蠢的事情。要明白這個實驗如何使我們得出這樣的結論, 我還需要對這個實驗本身做一些說明。 暗示性掃視和分散式暗示實驗我們認為可以透過一個重新設計的實驗,同時對兩個互相競爭的假說進行檢驗,從而證偽其中的一個。這兩個互相競爭的假說就是:(1) L.IP 區域輸送注意力訊號;(2)L.IP 區域輸送意圖訊號。如果我們的實驗可以證明其中一個假說是錯誤的,那麼另一個關於頂葉皮質功能的模型就得到了支援,同時也就證明了可以在此模型的分析框架內理解LIP • 203 251

決策、不確定性和大腦— 一神經經濟學區域的功能(Platt and Glimcher,1997)(見圖10-9)。 暗示性掃視顏色暗示視線偏移分散式暗示顏色暗示錯誤選擇偏移 253 圖10—9 暗示性掃視和分散式暗示實驗我們開始在一系列的實驗中訓練猴子完成兩項任務,在這兩項任務中,我們可以對要求猴子去看的第二個刺激位置、猴子絕對不會去看的第三個刺激位置及其行為關聯性進行獨立的控制。每天在實驗開始之前,我們都要從LIP 區域隔離出一個單獨的神經元以便進行研究,並且讓猴子的眼球進行一系列的運動,使它的視線對準按次序出現在許多位置的第二個刺激訊號。我們利用記錄的資料來確定該神經元在LIP 區域地形圖中的位置,也就是這個神經元的最佳位置。另外我們還利用這些資料來確定無法啟用這一神經元的刺激和運動,也就是對這個神經元來說無效的位置。 一旦確定了這兩個位置,接下來我們就會讓猴子進行一系列如圖 10—9所示的暗示性掃視實驗。在每一次暗示性掃視實驗中,我們都是先點亮位於中心的黃色亮點並要求猴子去看。稍後,第二個和第三個目標被點亮,一個在最佳位置,另一個則在無效位置。再經過一段時間的延遲,我們以一種隨機的方式改變中心黃色亮點的顏色。在50%的實 • 204•

第10章機率、價值和神經網路:一個案例分析驗中,我們將它變成綠色;在其餘50%的實驗中,我們將它變成紅色。 猴子事先已經被告知,如果實驗時中心目標變成了紅色,那麼左邊的光點就是第二個目標(掃視目標),右邊的光點則是第三個目標(一個完全不相關的干擾項)。如果實驗時中心目標變成了綠色,與前面恰好相反,右邊的光點是目標,而左邊的光點為不相關的干擾項。不過, 在我們關閉中心亮點之前,猴子是不允許去看第二個目標的。在我們關閉了中心亮點之後,如果猴子注視了正確的目標,那麼它就會得到果汁作為獎勵。 也許看起來有點令人吃驚,猴子很容易就明白了這一切。這樣我們就有可能透過對兩種在視覺特性上幾乎完全相同但是在運動特性上卻相差迥異的實驗進行比較,並藉此檢驗運動意圖假說。在這兩類實驗中, 兩個偏離中心的目標會被點亮,一個在最佳位置,一個在無效的位置。 這兩類實驗的區別是,出現在最佳位置的偏離中心的刺激有著不同的含義。在50%的實驗中,最佳位置的刺激被看作是掃視目標,而在另外 50%的實驗中,則被看作是完全不相關的視覺干擾。我們的思路是,如果LIP 區域的神經元是運動意圖元素,那麼當出現在反應區域內的刺激是目標訊號時它們會有強烈的反應,當那個刺激是視覺干擾項時它就不會做出任何反應。 圖10-10的左半部分給出的是兩類實驗中40個LIP 區域神經元在三個不同時刻的平均啟用率,這三個時刻分別是:兩個偏離中心的目標剛剛出現的時候、注視的刺激點剛好變換了顏色的時候(識別掃視目標)以及掃視剛要開始之前。實線表示當注視的刺激點變成紅色並且猴子看著最佳位置時神經元的活動。虛線表示當注視的刺激點變成綠色並且猴子的視線離開最佳位置時神經元的活動。 30 看著最佳位置 --不相: 一相: { 廚20 視線離開-至基準線 . 0 光點目標識別運動光點百標識別運動時間圖10—10 暗示性掃視實驗的結果 254 • 205•

255 決策、不確定性和大腦——神經經濟學我們可以清楚地發現,在這兩種情況下LIP 區域的神經元是有區別的。在轉向最佳位置之前和轉向最佳位置的過程中,它們非常活躍。 當最佳位置處的刺激是無關訊號時,儘管它們的活躍水平有所下降,但是並不是完全平靜。事實上,儘管神經元的活動率很低,但它仍高於圖中虛點組成的水平線所表示的基準水平。這些資料告訴我們(如果不是毫無疑義的話),我們的第一個實驗證偽了意圖假說,因為當猴子試圖注視無效位置時,神經元依然對最佳位置的刺激做出了反應。 然後我們讓猴子又進行了一系列分散式暗示實驗,同時我們繼續對每個神經元進行研究。圖10—9所示的分散式暗示實驗,幾乎與暗示性掃視實驗完全相同。二者唯一的區別在於:在分散式暗示實驗中是利用第三個刺激(或干擾)的消失作為訊號而不是用中心刺激點的消失作為訊號,暗示動物應該開始掃視活動。由於存在這種區別,所以我們從兩類實驗中(暗示性掃視實驗和分散式暗示實驗)收集的每個神經元的信息使我們能夠在另外一組幾乎完全對稱的情況下比較LIP 區域中神經元的行為。在這兩種情況下,猴子被指引著去注視無效的位置。在第一個實驗中(暗示性掃視實驗),與最佳位置的刺激是完全不相關的。在另一個實驗中(分散式暗示實驗),最佳位置的刺激是非常重要的,因為它傳達著開始掃視的命令。 我們認為,如果注意力假說是正確的,那麼與暗示性掃視實驗相比,神經元在分散式暗示實驗中應該表現得更為活躍。在第一個實驗中,最佳位置是關鍵,而在第二個實驗中,最佳位置是不相關的。事實上,卡羅爾•科爾比的集中注視任務就是這樣要求的。圖10—10的右邊是我們得到的資料,實線表示在最佳位置的刺激是重要訊號的情況下,神經元的平均啟用率,虛線表示在最佳位置的刺激是無關訊號的情況下,神經元的平均啟用率。注意到在這兩種情況下,神經元的反應實際上是沒有區別的,顯然,這就同樣證明了注意力假說是錯誤的。 最初,普拉特和我發現這些資料很令人失望。雖然我們力圖把可能最具權威性的結論寫進我們的論文,但是結果只不過是證明了一個幾乎人所共知的結論:注意力假說和意圖假說在某種程度上說都是錯誤的。 最後要說的是,這是我們必須認識到的一件非常重要的事情,因為它迫使我們重新考慮我們的信念:感覺運動過程中所有訊號的特徵都可以透過運動或者是感覺表示出來。我們不得不問,是否既非感覺又非運動的訊號在原則上才是感覺運動過程中的要素。這個觀測結果使我們首次考慮是否應該放棄古典的理解感覺和行為關係的笛卡兒方法。 • 206

第10章機率、價值和神經網路:一個案例分析 10.4 一種替代性方法:目標、機率和價值當猴子按照我們的訓練完成暗示性掃視任務時,它們到底想做些什麼?它們試圖達到的行為目標是什麼?儘管沒有任何一個古典神經生理學家直接提出過這些問題,但是戴維•瑪爾的《視覺》使我們必須考慮這些問題。當一個理性的猴子在執行暗示性掃視任務時,它應該做些什麼呢?它應該以最快的方式,儘可能多地獲取草莓果汁。 假設猴子確實有一個目標,並且這個目標就是得到最多的果汁,那麼我們應該可以用一種經濟學的方法弄清楚為了實現這個簡單的目標, 它們應該怎樣去做。根據經濟學的方法,猴子首先需要知道將視線對準上面目標和下面目標得到獎勵的先驗機率。其次,猴子需要知道注視上面目標或下面目標時,它們能夠得到的果汁的數量;它們需要知道自己每個運動的價值。最後,猴子必須把對獲得獎勵的先驗機率的估計和對每一個運動的價值的估計結合起來,從而為每一種可能的反應確定一個類似於期望效用的測度。這樣它們將選擇並執行期望效用最高的那種運動。 我們還應該認識到,對於一個理性的猴子來說,隨著實驗的進行, 每個運動的期望效用也會隨之發生改變。在每次實驗的最初階段,在被關注的亮點改變顏色之前,猴子會根據每個運動獲得獎勵的先驗機率與每個運動的價值(更精確地說是效用)的乘積來確定期望效用。但是在中心亮點改變顏色之後,猴子會利用某種類似於貝葉斯估計的方法來確定關注上方目標和下方目標獲得獎勵的後驗機率。在暗示性掃視任務中,當中心目標的顏色改變之後,強化哪一種行動具有100%的確定性,這時猴子可以將對後驗機率的估計和對價值的估計結合起來,對每一種行動的期望效用做出更為精確的估計。對於經濟學家來說,這些變量都是考慮價值變化時必須使用的,但是在我們已經做過的實驗中卻一個也沒有用上。 機率編碼我們據此對暗示性掃視實驗進行了修正,並將其用於對簡單假設的檢驗(Platt and Glimcher,1999)。由於任何一個理性的決策系統必須對所有可能的結果進行編碼,因此我們設計了一個實驗來考察LIP 區 • 207• 256

決策、不確定性和大腦——神經經濟學域中的神經元是否載有獲獎機率的資訊。在已有的對LIP 區域的生理學研究中,任何一個活動得到獎勵的可能性通常是保持不變的。但是, 如果 LIP 區域參與了求解注視目標的計算過程,並且只有始終跟蹤概 257率變化的系統才有可能理性地解決這一問題,那麼LIP 區域中神經元的活動將很可能受到每個運動獲獎機率的影響。 我們實驗的目的是在改變被神經元編譯成碼的運動方式的獲獎機率的同時,給猴子展現相同的視覺刺激並且讓它做出幾乎相同的運動反應。如果我們能夠得到 LIP 區域中神經元的活動與先驗機率或後驗概率有關的證據,那麼我們就向前邁進了重要的一步(見圖10—11)。 20% 80% 258 圖10-11 在一組實驗中改變一個運動獲得獎勵的機率於是我們讓猴子再次來完成暗示性掃視任務。但是這一次,固定在中心的亮點變為紅色和綠色的機率系統性地發生變化。在我們向猴子展示的一組100次實驗中,將視線轉向右邊目標的運動有80%的機率得到強化,而將視線轉向左邊目標的運動則有20%的機率得到強化。這組實驗完成之後,在緊接著的另一組100次實驗中,這兩個機率也許會顛倒過來。當然,我們不可能提前告訴猴子相對機率是多少。隨著一組組實驗的進行,它們必須自己估算出這些機率,不過經過100次實驗後,我們可以期望它們對中心固定亮點變成綠色的可能性有所瞭解。不管怎樣,理性決策理論要求選擇者能夠追蹤這一類資料。進化過程確實會解決這一問題並將其深深地引入猴子的大腦之中。 現在回到我們實驗的目的上來,我們希望能夠檢驗的假說是:向上運動被強化的先驗機率或後驗機率將被 LIP 區域偏好向上運動的神經元編譯成碼。古典研究關注的是LIP 區域的訊號應該被看作是感覺的還是運動的,或者是注意的還是意圖的。為了不偏向爭論的任何一方, • 208.

第10章機率、價值和神經網路:一個案例分析我們決定尋找一種方法,在保持任務的感覺和運動特性不變的同時,只有獲獎機率可以發生變化。 在標準的暗示性掃視任務中,中心固定亮點有時變成紅色,有時變成綠色。在這兩種實驗中,不同的顏色表示向猴子提供了不同的感覺輸入。而在某些實驗中猴子向左看,在其他實驗中猴子向右看,則代表著不同的運動輸出。為了從我們的分析中排除這些感覺和運動特性,我們對實驗作了如下修改。當猴子完成了7組實驗之後(每一組都有不同的相對機率),我們只考慮中心目標變成某一種顏色而猴子也正確地將視線轉向同一個方向的那些實驗。這些實驗構成的子集在感覺和運動特性上是完全相同的。它們唯一的差別在於每種運動獲得獎勵的機率是不一樣的。從本質上說,我們的這種做法正是將我們過去的方法顛倒過來。 在過去的方法中,當我們進行暗示性掃視實驗時,我們讓機率和價值保持不變以便我們能夠判定LIP 區域的活動是與感覺有關還是與運動有關,得到的答案是兩者都不是。現在我們則是要在保持感覺和運動不變的同時改變機率。 當我們實際進行這項實驗時,細胞產生了一個明確的結果。一旦我們只是從資料集中挑選那些對猴子施加了相同的刺激並且也產生了相同運動的實驗,我們的發現變得更加明顯。如果向上運動將獲得獎勵的先驗機率較大,那麼當上方的目標出現時,LIP 區域中與向上運動相聯絡的神經元馬上會產生強烈的反應。如果向上運動將獲得獎勵的先驗機率較小,那麼LIP 區域中相同神經元對目標出現的反應則是微弱的。甚至當刺激和運動(古典模型中僅有的變數)在所有這些實驗中都相同時,仍然觀察到了神經元啟用率的變化。對於我們的研究來說,這強烈地暗示著先驗機率被 LIP 區域的神經元編譯成碼了。 那麼後驗機率又如何呢?如果我們分析實驗過程中神經元的活動方式,就會發現後驗機率同樣也被這些神經元編譯成碼。在每次實驗的開始階段,當上方的亮點被確認目標的先驗機率是80%或20%時, LIP 區域中的神經元會根據先驗機率產生強烈或微弱的反應。但是當中心固定亮點變成紅色以後,猴子就可以計算出現在的後驗機率是 100%,神經元的啟用率就會明顯上升。因為我們是從機率為80%和 20%的組中挑選的需要相同運動(雖然它們具有不同的先驗機率但是具有相同的後驗機率)的實驗,所以在顏色變化之後這兩組實驗中應該具有相同的神經元激發率。同前面的實驗一樣,這正是我們要觀測到的結果。在實驗的開始階段,先驗機率似乎被 LIP 區域的神經元編譯成碼 • 209• 259

260 決策、不確定性和大腦——神經經濟學了,而在實驗的後期階段,後驗機率同樣也被神經元編譯成碼。 也許這個觀察結果最具批判性之處就在於它似乎公然違背了巴甫洛夫的“必要性”標準。在這個特殊的任務設計中,猴子並不需要追蹤先驗機率,因為在實驗的最後階段,無論中心固定亮點變成紅色還是綠色,後驗機率總是很清楚也是很確定的。然而在整個實驗過程中,神經元似乎一直在緊密地追蹤著機率。 圖10—12給出了 LIP 區域中典型神經元在實驗過程中如何反應的例項。粗黑線和粗灰線描述的都是在中心固定刺激點變成紅色之後,猴子將視線轉向上方的實驗中神經元的平均啟用率。在所有的實驗中刺激和反應都是相同的,因此從定義上說,這裡的行為具有確定性。以黑線繪出的結果來自一組中心刺激點以 80%的機率變紅的實驗,而以灰線繪出的結果來自一組中心刺激點以 20%的機率變紅的實驗。我們可以注意到,雖然在這些實驗中感覺和運動特性是相同的,但是在先驗機率不同的情況下,神經元反應的差別還是相當大的。 100 1001 先驗機率 75 動 275 20% 50 501 25 25 0 A -500 目標出現 500 時間 Food 1 500 ms 0 0.0 0.5 1.0 機率圖10—12 機率實驗中 LIP 區域神經元的活動注:左邊圖中每-列記號代表20次實驗中以具體時間表示的神經元活動潛能,圖中的粗實線就是根據各行的平均結果繪出。 實驗早期,當偏離中心的刺激剛被點亮時,在兩種不同條件下觀察到的神經元啟用率存在著巨大的差異。在固定刺激點剛剛變紅色之後,也就是在每組實驗中後驗機率變為 100%的那一點,神經元的啟用率相同。在某種意義上,LIP 區域中的神經元似乎載有與即時機率有關的運動將被強化的資訊。在實驗的早期,被神經元編譯成碼的運動得到強化的機率要麼是20%,要麼是80%。而在實驗的後期,在兩組實驗中都具有100%的強化率,此時兩組實驗中神經元的啟用率實現了收 •210

第10章機率、價值和神經網路:一個案例分析斂。如果 LIP 區域中的神經元確實帶有某種運動獲獎機率的資訊,那麼以上觀察到的結果正好就是我們期望的反應方式,而這種反應方式是以反射為基礎的感覺一運動理論無法預測同時也不需要的。 為了確定神經元傳送各種運動獲獎先驗機率資訊的效率,我們為猴子設計了7組不同的實驗,在這些實驗中固定刺激點變為紅色的機率是系統變化的。我們接下來需要考慮,在這7組實驗中,神經元的平均激活率水平與編碼後的運動獲獎先驗機率之間的相關程度如何。如圖 10—12 所示,啟用率與固定刺激點變為紅色的先驗機率是緊密相關的, 這正是我們期望的神經元將向上運動獲獎機率編碼後應該出現的反應方式。為了對幾個不同的神經元分別檢驗這種反應方式,我們在LIP 區域中選擇了20個神經元進行實驗。我們發現有75%的神經元在實驗中的某個時刻,啟用率與先驗機率之間表現出了很明顯的統計顯著性。 價值編碼就像茂特凱索、戈德堡和安德森已經指出的那樣,上面的資料表明,在後部頂葉皮質中存在一個既非感覺又非運動的訊號。至少在這個實驗中,訊號看起來似乎與運動將被強化的機率有關。但是正如我們所看到的,所有基於經濟學的決策理論在本質上都需要確定兩個關鍵的變量:某一結果出現的機率和相應的價值。這就促使我們去考慮LIP區域的神經元是否也傳遞每個運動對於動物的價值的資訊。 為了檢驗這種可能性,我們再一次進行暗示性掃視任務。同前面一樣,我們要進行一系列每組100次的暗示性掃視實驗,但是實驗中中心刺激點變為紅色或者綠色的機率總是固定在50%。在組和組之間,我們將改變動物將視線轉向上方(或下方)能夠得到的獎勵的數量。在第一組實驗中,如果動物正確地將視線轉向左方將得到 0.2毫升的果汁作為獎勵,如果它正確地將視線轉向右方將得到0.1毫升的果汁作為獎勵。在第二組實驗中,如果動物正確地將視線轉向左方將得到0.1毫升的果汁作為獎勵,如果它正確地將視線轉向右方將得到 0.2毫升的果汁作為獎勵。 圖10-13給出了在這些情況下 LIP 區域中神經元的活動。我們像前面一樣選擇了具有相同的感覺—運動特性的實驗,唯一的差異是兩種運動方式相對於猴子的價值有所不同。我們可以注意到,在動物預期能夠得到更多獎勵的實驗中,這些神經元的啟用程度較強(黑線);在動物預期會得到較少獎勵的實驗中,神經元的啟用程度較弱(灰線)。 • 211• 262

決策、不確定性和大腦- -神經經濟學 263 100 100 神經元的活動 75動 751 • Large Gain • Small Gain 50 50 25 25 0 -500 目標出現 1^500 時間 10o6 1 500 ms 0 0.0 0.5 1.0 機率圖10-13 價值實驗中 LIP 區域神經元的活動同上一個實驗一樣,我們也考察了在實驗的初期階段7種不同運動的價值如何影響這些神經元的啟用率。我們又一次發現啟用率與傳統的決策變數(在本例中指的是價值)是高度相關的,即便是在實驗中的感覺運動特性保持不變時也是如此。我們用這種方法一共檢驗了40個神經元,最後發現其中 62.5%的神經元在實驗中的某個時刻,在獎勵的價值和啟用率之間表現出顯著的統計相關性。 最後我們還注意到,如果我們仔細觀察啟用率和價值之間的關係, 就會發現另外一些更微妙的關係,這些關係也許更容易引起丹尼爾•伯努利的興趣。在可能獲得的果汁數量接近於最大值時,實際的資料點由上升逐漸趨於平坦。實際的資料點好像是以一種類似於古典效用函式的形式趨於平坦。這也許暗示著LIP 區域中的神經元是將果汁的效用而不是果汁的數值編譯成碼——正如伯努利認為的那樣。 儘管這些結果很難被看作是對某種論述的決定性證據,但是它確實提出了一種可能性—即便是將視線對準一個亮點這樣簡單、確定的行為,以經濟學為基礎的計算理論可以使我們理解大腦在進行決策時會試圖做些什麼。因為我們發現了L.IP 區域中的神經元將機率和價值(也許是效用)編譯成碼的證據,所以我們似乎可以認為,LIP 區域中的神經元將類似於經典期望效用函式的某些東西編譯成碼了。 引導選擇行為的變數對於我和普拉特來說,這些實驗表明,LIP 區域的神經元傳送了與猴子在實驗最後階段運動方式的期望效用有關的資訊。儘管這個結論很有趣,但是它並沒有告訴我們當猴子可以完全自由地選擇運動方式時這 • 212•

第10童機率、價值和神經網路:一個案例分析些神經元到底做了什麼。如果L.IP 區域的神經元確實能夠影響動物採取何種運動方式的決定,那麼我們就能夠說明每種運動方式的價值將以同樣的形式對動物的行為和LIP 區域神經元的活動產生影響。 為了檢驗這個假說,我們還需要設計一個實驗。在這一實驗中,當我們改變兩種可能的運動方式的價值時,猴子可以自行決定是向上看還是向下看。這樣我們就有可能說明運動方式的價值與猴子向上看的機率以及LIP 區域中神經元的活動是相關的。為了能夠實現我們的目的, 我們選擇了哈佛大學的心理學家理查德 •赫恩斯坦(Richard Herrnstein)最先提出的一個有關選擇的經典實驗(1961;關於此類文獻的綜述,參見赫恩斯坦,1997)。這個最初由赫恩斯坦在20世紀60年代設計的實驗,在隨後的20年中,被人們做了一遍又一遍。實驗是這樣設計的:一共有兩個槓桿,鴿子可以選擇踩踏其中的任何一個。一個槓杆會獎勵鴿子大顆的食物,但獎勵次數很少;另外一個槓桿則獎勵鴿子小粒食物,但是獎勵次數很多。透過控制兩個槓桿發放食物的時間間隔分佈、每個槓桿發放食物顆粒的大小以及兩個槓桿之間的距離,赫恩斯坦和他的同事發現,可以引導鴿子對兩個槓桿產生交替反應,它們會選擇每次都踩踏其中的某一個槓桿。總體上來看,赫恩斯坦發現,鴿子踩踏每個槓桿的比率等於單位時間內它們在每個槓桿上可能獲得的獎勵與總獎勵之比。他把這種關係叫做匹配法則。[] 為了採用這個基本方法,我們訓練猴子去完成被修改了的暗示性掃視任務,我們把它叫做自由選擇任務。在完成這一任務的過程中,猴子起初注視正前方中心的黃色亮點,稍後會出現另外兩個偏離中心的黃色亮點,經過少許的延遲,中心亮點會消失,這時動物可以自由地選擇去注視另外兩個亮點中的任何一個。不管它注視哪個亮點都會得到獎勵。 在不同組的實驗中我們改變的是這兩種運動給猴子帶來的價值。在第一組實驗中,如果猴子決定向右看,它就會得到 0.2毫升果汁作為獎勵; 如果它決定向左看,就會得到0.1毫升果汁作為獎勵。第二組實驗中獎品的發放辦法與此正好相反。 需要著重強調的一點是,我們的實驗與赫恩斯坦的實驗並不是完全相同的。在赫恩斯坦的實驗中,鴿子所面臨的那項任務的最優解決方案,就是將踩踏每個目標的機率與這一反應可能帶來的獎勵同可能的獎勵總數匹配起來,匹配行為是最優策略。而在我們的實驗中,由於具體實驗設計中的一些次要特徵,我們的實驗與赫恩斯坦的實驗是有差異的。猴子的最優策略是辨別具有更高價值的運動,然後就一直這樣做直 • 213• 264

決策、不確定性和大腦- —神經經濟學到100 次實驗結束。 我們以這樣的方式進行實驗是有原因的。因為許多實驗表明,如果把人們作為實驗物件進行我們的實驗,即使是在很短的時間內,他們仍會表現出匹配行為。只有在進行了大量的實踐之後人們才會轉向最優策略。做出這一轉變之後,在每一組實驗開始之前,人們會檢驗每個槓杆,看一看哪一個具有更高的價值,然後他們會一直選擇能帶來更高價值的槓桿。以選擇心理學的術語來說,人們從匹配行為轉向最大化行為。正如我們稍後將會看到的那樣,決定以這種方式進行實驗是一個關鍵性的錯誤。 在這種情況下考察猴子的行,我們可以發現猴子選擇的是匹配行為(儘管這只是一種次優策略)。我們還發現,動物注視左邊目標的概率是向左看能獲得的獎勵在總獎勵中所佔份額的函式。在這個例子中, 動物向上看的機率等於向上看所能獲得的獎勵除以能夠獲得的獎勵總和。 Plooks lelt= Rlxoka left Rlooks left + Rlooks right (10. 1) 其中,Rlooka let表示在所有實驗中都看左邊的目標所獲得的獎勵總和,Rlooks Tieh表示在所有實驗中都看右邊的目標所獲得的獎勵總和, Plookalet:表示動物看左邊目標的機率。 在這種情況下,LIP 區域中的神經元會做些什麼?為了回答這個問題,我們記錄了動物完成自由選擇任務時40個 L.IP 區域中神經元的活動。像前面進行過的實驗一樣,我們挑選出來進行分析的實驗都是動物的行為最有利於這些神經元的實驗。在所有的實驗中,感覺特性和運動特性都是相同的,並且在這些實驗中受試者可以做出自己的決策。這些實驗的差異僅僅在於兩種運動對於猴子的價值是有差別的,在這種情況下價值變數控制著動物的匹配行為。這也是猴子選擇向上看和向下看的平均比率。 圖1014描繪出了實驗中一個典型神經元的資料,在所有的這些實驗中動物都選擇向左看。這些實驗又可以分成兩種,一種是猴子本來就很想將視線轉向左方,實際上它們也是這麼做的,黑色的粗線描繪出了這類實驗中的神經元啟用率;另一種是猴子本來不願意將視線轉向左方,但由於種種原因最後還是將視線轉向了左方,灰色的粗線描繪出了這種情況下的神經元啟用率。我們可以注意到在這兩種實驗中神經元反應的差別是相當大的。 • 214•

第10章機率、價值和神經網路:一個案例分析 40 神經元的活動 20 二米接盤 266 0 -500 目標出現 500 4000 1 500 ms 時間圖10-14 猴子自己做出選擇時LIP 區域中一個神經元的活動既然實際的選擇和LIP 區域中神經元的啟用率是同時改變的,那麼我們認為到了探討行為與神經元活動如何聯絡的時候了: 參與者做出的實際選擇可以被看作是對每次實驗中與動物做出的反應相關的價值的估計,而神經後設資料與動物決策過程的外在行為表現是直接相關的⋯⋯ 而這個實驗的目的是把神經元活動與動物對兩個可能的運動方式的價值估計直接聯絡起來。圖 4a展示出了在被記錄的時間段內參與者在所有的實驗中所做出的選擇。在下面兩個因素之間存在著線性關係:參與者選擇了反應區域內目標的實驗次數佔實驗總次數的比例和將視線移向那個目標所能獲得的果汁數量佔全部可能獲得的果汁總數的比例,這一點與選擇行為的赫恩斯坦匹配規律是相一致的⋯•• 為了分析每次實驗中神經元的活動與參與者做出的選擇的價值之間的關係,在每個實驗中我們都對落入反應區域的每個運動的主觀價值進行估計。根據赫恩斯坦的改善理論,這一估計透過計算動物在每10次 (估計值)實驗裡從兩個可能的選擇中獲得的強化比率的差異而得到。 圖4b(圖10—15)顯示的是,在所有動物將注意力移向反應區城目標的實驗中,在每個被測量的期間內,神經元的平均啟用率可以表示這個估計價值的函式。當落入反應區域的運動的估計價值增加時神經元的平均啟用率也增加了。 在我們的自由選擇任務中,猴子和其後部頂葉皮質神經元表現得就好像它們已經知道了與每個不同的運動相聯絡的收穫一樣。這些發現支持了下面這個假說:被經濟學家、生理學家和生態學家所識別的並且在決策中又是非常重要的這些變數在神經系統中得到了充分的體現。(Platt and Glimcher,1999) • 215•

決策、不確定性和大腦一神經經濟學 267 神經元的活動 40 0 -0.12 o.o'0.12 估計值圖10-15 猴子自由選擇時 LIP 區域中神經元的活動與運動價值的估計值之間的對比。 10.5 小結對於我來說,這個實驗強調了一個非常重要的觀點。如果我們想要弄清楚大腦如何實現感覺和運動之間的聯絡,那麼我們就有必要去思考這個系統應該努力達到的目標是什麼。至少從巴甫洛夫(也許從笛卡兒)開始,理解大腦怎樣將感覺和運動聯絡起來的基本技術一直就相當於這樣一個問題:引發這種行為或這種神經元反應的最小複合刺激是什麼?在很大程度上,問題的焦點在於識別運動輸出的方式,然後再考察這種運動方式是如何被外部世界中的事件所引發的。但是根據古典反射論術語對感覺一運動過程的定義,從原則上說,只能將作為感覺世界直接產物或者肌肉組織輸出的神經生物學過程包括在內,其他的系統只不過是控制這兩個最重要的系統之間的連線的“閘門”而已。 相反,當我們考慮感覺一運動過程試圖解決哪些問題時,我們不會從把那些既非感覺又非運動的因素從中心位置排除開始。如果一開始就從最廣泛的意義上考慮神經系統正在努力解決什麼問題,那麼我們將得到一個非常直接的答案:神經系統正在努力解決的問題就是最大化組織的內在適應度。在暗示性掃視任務這個案例中,至少從原則上說,得到更多果汁的猴子比得到更少果汁的猴子具有更強的適應性。雖然,在更加複雜的情況下定義最大化內在適應度的行為也許是一個非常困難的問題,但是,這個方法的確對神經系統如何解決感覺一運動問題做出了清晰的預測。識別不太複雜感覺和運動之間的聯絡的努力是不可能得出這 • 216•