AI 新聞與投資

夠確定是哪些內容構成了一個最優解決方案的時候，動物們幾乎就能成功地獲得這些解決方案，而且動物們的解決方案與最優解決方案驚人地相似。在接下來的幾章中，我將舉一些有關神經過程的具體例子。如果利用經濟學工具為神經系統定義與適應度有關的目標，這些例子是很容易被理解的。在本章中我想說明經濟學的基本工具也許是用於研究行為與大腦之間關係的一個非常有前景的工具。利用經濟學的方法我們能像瑪爾那樣定義動物所面臨的問題。正如他所言：“試圖只透過研究神經來理解感知過程就像只透過研究羽毛來理解鳥類的飛行一樣，那是不會獲得成功的。為了理解鳥類的飛行，我們必須理解空氣動力學。”我想對行從203 總體上做出一個類似的結論：試圖只透過研究反射弧來理解行為與大腦之間的關係是決不會取得成功的。為了理解大腦怎樣解決感覺運動問題，我們必須理解由生物體所處的環境引起的感覺運動問題，而且我們還必須對這些問題有一套理論，貝葉斯經濟數學就是這樣的理論。註釋［1］生物體的內在適應度是指生物體基因的繁殖速度，並且這種繁殖速度應該明確地將透過兄弟姐妹及其他親屬基因繁殖和自我繁殖都包括進來。有關威廉•漢密爾頓提出的內在適應度的論述，請參閱愛德華 •威爾遜（E. O. Wilson's） 1975年的《生物社會學》或羅伯特•特裡弗斯（Robert Trivers）1985年的《社會進化》。漢密爾頓對這一課題的開創性研究被認為是進化論發展程序中的重要標誌。（Hamilton， 1964a,1964b）［2］實際上，這一悖論是由聖彼得堡的一位遊樂場場主最先發現的。［3］正如史蒂芬•斯蒂格勒（Stephen Stigler）早已指出的，托馬斯 •斯蒂姆森（Thomas Stimpson）才是第一個提出逆機率思想的數學家，但是貝葉斯發展了現代逆機率得以產生的數學方法（Stigler， 1989）。［4］我應該指明的是，在這個特定的例子中P（A）實際上是指機率函式，而不是機率密度函式，因為這裡波長被看作離散的變數。雖然這對我的說明幾乎沒有什麼影響，但是公平地講，符號的濫用將會使具有更多數學知識的讀者感到煩惱。 • 165•

第9章進化論、機率和經濟學 17 世紀50年代，如果帕斯卡和笛卡兒有機會於晚餐後在巴黎沙龍討論數學問題的話，那麼他們將為下一個世紀數學的發展指出兩個迥然不同的方向。根據帕斯卡的觀點，為了理解和模型化這個世界，機率論的演算法是必需的。笛卡兒則持反對意見，他指出對物質世界的真正瞭解只需要確定性數學模型。笛卡兒和帕斯卡在法國貴族團體裡的彬彬有禮的爭論過去了150年之後，貝葉斯、拉普拉斯和伯努利終於成功地證明：機率演算法可以用來描述偶然世界中的不確定性，同時也可以用來確定該世界中複雜問題的最優解。雖然他們的工作沒能使機率理論在19世紀的數學領域佔據中心位置，但是機率理論對歐 • 166• 205

第9章進化論、機率和經濟學洲的知識界仍然產生了重要和深遠的影響。然而無論如何，笛卡兒的（確定性）觀點在歐洲有關神經系統的思想裡繼續佔據著主導地位。甚至於到了今天，帕斯卡的觀點也只是偶爾地被生物學界提及。以19世紀馬歇爾•霍爾的工作為例，他基於確定性大腦的觀點建立了自己的生理學模型。他於19世紀30年代提出的反射弧概念正是笛卡兒“神經系統完成了從感官到運動的反射”這一傳統觀點的具體體現。神經系統是一個時鐘結構，在這個時鐘裡，反射就像機器中的齒輪那樣發揮著自己的作用。現在再來回顧這一觀點，這種過於強調行為的確定性的思想看起來已經顯得有些怪異了。所有的動物，就像帕斯卡的 206 賭博出資人一樣，它們的行為必然是與不確定世界中的或然性機制相互作用的結果。然而，不可否認的是，19世紀到20世紀期間，機率論在除了生物學以外的其他領域得到了充分的發展，並且也取得了很大的成就。在幾乎所有的社會科學和行為科學的定量思考中，有關機率和價值的數學理論都是最核心的內容，機率論成為了經濟學的基礎以及圍繞著它產生並發展的行力科學的最大亮點。在本章中我想說明的是：一組生物學家是如何開始沿著帕斯卡的思想，利用經濟學理論去更好地理解動物的行為，並且明確地檢驗“動物透過進化產生了最大化內在適應度的行為”這個假設。這些科學家、行為生態學家形成了一個很小的但卻是不斷壯大的團體，他們用機率和價值理論來識別進化論確定的目標，也就是原則上動物應該試圖達到的目標。然後，他們透過檢驗動物的實際行為來測定動物可以在多大的程度上接近根據理論確定的目標。或許稍顯怪異的是絕大多數行為生態學家很固執地堅持不去研究生理學、神經生理學或者大腦。作為一個團體，這些行為科學家一直努力使他們自己遠離潛藏在行為下面的機制，他們的工作很少涉及大腦的功能，但是他們卻在與神經科學有關的重要領域取得了巨大的進步。他們已經開始使用進化論的方法去研究機率和價值，並且用數學的語言去描述行為的目標。 9. 1 作為理論方法的行為生態學從20世紀50年代開始，行為生態學家就試圖建立描述最優行為策 • 167•

決策、不確定性和大腦—神經經濟學略的量化模型去理解動物為什麼按照我們觀察到的方式採取行動。他們的目標是要解釋動物為什麼會選擇一種富含營養的食物而非其他，為什麼動物會選擇這個配偶而不是另一個。在試圖理解動物為什麼會以它們實際表現出來的行為方式採取行動時，行為生態學家們假設動物必須針對環境中存在的問題採取有效的解決方式，從而最大化它們的基因繁殖率。他們認識到，在不確定的世界中，有效的解決辦法只能透過機率理論來描述。因此這些科學家把經濟學的公式作為工作的起點，以經濟學為基礎的理論在行為生態學的研究中隨處可見。例如在約翰•克雷布斯（John Krebs）和尼古拉斯 • 戴維斯（Nicholas Davies's）的經典教材《行為生態學》第三版中，克雷布斯和亞歷山德羅•卡西尼克（Alejandro Kacelnik）在“決策”一章中有以下描述：春天，如果你花幾分鐘觀察一隻小鳥，比如歐洲的知更鳥，你將會看到它有多種動作。當你第一眼看見它時，它可能正在地上尋找食物。一會兒，它會飛到一棵樹上並且唱歌，一段歌聲之後，它停下來用嘴梳理羽毛或者簡單地坐下“休息”。如果你對它連續觀察數天，就會看到這小鳥日復一日的生活方式。比如，在早晨將會有更多的歌聲，並且在中午有更多的休息。另一方面，如果你只集中觀察一種行為，比如覓食，你將會發現這個行為可以被分解成一系列的組成部分。知更鳥可能有時在草地上覓食，有時則徜徉在花叢中；有時它俘獲蠕蟲，有時則俘獲飛行中的昆蟲。在這一章，我們將提供一個描述性的框架，透過它來理解並預測各種各樣的活動方式。我們把動物看作一個“決策選擇者”，當然這並不意味著知更鳥會進行任何有意識的選擇，不過它們還是在做出“決定”；是去唱歌還是進食，是去吃蠕蟲還是去吃昆蟲，是去草地上尋找食物還是去花壇上。我們將會看到如何透過成本和收益的方式來分析這些可供選擇的行動方案。成本和收益最終透過達爾文適應度（生存和繁殖）來衡量，並且可能在很多的例子裡面，透過一些其他的更加直接的度量方法諸如能量支出、食物的攝入量或者身體恢復狀況—來測量。稍後我們將會看得更為清楚，透過成本和收益來分析它們的選擇不能不考慮生理學和心理學的因素，因汐這些因素可能會構成對動物行為的限制。與決策相應的適應度結果，以及限制動物選擇的多種約束，可以透過最最佳化建模而被統一在單一的分析框架中。最最佳化建模對我們透過成本和收益來分析知更鳥決策過程最有幫助的是最最佳化建模。這種生物學方法中蘊含的邏輯（與經濟學或決策理論形成對照） • 168•

209 第9章進化論、機率和經濟學是達爾文主義的。這種思想認，選擇是一個重複和競爭的過程，最終它將產生一種結果（顯性），這種結果正好代表著成本和收益之間可達到的最優均衡。這些適應性通常是如此的精緻（一個典型的例子是很多善於隱藏和偽裝的昆蟲能夠與它們的背景渾然一體）以至於在前達爾文時代，它們被認為是神聖造物主的傑作。現在它們被認為是自然選擇的結果，並且是一些最優分析的合適素材。（Krebs and Davies,1991）行為生態學是古典經濟學（上一章所描述的）與行為生物學的融合，而且在對很多種行為的研究中已經碩果累累。例如，在關於狒狒如何選擇配偶以最大化它們的內在適應度的經典研究中，羅賓•鄧巴（Robin Dunbar,1984）用經濟學方法革命性地改變了生態學家思考繁殖的方式。他的文章標題《繁殖選擇：一個關於加拉達狒狒群居策略的經濟學分析》，也反映了行為研究和經濟學研究的深度融合。但是這種對動物行為進行經濟學分析的方法最初獲得的成功，乃是來自於對動物覓食決策過程的研究。覓食理論生態生物學興起於20世紀60年代中期，當時有很多研究者開始明確地考慮經濟學模型和動物覓食決策過程的聯絡。這些生物學家們推測，如果我們能夠按經濟學的研究方式動物確定一個搜尋和享用食物的最優策略，那麼我們就能夠透過研究現實中動物的行為，在檢驗進化過程使行為臻於可定義的最適宜狀態（在這個例子裡是最優進食效率）的假設的同時，也可以驗證利用經濟學工具為行為建模的可行性。這一思想首次出現在1966年同時出版的兩份里程碑式的報告裡，正如羅伯特•麥克阿瑟（Robert MacArthur）和艾裡克 • 皮安卡（Eric Pianka）在其中的一篇中所指出的：經濟學理論和種群生物學理論是緊密聯絡和平行發展的。然而，在生物學裡，生物體的幾何特性和它們所處的環境起著更重要的作用。不同的外形具有不同的獲取資源的能力，並且在環境中這些資源以大雜燴的形式分佈在三維空間裡。在這篇文章裡，我們力圖搞清楚的是，當某一種群以最經濟的方式行動時，它們會在怎樣的環境中獲取食物以及它們的食譜中將以何種食物溝主。我們的希望在於，自然選擇將使所有的種群實現時間和能量支出的最優配置，但是這些“最優理論”是需要檢驗的假設而非任何確定無疑的事實。（MacArthur and Pianka,1966） • 169•

決策、不確定性和大腦——神經經濟學麥克阿瑟和皮安卡的文章《關於混雜環境的最優利用》作為了•麥瑞特 •艾姆倫（J. Merrit Emlen）的文章《時間和能量對食物偏好的影響》的姊妹篇，發表在《美國自然學家》上。就像艾姆倫在他的報告裡所指出的：我們可以假設，在特定物種肉體和神經的限制範圍內，自然選擇將透過影響的方向和強度促進能夠最大化每個個體在單位時間裡淨卡路里攝入量的進食偏好的發展（不管以哪種方式——先天的或者後天形成的）。（Emlen,1966）這兩篇文章開創了覓食理論和另一個更大的學科—行為生態學。它們依靠經濟理論來確定生態學目標，並且根據他們的假設，自然選擇將引導動物的行為趨向於這一目標。在這兩篇文章發表後的十年內，行為生態學在理論上和實踐上都取得了很大的進步，以下的假設看來已經得到了證實：這種經濟學方法使行為生態學研究發生了革命性的變化。20世紀70年代，華盛頓大學的艾裡克• 恰爾諾夫（Eric Charnov）和戈登 • 奧裡安（Gordon Orians）實現了另一個飛躍，他們發展了一個更加先進的方法來解決麥克阿瑟、皮安卡和艾姆倫提出的問題。恰爾諾夫（Charnov，1973）和奧裡安方法的基本假設與麥克阿瑟、皮安卡和艾姆倫的相同，即更有效地收集食物的動物將比低效率收集食物的動物達到更高的適應度水平。恰爾諾夫和奧裡安假設，如果兩種非常相似的動物為了相同的食物資源而競爭，能夠高效採集食物的物種將作為更加有利的變種而被“保留”下來，而不能有效採集食物的物種將會被大自然“拒絕”。這就是達爾文所說的“自然選擇”過程。怡爾諾夫和奧裡安解釋說，所有覓食動物的目標，都是有效地收集食物。而這就意味著，原則上所有的動物都必須以儘可能少的能量支出收集盡可能多的食物。 20世紀70年代，恰爾諾夫和奧裡安認為，收集食物的過程可以分為兩個子問題【，每一個子問題都可以用一個不同的經濟學模型加以描述。正如他們所觀察到的，動物面臨的第一個問題是，當它們遇到一種可食的東西時，需要決定是否吃掉它。例如，一隻獅子在決定襲擊和試圖吃掉一隻動物之前，也許會看到許多可以捕食的動物。這頭獅子在遇見一隻它想要攻擊的疣豬之前，可能會先看到一頭水牛、一條土狼或者一隻狐狸。潛在獵物的大小、捕獲獵物需要的時間以及這種獵物的稀缺 • 170•

211 第9章進化論、機率和經濟學性都可能影響獅子的選擇。一個草食動物，比如說斑馬，要決定到哪個地方吃草時，也會面臨相同的問題。在它選擇一塊草地之前，可能會遇到不同面積和不同質量的草地。恰爾諾夫和奧裡安把這類問題均看作捕食選擇問題：給定我對當前這個世界的瞭解，以及我所看到的潛在的食物，我應該努力去吃我已經找到的這個食物嗎？一旦動物確定了一個獵食目標，恰爾諾夫和奧裡安認為，它最終必須做出第二個決定，即什麼時候停止進食。再次考慮我們的斑馬。遇到很多草地之後，斑馬選擇其中一塊並停下來進食。當斑馬在一個區域把草吃到一定程度時，這個區域的草就會變得稀少。透過一種動態分析可以表明，隨著這個草地的草逐步吃盡，斑馬每分鐘草的攝取量會減少。那麼，什麼時候斑馬應該停止吃這個草地上的草，並開始尋找另一塊草地呢？這個決定會受到其他事情的影響，比如其他可獲得的草地的質量，以及到下一片草地的距離。同理，獅子也必須決定什麼時候停止吃死疣豬的屍體以便它可以開始尋找另外一頓美餐。恰爾諾夫和奧裡安把這類決策看作草地駐留問題：當我攝取能量的速率降低時，給定我對周圍世界的瞭解，什麼時候我應該停止吃草並開始尋找一塊新的草地？當恰爾諾夫和奧裡安開始建立模型來描述草地駐留和獵物選擇的最優策略時，他們發現這兩個問題有著非常不同的解決方法。決定在一片草地的理想駐留時間時要求分析在那塊草地上進食時的能量獲得率。因此，恰爾諾夫的草場駐留模型以一組描述決策如何改變卡路里獲取速率的邊際價值方程為基礎。捕食模型則建立在一個覓食理論早期模型的基礎上——霍林的圓盤方程（霍林，1959）——該方程用來描述螳螂的捕食行為。因為這一模型已經在實踐中得到了很好的驗證，並且它還是一個以經濟學理論為基礎的模型替代確定性反射模型的範例，所以我們有必要用一定的篇幅來分析這一捕食模型。捕食模型想象一個飢餓的蝴蛛正靜靜地趴在蛛網的中央，突然一隻蒼蠅被蛛網的邊緣纏繞。蝴蛛腳部的振動感覺神經被啟用，它開始轉動自己的身體，使它身體的軸線與振動絲線的軸線對齊。這時絲線仍然還在振動，於是蝴蛛沿著振動的絲線向外移動直到碰見蒼蠅。當蒼蠅的影象進入了它的視網膜時，蝴蛛開始用絲去纏繞蒼蠅，把它卷在網裡。一旦蒼蠅被完全纏繞起來，蝴蛛就會將這一網袋刺破，然後開始液化和享受它的獵物。反射理論就是用來描述這種行為的。 • 171•

決策、不確定性和大腦——神經經濟學後來我們又觀察到，一隻微小的果蠅撞在網上並引起了絲線的振動，但是這一次蝴蛛卻視而不見。實際上我們還可以觀察到，在一整天中，每次果蠅撞在網上時，蛛蛛都置之不理，它只吃那些更大的蒼蠅。如果我們在不同的時間、不同的環境條件下對這隻蛛進行更仔細的觀察，就會注意到一些特別的現象。比如，只有在蒼蠅很少的那些天裡，這隻蛛才會抓住每一隻撞在網上的果蠅。也就是說，我們所觀察到的蜊蛛攻擊果蠅的機率，似乎完全依賴於它遇見蒼蠅的機率。如果我們試圖透過行為目標來理解這個觀察結果，那麼這將是一件非常有意義的事情。蝴蛛想要獲得足夠的食物，而且它必須以最有效的方式達到這一目的，這就需要它將蒼蠅出現的頻率充分考慮在內。毫無疑問，我們可以設計出能產生這種行為的一組複雜的連鎖反射機制。我們可以設定，蒼蠅撞擊蛛網所引起的反射頻率控制著果蠅撞擊蛛網引起反射的閾值。以反射作為基本單元，我們就可以生成這樣的行為方式。但是，在蛛神經系統的功能方面，這種模式能告訴我們多少呢？如果我們發現有一天，當蜻蜓數量很多時，蝴蛛就不再理會蒼蠅，那麼，為瞭解釋這個觀察結果，我們就需要假設另外一組相互聯絡的反射機制。覓食理論家認為，像這樣的行為不能以這種孤立的方式來理解，而是需要一整套捕食理論。在一個隨機的且不可預知的世界裡，最佳捕食行為是以最少的努力獲得最大的能量攝取率的過程。在恰爾諾夫最初的方程裡（1973），捕食模型專門用來確定任何一種動物的最有效率的捕食策略。也就是說，它是一個定量分析的數學工具，可以用來理解動物（例如我們上面提到的蝴蛛）選擇食物時的決策過程。作為一個以經濟學為基礎的最佳化模型，它同時也意味著節儉。它是在一個統一的框架下試圖描述所有動物的捕食選擇行為，而不是以孤立的方式來考察行為。這種完整的捕食模型已經被多次提出，幾個研究者也各自相對獨立地發展了這一模型。然而，在行為生態學領域，恰爾諾夫的兩個同事，大衛 •斯蒂芬（David Stephens）和約翰 • 克雷布斯.（John Krebs）提出的模型最具有權威性。20世紀80年代中期，斯蒂芬和克雷布斯曾經撰寫了一本名為《覓食理論》的書，這本書後來成為行為生態學誕生的宣言和必備的手冊（斯蒂芬和克雷布斯，1986）。在下面對捕食模型的描述中，凡是涉及恰爾諾夫模型的地方，我大部分都借用了斯蒂芬和克雷布斯在描述恰爾諾夫模型時提供的例項，只是沒有像他們那樣使用過多的數學。恰爾諾夫認為，可以將尋找合適的食物的過程想象為一個以如下方 • 172 212

214 第9章進化論、機率和經濟學式進行的沒有終點的迴圈過程。尋找食物的第一步是開始搜尋—搜尋在這裡的意義是指任何花費時間的活動，並且在這個活動中覓食動物可能會遇見一些可吃的食物。對一隻蝴蛛來說，我們可以認為搜尋時間是靜靜等待某個昆蟲來撞網所用的時間。對一頭獅子來說，搜尋時間可能是它潛伏在草叢裡等待獵物所用的時間。在這兩個例子中，迴圈過程的第一步都包括搜尋獵物。恰爾諾夫假設，搜尋花費了動物的一些成本，即搜尋所花費的能量。對一隻潛伏的獅子來說，每小時的搜尋成本可能遠高於一隻靜靜等待的蝴蛛所花費的搜尋成本，但是搜尋都給這些生物體造成了成本支出。有了這個假設，恰爾諾夫就可以單獨地考慮每種動物的搜尋成本。在他的方程裡，每分鐘搜尋過程要花費S 單位的能量，並且對每種覓食動物來說，S是不同的。假設經過一段時間的搜尋之後，這隻動物最終遇到了一個可能的獵物。對蝴蛛來說，不論什麼時候當一隻昆蟲撞到蛛網上時，捕食迴圈就開始了；對獅子來說，這個過程開始於它發現草原上的另外一隻動物。一旦一個潛在的獵物被發現，這隻覓食動物就必須做出一個重要的決定，捕食模型正是圍繞這個決定被構建起來的。它必須決定是花時間和額外的能量去試圖俘獲並吃掉這個獵物，還是放棄這個獵物而繼續等待可能更有價值的其他獵物。在恰爾諾夫的概念裡，覓食過程就是這樣一個迴圈：搜尋、遇見、決定，搜尋、遇見、決定⋯⋯ 這個模型的目的就是描述做出決策的過程：決定吃這個獵物還是繼續搜尋其他獵物。恰爾諾夫認為，為了有效地做出這個決定，覓食者必須瞭解關於每個潛在獵物的四個方面的資訊： 1.吃掉這種動物的一個典型個體所能獲得的能量。對於獅子來說，這相當於知道一頭水牛的肉是疣豬的20倍。而對於蛛來說則意味著要知道蒼蠅的大小是果蠅的20倍。 2. 捕獲和消費這種型別的獵物需要花費的平均時間，也就是處理時間。對蛛來說，處理時間是指獵物觸及蛛網到被吃掉的時間。而對於獅子來說，則是從捕捉獵物到吃掉獵物這段時間。 3. 處理過程中消耗掉的能量成本。顯然，比起捕食一隻疣豬，獅子捕食一頭水牛所消耗的能量肯定要多很多。 4. 每天發現各種型別的獵物的機率。這四個變數是由環境特性、獵物的特點和覓食動物的特徵確定的，它們定義了一個覓食動物所必須面對的問題。反過來，覓食動物直接控 • 173

決策、不確定性和大腦——神經經濟學制了其中的一個變數：攻擊任何一種目標獵物的機率。覓食動物的目標是選擇攻擊每種獵物的機率，從而使能量獲取率最大化。如果某動物是最有效率的覓食者，它會很有效地使其花在捕食迴圈中的時間最小化，從而給其他活動留下更寬裕的時間。恰爾諾夫認為，使用以下的方法，我們就能夠在任何環境條件下，對任何一-種捕食策略的淨能量攝取率進行描述。首先，我們需要描述從各種型別的獵物能夠獲得或有可能損失的總能量。為了得到完整的描述，我們可以用覓食者攻擊某種獵物的機率（這個變數由覓食動物控制，我們稱之為p）乘以遇見這種獵物的機率（我們稱它為入），所得結果表示覓食動物攻擊該種獵物的平均機率。然後，我們用這個平均機率乘上總的搜尋時間，將得到對這種獵物發起攻擊的平均次數。最後，我們用這個數乘以從這種獵物能夠獲得的能量（獵物的價值減去在處理過程中所失去的能量）。透過這樣的計算，我們可以得到覓食動物可能從每種型別的獵物身上獲得能量的期望值。鞏望發綠勢體裝一p必拿甜醬×（裝茶一紫獎）（9.1）接著，我們需要知道捕食每種獵物的機會成本，即轉向搜尋其他潛在的更好的獵物所花的時間。為了確定這一成本，我們用攻擊某種獵物的機率乘以遇見更好獵物的機率，再乘以搜尋更好獵物的總時間，得到捕食更好獵物的平均數量。然後用所得的結果乘以處理更好獵物的總時間。這種計算方法告訴我們，如果採取這種特定的攻擊策略，那麼用於處理這種型別的獵物所花費的時間為：捕獲每種獵物平均一pXAX總搜尋x處理所花時間時間（9.2）最後，用這種方法對每種可能的獵物型別進行計算，再把所有可能獲得的能量進行加總，就可以得到某一組特定的攻擊策略P所獲得的總能量。接著，用總能量除以花在搜尋和處理獵物上的時間之和，就得到了度量某一組給定的攻擊策略在單位時間內可獲得多少能量的標準：從每種型別獵物得到的平均能量之和 R=總搜尋的間午交理莓種貓霸所花夔的平場時間之和（9.3）這個等式描述了蛛和獅子所面臨的問題。給定任意一種型別的獵物，只要我們知道獵物的價值、處理時間、處理成本和遭遇機率，就能 • 174 215

第9章進化論、機率和經濟學夠設計—種攻擊策略，並計算出使用這種攻擊策略平均每小時所能獲得的能量。當然，從進化論的角度講，動物的目標是選擇一種能最大化能量攝取率的攻擊策略。有一種方法可以使我們最終得到確切的結果：系統地嘗試每種可能的攻擊策略然後再比較這些結果。或者，我們可以採取一些更具有隨機性、更富有競爭性的搜尋策略，這些搜尋策略也許與進化論處理這類問題的方法相似。得益於微積分的發明，我們這些數學生物學家可以把事情做得更漂亮一些：我們能夠直接計算出哪種具體的攻擊策略可以使能量攝取率最大化。我們對等式（9.3）做一下微分處理，就可以得出一個新的等式，然後用它來計算出能夠最大化 R 值的捕食策略。「2］一旦得到了這個新的等式，一個有趣的並且出人意料的觀察結果就出現了。為了能夠最大化能量攝取率 R，一種特定獵物被攻擊的機率應該是1或者0，即覓食者要麼總是攻擊這種特定型別的獵物，要麼從來都不攻擊這種特定型別的獵物，這個觀測結果被稱為0--1規則。在任何情況下覓食者都不會出現有時攻擊，有時不攻擊某種型別獵物的情況。那麼，覓食者應該攻擊哪些型別的獵物呢？模型表明，如果捕食這種獵物所獲得的能量除以處理時間（即捕食這種獵物的淨能量獲得率），小於遇見其他獵物的機率乘以從其他獵物中所獲得的能量攝取率，那麼就絕對不應該攻擊這種獵物。也就是說，只有當攻擊這種獵物的價值高於搜尋其他更好的獵物的價值時，覓食動物才會攻擊這種型別的獵物。當我們推匯出0—1規則，並且觀測到動物只有在不能透過搜尋其他的獵物而得到更多回報的情況下才會攻擊某種獵物時，覓食者的目標就變得清晰了。根據利潤率（獲得的能量除以處理時間所得的比值）排列所有獵物型別的順序，然後在排序中設立分割點，利潤率高於臨界值的獵物將總是被攻擊，而利潤率低於臨界值的獵物將永遠不會受到攻擊。而與某種型別的獵物相對應的利潤率是高於還是低於臨界值則取決於：（1）該種獵物的利潤率；（2）所有更好的獵物的利潤率以及覓食者遇到它們的機率。令人驚訝的是，這意味著覓食者是否攻擊某個特定的獵物型別與它遇到該型別獵物或者任何其他利潤率更小的獵物的機率無 217 關。斯蒂芬和克雷布斯把這稱為遭遇率原理的包含獨立性。現在我稍稍解釋一下為什麼要詳細地介紹這個模型。首先也是最重 • 175

決策、不確定性和大腦神經經濟學要的是，這是一個如何將基於經濟學的機率—收益模型運用於生物學研究的例子。恰爾諾夫正致力於建立一個完整的數學模型，試圖用它來描述進化對覓食者的生長所起的作用。根據定義，相比無效率的覓食者，高效的覓食者可以在更少的時間內獲得更多的食物。恰爾諾夫建立的捕食模型正是為了描述成為一個高效覓食者所要具備的條件。我們的假設是，正如瑪爾曾經指出的那樣，這是在覓食者的演進過程中，進化必須實施的計算上的目標，或者更確切地說應該是計算上的約束。在下一節中我們將透過檢驗捕食模型的優劣以及它對實際的動物行為預測的準確程度來驗證這一假設。 9. 2 覓食經濟學的實證檢驗克雷布斯、恰爾諾夫和他們的兩位同事—-喬納森•埃裡西森（Jonathan Erichsen）及邁克爾•韋伯（Michael Webber）在20世紀70 年代中期對這個捕食模型及其假設進行了經典檢驗（克雷布斯等， 1977）。設計這個實驗時，克雷布斯和他的同事的目的是檢驗這個捕食模型的兩個具體的預測。首先，他們想檢驗遭遇率原理的包含獨立性，即是否攻擊一個獵物目標獨立於看見它的頻率（或者說看到任何價值更小的獵物的頻率）。對他們來說，這似乎有悖直覺，因此顯得比較有趣。其次，他們想要檢驗0—1規則，即對一種獵物來說，要麼每次都攻擊它，要麼永遠也不攻擊它。也就是說，一旦所有其他的變數和可能性被確定後，是否攻擊某種型別獵物的行為也變得確定。為了在實驗室對捕食模型進行上述檢驗，克雷布斯和他的同事需要尋找一種動物，這種動物能夠在可控的條件下捕食，從而實驗者既可以準確地控制該動物遇見兩種或更多種獵物的機率，又能夠控制（或者至少能測量）每種獵物的價值、處理時間和處理成本。有了這些變數，就可以用捕食模型對動物在覓食時的實際行為做出具體的預測。克雷布斯和他的同事決定用一隻小鳥（在英國通常被稱為大山雀）作為他們的實驗物件。山雀是雀形目中的一類，雀形目鳥包括雀類（如燕雀、金翅雀、雲雀）和燕子等等。這種大山雀高5英寸，在整個歐洲的野外均有分佈，夏季主要以昆蟲為食，冬季主要以種子和水果為食。在它被關起來時，它最喜歡的食物是寄生於穀類、麵粉中的甲蟲的幼蟲，克雷布斯和他的同事們就將這些幼蟲作為主要的觀察 • 176• 218

第9章進化論、機率和經濟學目標。為了得到兩種價值已知的獵物型別，這些科學家人為地設計出了他們所說的大幼蟲和小幼蟲。大幼蟲是將整條幼蟲從中間切斷得到的，大概有八個幼蟲節那麼長，而小幼蟲則是它長度的一半（見圖9—1）。不透明的籠子底 219 傳送帶視窗圖9一1 克雷布斯的大黃粉幼蟲捕食實驗接著，需要構建一個人為的覓食環境，並把一隻飢餓的山雀放入其中。這個人造的環境是一個體積為1立方米的籠子。籠子底有一根供大山雀棲息的棲木，該棲木正好放在一個黑色的橡膠傳送帶的上方。在棲木正下方的籠子的底板上開有一個2.5英寸的視窗，這隻山雀可以站在棲木上，透過這個視窗看見下面的傳送帶。傳送帶以5英寸每秒的速度執行。實驗者從籠子外面把大的或小的幼蟲放在傳送帶上，這個放置的過程山雀是看不見的。隨著傳送帶的移動，每隻幼蟲從大山雀面前通過的時間大約是半秒鐘。為了對該捕食模型進行量化分析，克雷布斯和他的同事假設，大幼蟲的價值是小幼蟲價值的兩倍。為了進一步減少小幼蟲的價值，他們給每條小幼蟲都繫上一條約為八個幼蟲節長的紙帶。由於山雀在吃這個小幼蟲之前必須先啄開紙帶，這將明顯增加處理小幼蟲的時間。為了得到每隻山雀處理獵物的確切時間，他們給每隻山雀都提供這兩種型別的獵物，並且對每隻山雀捕捉、處理和吃兩種型別幼蟲的時間都做了詳細記錄。透過對五隻山雀的觀察，他們得到的結果是：每隻山雀處理大幼蟲的時間大致是相同的，但是處理小幼蟲的速度卻各不相同，處理一隻小幼蟲的時間從5秒到12.5秒不等。有了這些資料，實驗者們就可以準 • 177

決策、不確定性和大腦——神經經濟學確計算每隻山雀捕食每種型別獵物的數學上的收益率了。為了使這兩種獵物出現的條件有所不同，實驗者一共設計了五種不同的覓食情形。在A 種情況下，大幼蟲和小幼蟲被獨立地放在傳送帶上，但都是大約40秒鐘出現一次，山雀遇到大小幼蟲的頻率平均為每分鐘1.5次。在B種情況下，兩種獵物以相等的機率出現，大約20秒一次。在C、D和E種情況下，大幼蟲總是每6.5秒出現一次，但是小幼蟲每出現一次的時間從3.5秒到20秒不等。有了這些資料，捕食模型就可以對各種實驗條件下每隻山雀的行為做出非常明確的預測。首先，這些方程可以預測到，處理小幼蟲速度最快的那兩隻山雀應該在實驗設定的遭遇時間內把大幼蟲和小幼蟲都吃掉。這兩隻山雀之所以大幼蟲和小幼蟲都吃，是因為小幼蟲（對這兩隻山雀來說）的收益率足夠高，以至於只有當這些山雀同時捕食大小幼蟲的時候，能量攝取率才可以達到最大。與此形成對比的是，模型還預測到，對其他三隻山雀來說，只要遇見大幼蟲的頻率大於每7秒或8秒一220 次，它們就會有所選擇，在這種情況下，這三隻山雀將只吃大幼蟲而放棄小幼蟲。在後一種情況下，遭遇率原理的包含獨立性意味著，不管小幼蟲的出現頻率有多高，它們都應該只吃大幼蟲。換句話說，在C、D 和E種情況下，即使小幼蟲出現的頻率變化了六倍，它們還是選擇只吃大幼蟲。實際上，這正是克雷布斯和他的同事所觀察到的結果。在所有的條件下，處理小幼蟲最快的兩隻山雀對獵物均不加以選擇。這個結果與方程的預測完全相同，即無論在哪一種情況下，它們會在上述的實驗環境中捕食所有出現在傳送帶上的幼蟲。但是其他三隻山雀只有當大幼蟲的出現頻率達到 6.5秒每次後，才顯示出對大幼蟲的偏好。這種選擇性—一就像理論預測的那樣——並不受小幼蟲出現頻率的影響。這些結果看來支援了克雷布斯和他的同事從捕食模型中得出的第一個假設：遭遇率原理的包含獨立性。緊接著，克雷布斯又開始檢驗得自捕食模型的第二個假設：0一1規則。這個規則的含義是，如果動物認為某個型別的獵物值得吃，就會總是吃它；如果不值得吃，就永遠不會吃。這個要麼全有要麼全無的選擇，被認為是捕食模型最有趣和最違背直覺的預測。與之相關的一個特殊的觀點是，在給定獵物的價值和遭遇頻率時，捕食模型給出的預測將是—覓食者的行為是確定的。如果把山雀的行為轉換成預測結果，則該原則表明：在C、D和E 種情況下（當處理小幼蟲慢的三隻山雀應該選擇吃大幼蟲時），這三隻 • 178•

第9章進化論、機率和經濟學山雀應該完全放棄小幼蟲。但是令人驚訝的是，這與克雷布斯和他的同事所觀察到的結果不符。雖然這些山雀具有選擇性，但是所吃的幼蟲中 221 只有大約85%是大幼蟲，而不是先前理論上預計的100%。儘管模型預測這些山雀的行為應該是更加具有確定性的，但是山雀們似乎更堅持按照自己的收益率採取行動。檢驗捕食模型的結論我認為從捕食模型本身以及對其運用於實際動物時呈現的效果的經驗檢測中，我們可以做出許多重要的結論。捕食模型既可以描述覓食動物面臨的問題，又可以為那個問題定義一個最理想的解決方案。這個模型面臨著一個來自真實世界的難題，必須透過假設更有效捕食的動物具有更高的適應度來確定一個解決方案。它透過使用經濟學中的理論工具來解決這個問題。在捕食模型中，機率（以遇見獵物的頻率來表示）和效用（以收益率來表示）被結合在一起來描述各種情況下生物體的計算目標。很明顯，在描述動物的基本行為方面，這個經濟模型的確很好，它可以說明山雀決定吃什麼。在一個簡單的數學框架中，每一隻山雀處理小幼蟲的時間、大幼蟲出現的頻率以及兩種獵物的相對收益率，都會影響山雀的決定。如果此模型以標準的經濟理論為基礎，確實描述了山雀的大腦所做的運算，那麼這正是我們期望得到的結果。但是，這個模型也做出了一個並沒有完全實現的預測。我們在實驗中並沒有觀察到模型所預測的山雀會做出“要麼全有要麼全無”這一選擇的情況（0-1規則）。克雷布斯及其同事在他們的論文中，對此做了一個有趣的解釋。他們認為，由於山雀對兩種獵物的價值的內在評估會發生變化，為了適應這種變化，山雀偶爾也會選擇小幼蟲。他們認為山雀不會冒下面的風險：可能小幼蟲的收益率變得更高了，但是它們放過了這些小幼蟲而沒有品嚐。因此，山雀總是以較低的頻率品嚐小幼蟲。從本質上說，作者想說明的是：山雀的行動可能是最優的，而數學模型則可能存在一些錯誤。在現實世界裡，獵物的價值是會改變的，而且山 222 雀的神經系統也會認識到這個事實。因此這些山雀會不時地挑選小幼蟲，因為如果將檢驗捕食模型的實驗室環境擴充套件為整個全球環境，這將是最優的策略。另外，至少還有兩種對0一1 規則無效的解釋也是令人感興趣的。一種解釋是，山雀可能無法選擇最優行為。大腦中種類或結構方面的限 • 179•

決策、不確定性和大腦—神經經濟學制使它們無法採取最優的0—1策略。對一個神經生物學家來說，這大概是最令人興奮的結果，因為它說明大腦中負責選擇獵物的某些神經回路會顯示出這種有趣的、極具特性的約束。另一種解釋是，不可預測性可能是動物行為更為本質的特點，這已經超出了我們當前的認識範圍。當我們討論博弈論和動物之間為有限資源競爭的理論時，我們還要回到這個問題上來。 9.3 小結關於捕食模型，人們已經進行了許多檢驗，實驗物件範圍很廣，從昆蟲到哺乳動物（還有許多實驗檢驗了以經濟學為基礎的行為模型）。大多數的檢驗都得到了相似的結果：遭遇率原理的包含獨立性是普遍成立的，但是0—1規則卻難以被精確地觀察到。我這裡選取了山雀進行實驗，是因為它是這類實驗中最著名且最成功的。這些模型能夠說明的最重要的一點是，瑪爾的方法既可以透過機率論被應用於不確定的情形中，又可以透過進化論的假設而被應用於複雜的行為領域。這些模型和實驗結果對我而言，都是經驗性證據，它們可以證明以經濟學為基礎的最優模型可以被用來確定行為的計算目標，並928 且可以透過這些目標來理解真實動物的行為。從神經生物學的角度講，這些行為毫無疑問是由大腦產生的。捕食行為，就像皮膚收縮反應一樣，代表了一個感覺運動過程。因此，我認為我們需要問一問自己，為什麼在神經生理學領域中會沒有類似的模型呢？尼可菜• 伯恩斯坦（Nickolai Bernstein）在1961年的論述就已經預示到了這個問題：只有實驗者對行為中的生理現象產生興趣之後，這種對大腦建模的重要方式—-也就是我們現在要談的對未來建模——才會被他們認識到。只有藉助於對大腦在當前狀態下所能夠做出的所有選擇進行外推，藉助於最直接的先前感覺中的最新痕跡，藉助於個體過去擁有的所有經驗，並且最終藉助於對那些截止到目前還只是被簡單地總結傾向性反應、其最基本的重要性確實被低估的一類行為進行積極的實驗和分析，對大腦建模在邏輯上才是可行的。與當前模型截然不同的是，對未來建模具有或然性特徵。對當前局勢正在演進和趨向的目標—將來某一種可能出現的結果的預測或期 • 180•

第8章定義目標：擴充套件瑪爾的方法