AI 新聞與投資
不當行為

第12 章 計畫者與行動者

13 / 34

我開始認真思考自我控制問題時,這方面還沒有多少經濟學文獻可參考,而且我就像大部分的研究所學生對本書前幾章提過的早期學者們一無所知,研究生很少讀超過三十年前寫成的作品。此外,當時也沒什麼新東西可參考。不過,我本人還是受到三位學者作品的激勵:一位經濟學家與兩位心理學家。 我唯一能找到的談自我控制之經濟學論文,是西北大學經濟學家羅伯.史卓茲所寫。雖然許多經濟學家都曾採用薩繆爾森建立的折扣效用模型,卻鮮少有人能像史卓茲,注意到薩繆爾森所警告的時間不一致性。 在一份1955年出版的論文中,史卓茲深入研究這個問題,探索若一個人做了計畫就不會想再改變,那麼他的偏好必須滿足哪些數學特性。不過現在我們用不著詳述那份論文的技術性細節,總之只有在一個情況下(以指數函數的方式做折扣)才能確保主體維持時間一致性,而史卓茲就跟薩繆爾森一樣,擔心這些條件是無法被滿足的。 如此一來,史卓茲深入探索英雄奧迪修斯與蛇髮女妖的故事,而這個由希臘作家荷馬創作的神話後來成為不可免的討論主題,幾乎所有自我控制的研究者,無論是哲學家、心理學家或經濟學家都會提及這個古老的故事,而我也曾經有過一次跟隨過這個傳統。

讓我們來回想故事場景吧。蛇髮女妖是古代版的女子搖滾樂團, 沒有任何水手能抗拒她們的歌聲召喚,但是水手若屈服於誘惑,試著把船駛近岩石,最後必遭沉船滅頂之災。奧迪修斯想聽那天籟之音, 並且活下來告訴別人那是什麼樣的音樂,於是他設計了一個兩段式計畫(其實奧迪修斯並沒有聰明到自己想出這套計畫,他從喀耳刻那兒得到了一些不錯的建議,後者是掌管藥草與藥物的女神。這是不是挺耐人尋味呢?)。第一部分是確保麾下船員們不會聽到女妖的召喚, 所以他命他們以蠟塞住耳朵。第二部分是讓船員將他綁在桅杆上,這麼一來他個人就可以欣賞演出,船員們也不會受到無可抗拒的誘惑而將船駛向岩石了。 上述故事提到了兩種人們用來應付自我控制問題的重要工具。針對船員,解決方法是排除會誘使他們做出傻事的提示,眼不見,心不亂。針對自己,奧迪修斯則是選擇了約束策略——限制自己的選擇, 以避免自我毀滅。這就像把放著腰果的碗拿走。史卓茲坦承他自己用約束策略來決定學年薪資給付:「我選擇將年薪分成十二個月收取, 而不是九個月,即使這樣會損失一些利息。」 我在1978年開始思考自我控制問題時,史卓茲的論文已經出版逾二十年了,期間經濟學界沒有任何其他人對這項主題感興趣(雖然湯姆.謝林在不久後加入),我只好轉向心理學界尋求靈感。當時我認為心理學一定有滿坑滿谷關於延遲滿足的文獻,可是我大錯特錯,雖然現在確實有許多心理學家對自我控制問題感興趣,然而在1970年代末可不是這麼回事。幸好我最終還是挖到了兩個寶。 首先是如今已大名鼎鼎的華特.米歇爾。當年他在史丹佛大學任教,跑到學校附設的托兒所做了幾個實驗。實驗人員邀請一個小孩

(四或五歲)進入房間,讓他選擇當下得到一項小獎賞,或稍等之後得到較大的獎賞。他們提供的獎賞是棉花糖或奧利奧餅乾這類點心。 小孩被告知可以現在就吃一塊餅乾,也可以想吃的時候就吃,如果能夠等到實驗人員回來再吃,就可以得到三塊餅乾。孩子可以隨時按鈴把研究人員叫回來,然後給他較小的獎賞。 大部分的孩子都發現克制欲望實在難受極了。不過,等待時所處的環境也會有影響。在某些實驗場景中,點心就放在孩子眼前的盤子裡,對絕大多數孩子來說,眼睜睜地看著餅乾,效果就跟奧迪修斯聆聽女妖的歌聲一樣,其等待時間幾乎都沒超過一分鐘。但是,假如眼睛看不見獎勵(也比較不會想到),平均等待時間便可長達十一分鐘。倘若實驗人員要孩子們想些開心有趣的事,不要掛念著獎賞,他們也可以等待得更久。 這些實驗最初於1960年代及1970年代初進行。十年後經過一番回顧,米歇爾和他的同事認為若能看看當年那些受測小孩後來的發展, 應該能得到一些有趣的發現,所以他們找到多達五百名當年的實驗對象,其中三分之一同意每隔十年接受他們的訪問。後來他們驚訝地發現,孩子們在其中一項實驗的等候時間,竟成為許多重要人生成果的準確預告,從學術評量測驗(SAT)到事業成功或用藥成癮。這項結果之所以令人驚訝是因為米歇爾本人做過的不少研究顯示,所謂的性格特質在預測現在行為方面並不十分管用,更遑論是預測未來行為。 米歇爾仍留存部分早期實驗的珍貴影片,呈現出孩子們發揮自我控制能力時面臨的困難。我對其中一個孩子特別感到好奇,他被安排在困難度最高的情境,三片美味奧利奧餅乾就放在他眼前,經過短暫等待之後,他已經沒法再忍耐了,可是他並未按鈴,而是小心翼翼地打開餅乾,舔掉當中好吃的白色夾心,然後再把餅乾合攏,盡可能將這三塊餅乾恢復原狀以免被發現。在我的想像,這孩子長大後可能會成為詐騙高手柏尼.馬多夫。 另一位行為科學家的研究成果也吸引了我的注意。他的名字是喬治.安斯立,是一位執業精神病醫師,只在空閒的時候做研究,平時則在退伍軍人醫院醫治病患。我待在史丹佛大學的那段期間,仔細研讀了他在1975年出版的論文,內容總結當時學術界對自我控制所知的一切。 我從安斯立那裡學到,其實關於延遲滿足已經有相當多研究文獻,只不過研究對象並非人類,而是大鼠與鴿子。在一個近似米歇爾所做的範例中,實驗人員讓動物們從比較小的立即獎勵與比較大的延遲獎勵中選擇,牠們得按(或啄)一個控制桿來獲取獎勵。經過大量訓練之後,牠們學到倘若動了兩個控制桿當中的任一個,可預期等待多久之後能得到多少食物。藉由調整等待時間與獎勵多寡,實驗人員評估出動物的時間偏好。絕大多數的研究發現,動物呈現出相同的折扣模式,此模式導致人類偏好逆轉。動物是雙曲線折扣,而且也有自我控制的問題①。 安斯立的論文花了不少篇幅探討處理自我控制問題的各種策略, 其中一種作法是自我約束,也就是拿走腰果,或將自己綁在桅杆上; 另一種作法則是提高屈服於誘惑的代價。舉例來說,若你有意戒菸, 可以寫一張支票給平時常見面的某個人,並同意若對方逮到你抽菸就可以將那張支票兌現。你也可以跟自己打賭,即安斯立所謂的「私人打賭」,不妨告訴自己:「今天晚上我絕對不看電視轉播賽事,除非我完成了 『某件你忍不住想拖延的任務』。」

我站在史卓茲、米歇爾,以及安斯立的巨人肩膀上,開始建立討論這些問題所需的觀念架構。當時經濟學家仍認為這些問題純屬經濟性質,我想回答的重要理論性問題是:「假如我知道自己的偏好將改變(以腰果為例,我不會約束自己少吃幾顆腰果,如果我想要的話, 反而會把整碗腰果都吃光),那麼我會在何時,根據什麼原因而採取行動,限制自己未來的選擇?」 每個人都會有改變想法的時候,可是我們通常不會採取非比尋常的步驟來防止自己偏離原先計畫,唯一會讓我們堅守預定行動的情況,是當我們有好理由相信假設後來偏好改變,這個改變將會是個錯誤。 拿走腰果是聰明作法,因為吃掉整碗腰果會破壞晚餐的胃口,而且你也不希望整個晚餐只吃了腰果。同樣道理,參加米歇爾實驗的小孩如果夠聰明,就會跟實驗人員說:「下次假如要給餅乾,請不要給我『現在吃一塊』的選項,或甚至根本不要提到奧利奧餅乾,只要等十五分鐘,然後直接給我三塊餅乾就可以了。」 思索這些問題的過程中,我無意間看到社會科學家唐諾.麥金塔的一句話,深深地影響我的思考:「自我控制的概念本身是矛盾的, 除非我們假設人類心智包含不只一套能量系統,而且不同能量系統在某個程度上是各自獨立運作。」這段話出自他那本晦澀難解的著作 《人類社會的基礎》。我不記得自己是怎麼讀到這段話,不過在我看來其中道理再真實不過,自我控制基本上會製造衝突,而且和探戈一樣,它需要(至少)兩方來發生衝突。或許我需要一個包含兩個自我的模型吧。

儘管上述概念在直覺上非常吸引我,可是任何有兩個自我的模型都可能在經濟學上被認為太激進,在心理學上又顯得太過時,可說是糟糕的組合。很少經濟學家曾注意到亞當.史密斯關於個人熱烈情感與公正旁觀者之間抗衡的討論,包括當時剛開始這方面研究的我在內,大多數經濟學家只覺得這個概念太詭異了。當時學術圈子裡的心理學家不再傾心於佛洛伊德的本我、自我、超我,而現在正時興的兩套思考模式仍尚未出現(康納曼在《快思慢想》清晰闡述的兩套思考模式,其實並非他與特維斯基最初預想的重點。康納曼寫這本書的主要理由之一,是因為他認為同時採用快速的自動化系統,以及緩慢的反射性系統來重新思索他們的原始研究,可為他們早期的發現提供更具洞察力的新觀點)。我戒慎恐懼地向朋友推銷上述概念,也在我的 「走向消費選擇的實證理論」論文中草草帶過,但是我知道自己得拿出更正式的東西,以經濟學來說就是可靠而充分的數學數據。因此我找來了在羅徹斯特大學任職期間的同事,也就是數學經濟學家赫希. 薛佛林助陣。 多年來,我曾與許多人共同合作寫書,而赫希是頭一位合作對象。我們開始討論這些問題時,他最合乎要求的地方就是精通數學, 而且不認為我的想法完全是發神經。後者當然更為重要,畢竟數學比我好的經濟學家俯拾皆是。我和薛佛林在許多方面可說南轅北轍,他嚴肅、縝密、勤奮好學,而且信仰虔誠,曾經拜師學習猶太法典,即古代猶太學術寫作的大百科式綱要。這些特質本人一概沒有,可是我們仍相處愉快,最重要的是,赫希對我講的笑話還算捧場。我們的共事就像特維斯基與康納曼,是透過無止盡的交談,寫論文初稿的時候,也跟當年我看著特維斯基與康納曼一樣逐行逐句地討論。我們從在羅徹斯特大學任教時展開對話,不久後我轉赴康乃爾大學,赫希則前往陽光明媚的加州,到距離史丹佛不遠的聖塔克拉克大學任教。我們僅僅共同合作兩篇論文,然而赫希迷上了行為經濟學,很快便與聖塔克拉克大學的同事梅爾.史塔曼組隊成功出擊,共同投入行為財務學方面的研究。 我們的模型其實是建構在比喻上,假定在任何一個時間點,每個人都同時有兩個自我,一個是向前看的「計畫者」,不但立意良好, 而且關心未來,另一個則是不顧後果的「行動者」,完全活在當下 (湯姆.謝林在我之後也寫了同樣主題的論文。雖然我們英雄所見略同,可是他不像我那麼相信有遠見的偏好比較可能是「正確」的。舉例可參考謝林於1984年發表的論文)。上述行為無論是以哪一種模型來表達,關鍵問題都是如何描述這兩者互動的特性。一個可能的方式是把計畫者與行動者的互動看成賽局的兩個競爭對手,並且以數學和經濟學的一個分支——博奕理論,當成核心模式。不過,我們排除了上述想法,不認為行動者的作為有策略可言,他只是個活在當下的被動生物,眼前來什麼就做什麼回應,直到充分滿足才停止消費。相反的,我們選擇了以組織理論為基礎的模式,亦即「委託─代理人模型」。我們之所以選擇這種模式,無疑是受到了環境的影響。當年我在羅徹斯特大學商學院研究所執教時,代理人理論是個熱門話題,麥可.簡森與時任商學院院長威廉.麥克林,針對這個主題在1976年合作發表了一篇著名論文。我不確定他們是否同意我套用他們的概念, 然而這也算是一種樂趣。 在委託─代理人模型中,委託人發號施令,身分通常是企業主, 而代理人則是授權對象。組織機構內之所以會產生緊張關係,是因為代理人知道一些委託人不知道的事,而委託人若要監控代理人的行為,代價又過於高昂。這些模式下的代理人試圖以最少的勞力賺取最多的錢,而公司的因應之道就是推出種種規定與流程(譬如獎勵方案與會計制度),目的在盡量減少委託人與公司雇用的代理人之間利益衝突造成的代價。舉例來說,業務人員的收入可能主要來自佣金,他們得交收據給公司以證明交通支出,而且被禁止搭飛機時坐頭等艙。 在我們的想像當中,代理人是短暫存在的行動者,我們假設每一段時間,譬如每一天,都有一個新的行動者。行動者只想享受快樂, 而且在這方面自私到完全不在乎任何未來的行動者。相對的,計畫者沒有絲毫私心,她②只關心行動者們能獲得的效用,不妨將她視為仁慈的獨裁者吧。她希望所有行動者盡可能全體享受到快樂,卻無法有效控制行動者的舉止,特別是當行動者因為食物、性、酒精而感到亢奮,或因為天氣好而特別想出門閒晃時。 計畫者有兩套工具可用來影響行動者的作為。她可以透過獎懲 (財務或其他手段)來影響行動者的決定,同時讓行動者保有自由裁量的空間,或直接以規定來約束,譬如透過允諾策略限制行動者的選項。 人類能夠自我控制嗎? 為了說明上述概念,我們不妨思考下面這個簡單雖有些不自然的例子。假設哈瑞去了一個偏僻的小屋露營,那裡與外界完全斷絕聯繫,一架小飛機將他放到露營地,十天後會再回來接他。他原本帶了充分的食物(水也相當充足),但是一隻飢餓的熊路過,把所有他帶來的食物都吃光了,僅留下他一條小命,以及不合牠口味的十條能量棒。既然哈瑞沒辦法聯絡上飛機,而且也不善於野外覓食,只能靠這十條能量棒撐到飛機來接他的那一天。當然了,哈瑞同時具備計畫者與行動者的特質。他的計畫者會如何處理這個問題? 我們姑且假設,計畫者對每個行動者的消費價值一視同仁(所以不會把距離較遠的行動者之消費價值打折扣),而食物對行動者有著遞減的邊際效用,意即第一根能量棒帶來的快樂高於第二根,依此類推,他們會吃到不再產生快樂感覺的最後一口,然後就不吃了。在這種情境下,計畫者會認為最好的結果是每天吃一根能量棒,如此一來就可以為十個行動者分別帶來等值的效用(為了簡化例子,我刻意忽略一天只吃一條能量棒,會讓行動者肚子越來越餓的可能性)。換句話說,計畫者的作法就像理性經濟人應該採取的分攤消費,假如他們依循的是生命週期假說。在某個程度上,計畫者想做的是讓行動者表現得更像理性經濟人。如果技術上可行,計畫者會採用允諾策略,不讓行動者有自由裁量的空間,藉此降低行動者做出不當行為的任何風險。小屋裡若有十個設定好的保險箱,而且每一個都會在不同的特定時間自動開啟,這將是最理想的安排③。從計畫者的角度來看,這應該是最好的結果。 小屋裡不太可能有保險箱,所以計畫者能怎麼做?十條能量棒都放在櫥櫃裡,等著被享用。接下來會發生什麼事?若計畫者不出手干預,第一個行動者既然完全不關心後來行動者的福祉,他會吃到滿足為止,也就是說,直到再多吃一口能量棒,反而會變得比較不愉悅為止。我們就假設那個時機點是吃了三條能量棒之後。第二天的行動者也吃了三條能量棒,第三天的行動者吃了同樣的分量。到了第四天,

行動者只剩一條能量棒當早餐,很快就開始飢腸轆轆,接下來的一個禮拜只能在悲慘中熬過。 計畫者必須約束早先的行動者,不讓他們在前幾天就敞開肚皮把能量棒啃光光。在我們的模型中,計畫者假如沒有允諾策略可用,唯一剩下的工具就是罪惡感了。經過計畫者本人或父母親與社會的一番教導,行動者對於讓未來的行動者沒東西可吃這件事會感到難受。但是,製造罪惡感的代價不菲,在這個能量棒的例子中,計畫者不能讓行動者吃了第一根能量棒之後才產生罪惡感,她得設法讓每一口都變得更不愉悅。 圖表6表達的就是上述情況。最高的那條曲線呈現的是吃能量棒不帶罪惡感的效用。行動者會一直吃到效用最大化,也就是吃了三條能量棒之時。次高的曲線呈現的是行動者吃了兩條能量棒之後,產生出足夠制止自己的罪惡感。最低的曲線則呈現行動者吃了一條能量棒之後,便停止下來。這張圖表值得注意的地方是,運用罪惡感會讓生活變得比較不愉快,而唯一讓行動者少吃能量棒的方式,就是降低吃能量棒的愉悅程度。另一個值得思考的角度是,意志力的運用需要格外付出努力。 這項分析顯示了,假如有完美的規則可用,生活會變得更快樂。 使用設定好開啟時間的保險箱,在每個保險箱放一條能量棒,遠比強加罪惡感這招更能提供滿足感。西北大學經濟學家史卓茲達成這個目標的方式就是請雇主將年薪分成十二個月給他,從九月到隔年八月, 而不是分九個月給他(從九月到隔年五月)。雖然後者會產生較多利息收益,因為錢入帳得比較快,可是他得在學年期間存夠錢,才能確保自己在暑期有足夠的生活費,更別提支應全家的度假費用。

為什麼我們不時時刻刻運用規則呢?理由之一是自外部強加的規則不見得容易採行。就算你打算每天晚上叫一份外送到府的即食健康晚餐,也無法阻止你順便點一份披薩。再者,就算容易採行的規則真的存在,它們往往被刻意設計得較為僵化。倘若史卓茲教授選擇從九月到隔年五月的支薪方式,由於錢入帳得比較早,他或許就可以利用機會買一些在冬季有特價,而到夏季變得比較貴的東西,譬如割草機。當他的薪水被平分到十二個月,可能就沒有多餘的預算在冬季購買割草機了。當然了,從反面來看,若他提早領完年薪,就得堅守紀律讓自己的收入能撐過整個夏季。 同樣的原理也可套用於組織機構。若委託人明確知道代理人在每種處境下該怎麼做,她就可以制定絕對不可違反的規則手冊,可是我們都曾遭遇過這種挫折感,即低階代理人必須在種種規則下工作,沒有自由裁量的空間去做明明十分合理卻不在規定範圍之內,也就是 「不准」的事。

當然了,組織與個人都還有其他控制手段,包括了追蹤開銷。在組織機構,這些手段被稱為會計。同樣的,我們在本書稍早已讀過, 人類會運用心理帳戶來達成同樣目的,並且借助信封袋、玻璃罐,或退休金儲蓄計畫之力。值得一提的是,由於我們不像理性經濟人,無法將不同口袋裡的錢一視同仁,心理帳戶的策略才因此能發揮效果。 我得特別強調,我和薛佛林並不真的認為每個人的腦袋裡有兩個不同自我,我們用的是「彷彿」模式,目的在於為自我控制問題提供有幫助的思考方式。我們在兩人的第二份論文中加了一個注腳,指出讀者不妨將計畫者看成是住在大腦的前額葉皮質,該區域與意識和理性思考有關。行動者則涉及大腦的邊緣系統。若各位熟悉康納曼在 《快思慢想》中描述的兩套思考系統,我們可以合理地認為計畫者屬於緩慢、反省、深思熟慮的系統二,而行動者屬於快速、衝動、直覺的系統一。近年的神經經濟學研究為上述詮釋提供了背書,可是如果我們只關注實用目的,這個模式是否有生理學的基礎其實無關緊要, 它只是一個能夠幫助我們思考如何將自我控制融入經濟學的比喻。 儘管我依舊覺得「計畫者─行動者模式」,是思考自我控制問題時最有幫助的方式,但是它尚未得到下一代行為經濟學家的特別垂青。哈佛大學的行為經濟學家大衛.萊布森在1997年發表的博士論文,首開先河提出了選擇模型。另外兩名行為經濟學理論專家,馬修.拉賓與泰德.歐多諾修將他的研究方法做了進一步推展,現在大多數經濟學家會使用這兩個希臘字母來代表重要的變項:貝他(β)與德爾塔(δ)。「貝他——德爾塔模型」勝過計畫者與行動者的最重要優勢,在於數學上的簡單化。它對薩繆爾森所提出的掌握自我控制首要層面的基本模型,做了可能範圍內最小幅度的修改。

至於貝他——德爾塔模型如何運作,以下是一個簡單的思考方式。假設在任何一段足可被稱為「後來」的時間,一個完全不會折扣時間,也就是折扣率為零的人,對所有「現在」的事物都另眼相待, 覺得它們很吸引人,而任何「後來」的事物在他眼中價值只剩一半。 這裡以之前討論過的溫布頓網球賽為例,今年第一輪賽事的價值若為 100個效用單位,明年或在那之後將只剩50個效用單位,這樣的偏好可謂「現時偏好」,因為他們對現在事物的看重程度遠勝於未來,而且造成了選擇隨著時間而改變。 即使這個模型是高度簡化的版本,我們還是可以用它來呈現許多耐人尋味的跨期選擇細微之處,而這些細微之處部分要看人們是否察覺到本身的自我控制問題。當大衛.萊布森撰寫關於這項主題的首篇論文時,他假設主體是「老練世故」的,也就是他們知道自己有這種時間偏好。身為一個設法靠行為經濟學理論(當時這類別還沒多少人聽過)論文謀職的研究所學生,大衛用這種方式來勾勒他的模型特質其實是個聰明的作法。大衛的主體是純然的理性經濟人,只除了一個細節:他們的時間偏好有問題。當歐多諾修與拉賓決定加入這一陣營時,他們想到了一個更激進的設定,讓主體的偏好存在現時偏見,可是主體本人並未意識到這一點,這樣的主體被標籤為「天真」。 毫不意外的,上述兩種簡單公式都無法完全正確地描述人類行為。但是,我和這三位作者都有個相同看法,就是「真相」存在於兩個極端之間:部分天真。絕大多數的人知道自己有自我控制問題,卻也低估了它的嚴重性,我們對自己的世故老練程度抱持著天真的看法,尤其當我們都有行為經濟學家喬治.魯文斯坦所謂的「冷熱同理差距」。當我們處於冷靜和沉思的情緒,譬如在星期天剛吃完一頓心滿意足的早午餐之後,思索著星期三晚餐要吃什麼,我們會覺得自己一定能遵守當週只吃健康低卡晚餐的計畫。到了星期三晚上,朋友們建議去試試那家主打精釀啤酒的披薩店,結果大家的食量超過星期天預期的分量。可能也是星期三路過那間餐廳聞到了碳烤火爐傳出的誘人香味,更別提菜單上那排特製啤酒看起來有多吸引人了。在這類例子中,我們可能需要一個計畫者來建立規則,譬如週間不准喝啤酒, 也不能和朋友聚餐吃披薩,然後想個辦法來強制執行這條規則。 在我初次拿走放著腰果的碗時,行為科學家已經對自我控制問題有了不少研究心得。事實證明處理許多社會大問題時,這些知識都發揮了重要功能。各位讀者稍後將看到這一點。 ① 有些研究人員在動物身上嘗試了棉花糖/奧利奧餅乾實驗的動物版。大部分受測動物選擇立即得到獎賞,有隻特別聰明的非洲灰鸚鵡名叫葛瑞芬,表現出優於絕大多數學齡前兒童的自我控制能力(參考Sarah Zielinski在2014年發表的文章)。 ② 特維斯基總把計畫者當成女性,我為了紀念他也有樣學樣。既然男性通常比女性更像行動者,在此我以男性的代名詞來指稱行動者,若你要說我有性別偏見,我也認了。 ③ 這樣的技術確實存在。廚具品牌「廚房安全」的生產使用者可以任意鎖上一段時間的塑膠容器。製造商推薦消費者買這些產品來抵禦誘惑,譬如糖果、智慧型手機,或汽車鑰匙。有個體貼的學生買了一個這種容器給我,裡頭當然裝滿了腰果。在理性經濟人的世界,這種產品根本不會有市場需求。