很清楚,在此例中,我們幾乎失去了夏普比率近一半的原始改進。但是,這裡對於證券的保證金有人為的作用。 當更多的股票被補償時,許多正阿爾法股票將使積極資產組合的風險維持在低水平。這是從積極策略中取得最大收益的關鍵。 我們計算M E(rpe)=ry+SpOw=0.07+0.44×0.20 =0.158,即15.8% M' = E(rp.)-E(rw) = 15.8% - 15% =0.8% 這比無約束組合的M值的一半還要小一點。 b.當市場指數資產組合的預期更好時,積極資產組合的地位將變小,它的貢獻比夏普比率的風險資產組合要佔據更不重要的位置。在最初的例子裡,積極資產組合的分佈為: Wo=(0.2056/0.6826)/(0.12/0.04) =0.1004 w=0.1004/[1+(1-0.9519)× 0.1004]=0.0999 雖然市場的夏普比率比現在要好一些,從證券分析中所得的改進將減少: Sh=(9.12)2 +(02050) 0.20/ (0.8262) =0.4219 Sp = 0.65 Sw =0.60 553
附錄A 定量計算的複習管理與投資課程的學生需要一些特殊的背景知識。那些受過量化訓練的學生對一些材料中正規的數學表述會比較得心應手,而那些缺少這項技能的學生就會被滿篇的數學公式弄糊塗。但是,大多數學生如果能得到一些訓練,投資學就會變得相對簡單,學習效率也將大大提高。如果你學習了一門好的量化方法人門課程(就像本章一樣),那麼無論你需要什麼幫助時,你就可以求助於它。如果你對標準的量化課程感到不習慣,這個附錄也許會適合你。我們的目標就是要透過一種可以自學的,非技術性的、甚至是直觀的方式來介紹最重要的量化分析的概念及方法。我們對內容的安排完全按照特許金融分析師(CFA)課程的順序,其中包括的材料與特許金融分析師協會(ICFA)的投資管理業務有關。 希望這個附錄有助於你。有了它,你的風險事業會成為更有趣味的投資。 A.1 機率分佈統計學家們經常會提到“實驗”,或“測試”,並且把可能得到的結果稱為“事件”。例如在擲骰子的遊戲中,從1 到6這6個數字就是“基本事件”。“基本”意味著任何一種結果的出現與另一種結果互相排斥。也有一些被稱為“複合事件”,它們本身由多於1個的基本事件組成,例如“奇數” 或“小於4”。很顯然,“奇數”與“小於4” 並不是互相排斥的。但是,“複合事件”也可以是相互排斥的實驗結果, 比如說“小於4”和“大於等於4”。 在決策中,“實驗”就是你對決策進行考慮時所處的環境,不同的環境可能會影響所發生的事件集和它們的機率。 決策理論就是要使你在不同的決策環境(即實驗)下都能做出最優的決策,你只要能看清楚各種一般決策的結果與最優決策之間的差距就可以了。 當某一決策(實驗)的結果可以被量化時,也就是說對於每一個基本事件我們都可以對其賦予某個數值時,實驗結果就可以稱為“隨機變數”了。在投資決策中,隨機變數 (即投資決策的贏得)就可以被定義成收益的多少,而收益既可以用美元的數量來表示,也可以用百分比來表示。 隨機變數所有可能取值的集合,再加上它們各自的概率,就被稱為隨機變數的機率分佈。有時如果該隨機變數不能取到某值,那麼我們就認為取到該值的機率為零。所有可能的基本事件都被賦予了某個特定的數值和該事件發生的概率,於是各事件的機率相加之和總等於1。 有時隨機變數的取值個數是不可數的,也就是說你不可能把所有可能的取值都列出來。比如說,假定你現在在一條線上滾球,然後讓你記下球在停下來時滾動的距離。任何一種距離都是有可能出現的,而且距離的精確性取決於玩球者的要求與測度工作的精度。另一個不可數隨機變數的例子是新生嬰兒的重量。任意一個正的重量(當然有一個上界) 都是有可能出現的。 我們把不可數的機率分佈稱為連續的。這個原因其實很顯然,因為至少在一個區間裡,那些可能出現的結果(都具有正的機率)將落在連續值區間的任何一個地方。由於連續分佈中隨機變數的可能取值的數量是無窮的,那麼其機率分佈就該由反映隨機變數與其所聯絡機率之間關係的公式來描述,而不再是簡簡單單地列出結果及其機率。我們稍後再在本節中繼續探討連續分佈。 有時甚至可數的機率分佈也會很複雜。譬如,在紐約股票交易所股價都是以1/8來進行報價的。這意味著未來某期的股價是一個可數的隨機變數,可數隨機變數的機率分佈稱為離散分佈。儘管股價不可能下跌至零,但它也是沒有上限的。因此,就算它們是可數的,股價也有可能取無限多的值。於是就像連續機率分佈一樣,它的離散機率分佈也需要由一個公式來描述。 當然也存在既離散、又有限的隨機變數。當相關隨機變數的機率分佈是可數且有限的時候,決策一般就比較容易分析。一個例子就是讓你猜硬幣的“正”“反”面,猜錯了附景A 定量計算的複習你一無所得,猜對了你就得到1元。在這個猜硬幣的遊戲中, 猜“正面”的隨機變數有一個離散的、有限的機率分佈。它們可以寫為: 事件川現正雨出現反慚值 0 機率 0.5 0.5 這種分析方法通常稱為情景分析。因為情景分析相對來說比較簡單,有時當真實隨機變數是無限的或不可數時, 人們也經常使用這種方法來簡化分析。你可以對複合事件賦予可能的取值及機率,但各複合事件之間應該是完全的而且互斥的事件。由於它比較簡單而且具有重要的作用,所以, 我們先對其進行分析。 下面是1988年CFA考試中出現的一道真題。 阿莫德先生是一家投資銀行研究部門中的成員,他對自己的預測能力很自信。但是,公司提醒他,分析員不應該把風險視為一項重要的投資指標。在一個更加跌宕起伏的投資環境中,這尤其重要。另外,他本人也是比較保守的風險厭惡者。現在他請你對安休瑟-布希公司的股票進行風險分析。 1.利用表A-1,計算安休瑟-布希公司股票實現三種收益的分佈指標,寫出計算過程。 a. 值域 b.ZPr()、 E(r) c.標準差 d. 方差係數:CV=a/E(r) 2.分析上述四種風險量化指標的各自用途。 表A-1 安休瑟-布希公司股票潛在收益的分佈結果機率期望收益® 0.2 20% 0.5 30% 3 0.3 50% ① 此時假定在任一個情景下期望收益都前定會實現。這與原題的表述一致。 試題要求很精確的答案,而我們現在只是用它來說明進行情景分析的框架。 表A-1列出了這個情景決策問題的具體資料。隨機變數即為投資於安休瑟—布希公司股票的收益。但是,在理論上本應寫出隨機變數所取資料的第三列上所列出的數字並不是簡單的“收益率”——它是“期望收益率”。這意味著“情景”的定義就是一個由許多基本事件組成的複合事件(而事實上總是這樣)。我們把事實簡化,以使問題變得容易入手。 在分析家們試圖列示所有情景的機率分佈時,不僅需 556 要確定每種情景下的收益率,而且還需要確定到底應分為幾種情景。這個過程通常被稱為確定經濟情景發生機率及各種經濟情形下的期望收益(條件期望),該期望收益率大致表現出了各經濟背景下的投資結果。一旦你對情景分析熟悉了之後,你就可以對任何機率分佈構建一個簡單的情景描述。 A.1.1 期望收益 “如果實驗(包括決策環境與決策)無限地重複,隨機變數的均值將會是多少?”隨機變數的期望值就是該問題的答案,假如現在你面臨一個投資決策,你的這個答案就大致描述了投資後的收益結果。 注意,該問題本身是存在前提假設的,同時也是很抽象的。因為在實際生活中,對某一特定經濟環境所做的決策 (即實驗)往往不能重複,更談不上:“無限地重複”了;所以它的成立是需要前提假設的。而就算實驗被重複了許多次 (而不是無限),收益率的平均值也許並不是某次實驗可能出現的結果,這就是為什麼我們說其抽象的原因。舉個例子, 假如某一投資專案的收益率分佈為20%或-20%,它們的概率都為0.5,直覺告訴我們,該投資決策不斷重複之後將給我們帶來接近於零的平均收益率。但是在任何一期,投資都不可能產生收益率為零的結果。當投資決策只有一期時, “期望收益”還會有用嗎? 但我們一般還是採用期望收益來測度投資決策的回報。 原因有很多,其中最重要的一條是儘管某一特定的投資決策只進行一次,決策者也將會在長時期內做出許多(也許並不同)的投資決策。那麼在這段時期內,收益的均值就會與所有單獨決策的期望收益平均值相當接近。另一個原因更顯然, 即我們除了它以外還沒有更好的測度方法。' 表A-1中各情景的發生機率描述了各種結果產生的機率。 如果對安休瑟-布希公司股票的投資可以重複好幾次,那麼 20%的收益率就會在20%的時間內出現,30%的收益率就會在50%的時間內出現,50%的收益率就會在30%的時間內出現。期望收益的定義告訴我們計算期望收益率的方法為:2 E(r)=0.20×0.20+0.50×0.30+0.30×0.50=0.34 即34% 把每種情景標為i=1,2,3,並利用求和符號工,我們可以寫出期望收益的公式: E(r) = Pr(ln + Pr(2) +Pr(3) (A-1) 2Pr(i)r 1 我們採用低於理想測度的另一個事例為用到期收益率去測度債券的收益,到期收益率測度的是如果投資債券持有到期時可以得到的回報率,以及如果息票利息可以在整個債券的生命期以同樣的到期收益率再投資時可以得到的收益率。 2 為了避免混亂,我們將以小數來表達。
式(A-1)中期望的定義提示了隨機變數的兩個重要性質。首先,如果你在隨機變數上加一個常數,其期望值也會增加同樣的常數。舉例來說,如果在表A-1中每種情景中的收益率增加了5%,那麼最後的期望值也會增至39%,讀者可以用式(A-1)來驗證這條性質。另外,當我們把隨機變量乘以一個常數之後,其期望也會改變同樣的比例。如果我們把情景下的收益率都乘以1.5,那麼E(r)就會變為1.5x 0.34=0.51即51%。 第二,隨機變數對其期望的偏差,即兩者之間的差, 也是一個隨機變數。我們可以利用表A-1中的任意收益率r; 為例,來定義其對期望的偏差: d,=r,-E(r) 那麼d的期望值是多少呢?我們以E(d)來表示偏差的期望,透過考察式(A-1),我們發現其必為零,因為 E(d)=ZPr(i)d, =ZPr(ilr,-E(r)] =zPr(in - E(r)zPr(i) = E(r)- E(r)=0 A.1.2 關於散佈性質的指標 1.值域假定表A-1中的任一情景下收益率都是確定的,即都將實現其期望收益率。子是,可能出現的收益結果只能是 20%、30%或50%,值域就是指隨機變數可能取值的最大值與最小值之間的差,在此例中即為50%-20%=30%。很顯然,對於隨機變數的散佈性質來說,值域只是一種很粗糙的指標。對於此例來說,值域就更不適合了:因為在各種情景下的收益率本身只是期望值,因此其真實的值域我們無從得知。有一種值域的變體,稱為內四分值域,我們將在後面進行介紹。 2. 方差對方差的一種解釋是它測度了“預期的驚奇”。儘管該短語看起來有點矛盾,但事實上並非如此。首先,我們可以把“驚奇”視為對預期的偏差,這裡所說的“驚奇”不是指 “未能實現心中預期”後的心理感覺,而是量化為對於此偏差的方向與幅度。 表A-1中的例子說明投資於安休瑟-布希公司股票的期望收益率34%,但是當我們再次審視各情景下的收益率時, 我們發現自己是註定要感到吃驚的,因為實現34%的收益率的機率為零。然而,知道預期不會出現並不意味著我們肯定知道最終實現的結果。驚奇中應該包含兩種要素,它們分別是實際收益對預期偏差的方向與幅度,因為它們是對隨機變量不確定性的測度。所以,瞭解偏差的機率分佈有助於理解我們現在所面臨的非確定性。 附錄A 定量計算的複習我們用期望收益來測度回報。從直覺來看,我們可以對偏差取期望,並用期望來測度該隨機變數的非確定性。然而在前一節中,我們已經看到偏差的期望必為零:當正的偏差被其機率加權後,正好能被負的偏差抵消。為解決這個問題,我們可以用偏差的平方來代替偏差,這樣我們能保證它必為一個正數(當d本身為負時也是如此)。 我們現在可以把方差定義為收益率對其預期偏差的平方的期望。它是我們“驚奇”或隨機變數散佈性質的一個指標。若將方式記為O,那麼其正式的定義公式為: C(r) E(dP)= Elr, E(r)]’=Z Pr(DI: E(r)(A-2) 式中每一項偏差的平方消去了符號的差異,於是就避免了正偏差與負偏差之間的抵消作用。 在安休瑟-布希公司股票的例子中,股票收益率的方差為: C(r)=0.20(0.20-0.34)’+ 0.5(0.30 - 0.34) + 0.3(0.50 -0.34)2=0.0124 注意,如果你在隨機變數之上加一個常數,其方差不會改變,這是因為此時式中的期望值也變化了相同的常數, 於是對預期的偏差沒有改變。你可以利用表A-1的數字來驗證這個結論。 然而,對隨機變數乘以一個乘數以後,其方差將有所變化。設現在每個收益率都乘以因子k,那麼新的隨機變數 kr具有期望E(kr)=kE(r),因此kr的偏差為: d(kr) =kr - E(kr)=kr - kE(r) =klr- E(r)]=kd(r) 如果每個偏差都乘以因子k,那麼偏差的平方就相當於乘以 K,有 c(kr) (r) 總之,在隨機變數上加一個常數並不會影響方差;但是當隨機變數變化常數倍以後,其方差的變化倍數就會是該常數的平方。 3. 標準差對方差的進一步研究發現,它的單位不同於期望收益。 回想一下,我們為了使所有偏差為正,我們利用了偏差的平方。這樣就使方差的單位變成了“百分比的平方”。為了把方差單位重新轉回至收益率百分比,我們取方差的平方根, 即標準差,在安休瑟-布希公司股票的例子中,標準差為 0=(02) 12= 10.0124-0.1114 即11.14% (A-3) 注意,如果你想得到標準差,你就必須先計算方差。 標準差與方差提示的資訊是相同的,只不過採取了不同的形式而已。 我們已經知道加上常數r並不會影響隨機變數的方差, 當然,也就不會影響其標準差。我們也知道了隨機變數乘以 557
附錄A 定量計算的複習一個常數後,其方差就會擴大該乘數的平方倍。從式(A-3) 關於標準差的定義中可以看到,隨機變數乘以一個常數後, 其標準差就會擴大該常數的絕對值倍,由於常數的符號在方差計算的平方過程中消去了,因此絕對值是必須的。正式地, 我們有: o(kr)=ko(r) 你可以利用表A-1中的資料加以驗證。 4. 方差係數為了評價隨機變數的散佈程度,往往我們會把散佈指標與其期望值進行比較。標準差與期望值之間的比值就稱為方差係數。在安休瑟-布希公司股票的例子中 CV= a/E(r)=0.1114/0.3400=0.3285 (A-4) 安休瑟-布希公司股票收益的標準差大概是期望收益的 1/3。方差係數是否代表一個較大的風險,這取決幹其他投資專案方差係數的值。 但方差係數遠非隨機變數散佈性質的理想指標。假設某一可能的隨機變數具有零期望。在這種情況下,不管標準差有多大,方差係數都將趨於無窮。很顯然,這個指標並不適用於任何情況。一般來講,分析者必須根據手中特定的決策問題來挑選一個關於散佈性質的指標。在金融界,許多情況下我們一般考慮整體風險,此時標準差就是較好的指標。 (對於某—單獨的資產來說,我們使用本文中介紹的B指標) 5. 偏度到現在,我們透過對平均驚奇(特定意義下)程度的描述,分析了一些關於散佈性質的指標。實際上標準差並不等於平均驚奇度,因為它是我們先把偏差平方,然後再求偏差平方均值的平方根,這樣做就會加大對“大偏差” 的權重。另外,標準差也只是一個告訴我們關於偏差“預期”的指標。 許多決策者都認為期望值與標準差是隨機變數最重要的兩個統計量。但是,一旦我們需要回答關於風險的另一個永恆的問題(風險是指隨機變數對其期望的偏差):如果出現較大的偏差,是不是極有可能是正的?風險厭惡者比較擔心負的偏差(驚奇),但標準差並沒有把好情況與壞情況分離開來。如果某個隨機變數具有易發生的小的負偏差和不易發生但很大的正偏差,那麼對於另一種具有相反特徵的隨機變數(即具有易發生的小的正偏差和不易發生但大的負偏差) 來說,許多風險厭惡者都偏好於前者。因為不管怎麼說,風險一般都被認為是發生災難(大的壞結果)的可能性。 能對好、壞結果可能性進行分離的一個指標是三階矩。 它仍然是建立在隨機變數對其期望的偏差d之上。如果把三階矩記M;,則有: Ms = E(d)=Elr-E(r) Pr(ilr, E(r) (A-5) 558 相對於小偏差來說,對每個d進行立方就強化了大偏差的程度。奇次冪仍能保持其各自的符號。人們回憶起所有偏差加權(以發生機率權重)之和為零,因為正負偏差正好互相抵消。但現在當偏差的立方乘以各自的發生機率然後加和之後,較大的偏差會佔據優勢。最終結果的符號會告訴我們究竟是正偏差明顯(M;為正)還是負偏差明顯 (Ms為負)。 顯然,之所以把偏度稱三階矩,是因為在計算過程中我們使用了立方。同樣地,方差通常被稱為二階矩,因為我們透過平方得到了方差。 回到表A-1中的投資決策。由於收益的期望值34%, 那麼三階矩就是: M; =0.2(0.20-0.34)’+0.5(0.30-0.34)°+ 0.3(0.50-0.34)’=0.000 648 三階矩的正號告訴我們在此例中正偏差比較明顯。你當然也可以透過考察偏差d及其機率而猜到這個結果:此例中,30%的收益率是最有可能實現的收益結果,它將會使投資者產生一個小的負驚奇,另一個負驚奇(20%-34%= -14%)的程度要小於正驚奇的程度(50%-34%=16%), 而且負驚奇發生的機率要小於正驚奇的機率(0.3)。但是差別看上去確實很小,而且我們也不知道在安休瑟-布希公司股票的投資決策中,三階矩到底是不是一個很重要的考慮因素。 如果沒有一個比較的標準,我們就很難判斷0.000648這個三階矩值的重要性。利用我們處理標準差的方法,我們可以取M;的三次方根(我們把其計為ms),然後把三次方根與標準差進行比較。計算結果為m; =0.0865=8.65%,與 11.14%的標準差相比,其井不是可有可無的。 A.1.3 另一個例子:關於安休瑟-布希公司股票的期權假設安休瑟-布希公司股票的當前價格為30美元,現在有該股票的看漲期權,其期權價格為0.60美元,還有該股票的看跌期權,其期權價格為4美元,它們都有相同的期權執行價格42美元。當然只有當最後看漲期權處於“實值”,即股價高於執行價格時你才會選擇這樣做,其中你的利潤就是期末股價與執行價格之間的差再減去看漲期權的成本。有時就算你執行了看張期權,你的利潤還是有可能為負,因為有時執行期權所得的收益並不足以彌補初始購買看漲期權的成本。假如最終看漲期權處於“虛值”狀況,也就是說股價低於執行價格,這時你就會任由該看漲期權過期,而只承擔初始購買看漲期權的成本。 看跌期權允許你用執行價格賣掉股票。只有當到期時看跌期權處於“實值”,即股價低於執行價格時,你才會選擇賣掉股票,現在你的利潤就是執行價格與股價之間的差再減去看跌期權的成本。同樣的,如果從執行看跌期權所得的收益並不足以彌補看跌期權的成本,投資者就會蒙受損失。當到期看跌期權處於 “虛值”狀態時,你肯定還會放棄看跌期權。這樣你的損失就鎖定在期初時購買看跌期權的成本之上。 這種投資方式的情景分析如表A-2所示。 表A-2 投資安休瑟-布希公司股票期權的情景分析情最1 情景2 情景3 機率事件 1.股票的收益股價(初始價格=30美元) 2. 看漲期權所得現金流(執行價格=42美元) 看漲期權所得利潤(初始價格=0.6美元) 看漲期權收益率 3. 看跌期權所得現金流(執行價格=美元42) 看跌期權所得利潤(初始價格=4美元) 看跌期權收益率 0.2 0.5 0.3 20% 36美元 -0.6美元 - 100% 6美元 2美元 50% 30% 39美元 0 -0.6美元 -100% 3美元 -1美元 - 25% 50% 45美元 3美元 2.4美元 400% 0 -4美元 -100% 看漲期權與看跌期權的收益率期望分別為: E(T百漲期權)=0.2(-1)+0.5(-1)+0.3(4)=0.5(即50%) E(r有踐期)=0.2(0.5)+0.5(-0.25)+0.3(1) =-0.325(即-32.5%) 上式中看跌期權的期望為負,這也許反映了看跌期權作為套利資產的本質,因為在此例中安休瑟-布希公司股票持有者需要購買它作為防止安休瑟-布希公司股價下跌的保值措施。兩種投資方式的方差與標準差為: 不旅婀權= 0.2(-1-0.5)’+0.5(-1-0.5)’+0.3(4-0.5)2 =5.25 ◎ 百跌期製= 0.210.:5-(-0.325)1+0.51-0.25-(-0.325)1+ 0.3[-1-(-0.325)]2=0.2756 O石珠期 V5.25-2.2913(即229.13%) C石跌期權= N0.2756 = 0.525(即52.5%) 這些標準差是比較大的。把看漲期權收益的標準差與其期望值相除,我們得到方差係數為 CV不張糊權 2.2913 2=4.5826 0.5 回憶一下股票收益本身的方差係數僅0.3275,很顯然該種投資工具具有很高的標準差。這對於股票期權來說是很正常的,儘管看跌期權的期望收益為負,但其方差係數仍然可以描述“驚奇”的程度。 現在我們考慮兩種機率分佈的三階矩: M(看漲期權)=0.2(-1-0.5)°+0.5(-1-0.5)3+0.3(4-0.5) =10.5 附錄A 定量計算的複習 Ms(看跌期權)=0.2[0.5-(-0.325)]’+0.5[ 0.25 (-0.325)]’+0.31-1-(-0.325)]3 =0.020 25 兩種投資工具都向正方向偏斜,這是期權的典型特徵, 也正是其吸引人之處。在此例中看漲期權似乎比看跌期權偏斜得更厲害。為了說明這個事實,我們計算三階矩的三次方根: ms(看漲期權) M(看漲期權) =2.1898(即218.98%) ms(看跌期權)=0.021/=0.2725(即27.25%) 把看漲期權的標準差229.13%及看跌期權的標準差 52.5%與上述數字相比較,你能看到期權標準差的大部分是由於正偏差引起的,這意味著好結果的幅度較大,而壞結果雖然更可能發生,但幅度卻很小。’ 至此,我們已經利用情景分析法描述了離散機率分佈的問題。我們還會在A.3節重新回到決策的情景分析法。 A.1.4 連續分佈:正態分佈與對數正態分佈當一種經壓縮的情景分析法既是可能的,又是可接受的時候,決策就顯得很簡單了。但是許多情況下,我們必須分清楚的情形太多了,以致於在實際中應用情景分析法變得不可能。甚至在安休瑟-布希公司股票的例子中,儘管我們在確定情景時相當小心,但實際上:每個情景只能代表一個復合事件。 當必須考慮許多收益率的可能值時,我們就應該使用一個能刻面其機率分佈的公式。正如我們前面提到的那樣, 存在兩種型別的分佈:離散的與連續的,情景分析法解決了離散分佈的情形。但是,正態分佈與對數正態分佈這兩種在投資中很有用的分佈卻都是連續的。同時,它們經常被用在近似一些離散的隨機變數分佈,如股價上。未來股價收益的機率分佈是離散的——因為股票報價以1/8為單位。 但是在習慣上,我們一般用正態與對數正態分佈來近似它們的分佈。 1. 標準正態分佈正態分佈,也稱為高斯分佈(以數學家高斯命名)或者鐘形分佈。服從該分佈的隨機變數有如下的性質(見圖 A-1) •期望值是其眾數(出現頻率最高的基本事件),同時也是中位數(所有基本事件從大到小排列後那個位於中間的數)。注意,期望值與中位數或眾數都不同,它是與其事件相聯絡的機率相乘後加和才得到的中間值。 3 注意,看跌期權的預期收益率為—32.5%,因此,最壞的結果為-67.5%,最好的結果為82.5%。中間情景也有一個 7.5%的正的偏差(它出現的機率有0.50)。這兩個因素解釋了看跌期權的偏度。 559
附景A 定量計算的複習 •正態分佈是關於期望值對稱的。換句話說,絕對值相同的正偏差與負偏差出現的機率是相同的。對期望值偏差越大,其事件發生的可能性越小。事實上,正態分佈的關鍵之處就在於事件的機率隨著其偏差的增大而呈指數下降。 •一個正態分佈可以由兩個引數完全決定,即其期望值和標準差。正態分佈一個有利於資產組合分析的特徵是正態分佈隨機變數的加權和仍服從正態分佈。這個性質被稱做穩定性,如果你對服從正態分佈的隨機變量加一個常數或乘以一個常數,它也是穩定的,即變換後的隨機變數仍服從正態分佈。 面積=Prr≤a) 商稅=Pra r b) 面積 Pr(r>b) 圖A-1 正態分佈下的機率圖設n是一個任意的隨機變數(並不必服從正態分佈), 其期望為,標準差為c。正如我們前面所說的那樣,如果你在n上加一個常數c,那麼其標準差不變,均值變為十C。 如果你把n括大b倍,它的均值與標準差也會相應變次bu和 bc。如果n服從正態分佈,轉換所得的隨機變數也服從正態分佈。 穩定性,再加上正態隨機變數完全由其期望及標準差確定的性質,意味著一旦我們知道了一個正態分佈的期望及標準差,我們就知道其所有的資訊了。 如果把隨機變數減去期望值,然後除以標準差,我們就得到了標準正態分佈。服從標準正態分佈的隨機變數具有零期望,具其標準差與方差都等於1的特性。正式地,服從標準正態分佈的隨機變數z與其機率f的關係。由下式給出: f(z)=. •exp (A-6) V2 其中 “exp”是指自然對數e的冪函式。像式一樣,e是一個很重要的數值,兩者在上述公式中都出現了。它們的重要性足以讓你在你的金融計算器上為它們專門設定按鍵。因為它們經常在連續分佈的計算中會被用到。 連續分佈的機率函式通常被稱為密度,記為f,以區別於情景分析中的Pr;原因是因為隨機變數的可能取值有無窮多個,於是其取每個值的機率必為無窮小。密度是一種函式,我們可以透過對它在一段區間上的積分來得到這一 560 區間裡取值的機率。換句話說,如果我們要計算一個標準正態分佈變數落在區間[a.b]上的機率,只要把隨機變數z從 a到b的f(z)都加總起來就能得到。無論a與6多相近,在該區間內必有無數多的隨機變數z,積分正是解決這個問題的數學運算方法。 我們先來考慮一個服從標準正態分佈的隨機變數2小於等於a的機率,即z落在值域[-∞,a]上的機率。我們應該對密度函式在區間[-∞,a]上進行積分,所得結果稱為累積 (正態)分佈,以N(a)表示。當a達到無窮大時,z就可以取任何值;因此這時z取值的機率接近於1。任何一個密度函式都有這個性質,即當隨機變數在整個取值範圍上進行積分時, 累積分佈就達到1.0。 同樣,一個服從標準正態分佈的隨機變數z小於等於b 的機率為N(b),於是,z在區間[a,b上取值的機率就是N(b) 與N(a)之差。正式地,我們有: Pr(a b) N(b) N(a) 圖A-1列示了這些概念。圖中畫出了正態分佈的密度函數。在圖中我們可以看出正態分佈關於期望值的對稱性(標準正態分佈的期望為零,同時眾數與中位數也為零),以及偏差越大機率可能性越小的特性。跟任何一個密度函式一樣, 在密度函式線下的所有面積加總為1.0。a和b正好正值, 因此它們在期望值的右側。最左邊的深色區域是密度函式中 z《a的部分,因此這部分面積就是a的累積分佈,也就是z《a的機率。中間的淺區域是a與之間密度面積。如果我們把這部分面積加上a的累積分佈,我們就得到了到達b的總密度面積,也就是z落在b左邊的機率。於是a、b之間的面積即為 2落在a,b之間的機率。 利用相同的邏輯,我們找到了z>b的機率。我們已經知道z< 的機率為N(b)。由於複合事件“小於等於 ”和復合事件“大於 ” 是互斥的而且完全的(指兩個事件包含了所有可能的結果)。因此它們的機率之和為1.0;於是要計算 2 >b的機率,我們只要簡單地用I減去z b機率即可。正式地,我們有: Pr(>b) 1-N(b) 讓我們再來看圖A-1密度函式下b到正無窮之間的區域面積就是密度函式整個面積(等於1)與負無窮到b之間面積的差。 正態密度函式已經足夠複雜,以致於它的累積函式 (即其積分)並沒有一個很精確的顯式解。它必須求助於近似方法才能得到。就像本書中表21-2那樣,我們已經把任何 z值所對應的N(2)值求了出來並製成表供查詢。 為了進一步說明問題,下面我們計算標準正態分佈的機率: Pr(z≤-0.36)=N(-0.36)=2小於等於-0.36的機率
Pr(z≤0.94) =N(0.94)=2小於等於-0.94的機率 Pr(-0.36<z≤0.94)=N(0.94) - N(-0.36)=2落在區間 [-0.36,0.94]之間的機率 Pr(z>0.94)=1-N(0.94)=2大於0.94的機率利用表21-2的標準正態累積函式(有時也稱為正態分布面積)和圖A-2,我們得到: N(-0.36) =0.3594 N(0.94) =0.8264 如圖A-2所示,-0.36和0.94之間的面積就是z落在 [-0.36,0.94]之間的機率,因此有: Pr(z>0.94)=1-N(0.94)=1- 0.8264=0.1736 最後,還有一個問題,如果z小於等於a的機率P,那麼a的值為多少? 我們假定得到a的函式中(P),於是就有: 如果 (P)=a,則P=N(a) (A-7) 比如說,假設現在的問題是:累積密度0.5的值為多少?只要看一下圖A-2,我們就知道負無窮到零(即期望值) 之間的面積為0.5,於是我們就有: $(0.5)=0 因為 N(O)=0.5 同樣地 (0.8264)=0.94 因為 N(0.94)-0.8264和①(0.3594)=-0.36 我們可以驗證一下。從表21-2中得出中(0.655 4)=0.40, 這意味著具有累積分佈密度為0.6554的值是z=0.40。 N(-0.36) 1- N(0.94) -0.36 0.94 圖A-2 機率與累積正態分佈 2.非標準正態分佈假定某種股票的月收益大致服從均值為0.015(1.5%每月),標準差為0.127(12.7%每月)的正態分佈。那麼在某月中收益率小於零的機率為多大?注意由於收益率服從正態分佈的隨機變數,它的累積分佈密度就可以用數字方法得附錄A 定量計算的複習到。標準正態分佈表可以應用於任何一個正態分佈的變數。 任一個隨機變數x,可以透過下式而替換成一個新的標準化的隨機變數x: x=[x-E(x)1/o(x) (A-8) 注意,我們對x所做的步驟是:1)減掉期望,2)乘以標準差的倒數1/o(x)。根據我們前面的討論,對隨機變數來說, 加上和乘以一個常數的替換效果就是使替換後的隨機變數具有零均值和單位方差。 ECx')=[E(x)- E(x)]/o(x) =0;ox')=o(x)/o(x)=1 (A-9) 從正態分佈的固有性質我們知道,如果x服從正態分佈, 那麼x也服從正態分佈。一個正態分佈的隨機變數可以由兩個引數完全確定:它的期望與標準差。對於x‘來說,它們分別為0與1.0。當我們對一個隨機變數減去其期望然後再除以其標準差以後,我們就把它標準化了。也就是說,我們把它轉化成了一個服從標準正態分佈的隨機變數。這個方法在對正態分佈(近似正態分佈)隨機變數進行處理上應用得非常廣泛。 回到我們先前考慮的股票。我們知道如果把月收益率減去0.015,然後再除以0.127,所得的隨機變數就是服從標準正態分佈的。我們現在可以確定某月收益率小於等於零的機率。我們知道,有 r-0.015 2髮 0.127 其中r股票的收益率,z服從標準正態分佈。所以,如果 r=0,z就應該力 0-0.015 --0.3181 0.127 當 =0時,相應的標準化隨機變數 =-11.81%,為一負數。“r小於等於零”的事件應與“z小於等於-0.118 1” 等價。計算後者的機率就能夠解出我們要求的問題。它的機率即另N(-0.1181),利用標準正態表我們得到: Pr(r≤0=N(-0.1181)=0.5-0.047=0.453 結果很有意義。回憶起r的期望值為1.5%。所以,由於 r小於等於1.5%的機率為0.5,r小於等於0的機率應該接近於 0.5,但可能會再低一些。 3. 置信區間由於我們的股票具有較大的標準差,因此我們有理由去懷疑月收益率絕對數值的可靠性。對於這個問題,一種量化的回答方法是解決這個問題:“如果某股票收益率落在某區間的機率為95%,那麼該區間是什麼?”這個區間也被稱為95%的置信區間。 一種符合邏輯的區間是以期望值為其中心的,因為r本 5G1
附景A 定量計算的複習身就是關於期望值對稱的正態分佈隨機變數。把所求區間記為 [E(r)-a,E(r)+a]=[0.015-a,0.015+a] 它的區間長度為2a。r落在此區間內的機率可用下式表出: Pr(0.015-a ≤0.015+a)=0.95 要解決這個問題,我們首先從標準正態分佈的隨機變量入手。服從標準正態分佈的隨機變數具有零期望與單位方差。 標準正態分佈隨機變數z的95%置信區間是什麼?由於變數的分佈關於零對稱,因此上面的計算式變為 Pr(-a"《z≤a)=N(a”)-N(-a)=0.95 圖A-3有助於你對上式累積分佈差所代表的意義有更好的瞭解。落於此區間外的機率為1-0.95=0.05。由於正態分佈的對稱性, 小於等於 a的機率為0.025,而且z≥a的機率亦為0.025。於是我們可以用下式來解出a: -a'=¢(0.025),其等價於N(a)=0.025 N-1.96 = 0.025 1- N(1.96)=0.025 -* =-1.96 =-0(0.025) E(z)=0 c*=1.96 =4(0.975) -售-0.23 =0.015-00(0.025) E(r) =0.015 c=0.26 =0.015+04(0.975) r= 02+E(r) 圖A-3 置信區間與標準正態分佈我們可以對該思路作如下總結。如果我們要尋找一個置信水平為95%的置信區間,我們可以定義為r落於置信區間之外的機率。由於具有對稱性,c的一半就是其落於置信區間右端的機率。同時其落於置信區間左端的機率亦為a/2。 所以c與P之間的關係為: a=1-P=0.05 a/2=(1-P)/2=0.025 我們這裡使用a/2的原因就是考慮到分佈的兩個尾部把r 以外的區域平分了。不含r值的任一尾部都具有a/2的面積。 值a=1-P表示的是不含r值所有區域的面積。 為了確定標準正態分佈隨機變數的置信區間下邊界z= (a/2)。我們透過標準正態累積分佈值0.025來確定z值。查表得2= 1.96,於是我們推斷出 a= 1.96,a=1.96,z 的置信區間火 562 「Ex0)-o)、Ee)) -[-¢(0.025),中(0.025)]-[-1.96,1.96] 為了得到非標準正態分佈隨機變數r的區間邊界,我們只要利用關係式 =20(r)+E(r)=0(a/2)o(r)+E(r)來轉化2的邊界即可。注意,我們迄今為止都是設期望值力置信區間的中心,然後以其一定數量的標準差向兩邊拓展。標準差的數量取決於我們允許其落於置信區間之外的機率(c),或者就是其落於置信區間的機率(P)。透過加減1.96[即z=土 ¢(0.025)],我們得到期望值兩邊的距離為士1.96× 0.127= 0.249,於是我們得到了置信區間: [E(r) 0.249,E(r)+0.249] -[-0.234,0.264] 以滿足子對於我們的股票(期望值 0.015,標準差0.127)來說, 也就是 Pr[-0.234≤r≤0.264] =0.95 注意到由於股票收益率的標準差較大,95%的置信區間的寬度竟達到了49%。 利用該例的一個變體,我們再複習一下計算過程。假設我們要求一個資產組合年收益rp90%的置信區間,其年收益率的期望值1.2%。標準差為5.2%。 該例的解為: - Prf0.012-0.052 ×1.645< p ≤ 0.012+ 0.052 ×1.645」] -Pi-0.0735<rp≤0.0975]-0.90 因為該資產組合的風險較低,而且我們要求落於所求區間的機率為90%(而非95%),所以該置信區間的寬度僅為2.4%。 4. 對數正態分佈採用正態分佈來描述股價及收益率存在著兩個不足。 首先,儘管正態分佈允許隨機變數取任何值(包括負值), 但實際的股價不可能為負。其次,正態分佈不適於計算複利。 而對數正態分佈解決了這兩個問題。 對數正態分佈描述了一個不斷增長的隨機變數,它的增長率為一正態隨機變數。因此,一個對數正態分佈隨機變量的生成過程反映了連續計算複利的特徵。
假定某股票以年連續複利(ACC)計算的收益率服從正態分佈,且其期望值為 =0.12,標準差為=0.42,年初的股價為P。=10美元,利用連續複利(參見第5章附錄5A), 如果年複利r=0.23,則年末的股價應 P, =Poexp(rc)= 10e023 = 12.586美元其等價的有效年利率片 7-B-P-e~-1-0.2586 (即25.86%) 這就是服從對數正態分佈的年利率r的實際意義。注意, 儘管年連續複利r可能為負,但期未股價P,不可能為負。 服從對數正態分佈的金融資產具有兩個重要的特性: 它們的期望收益以及考察期長度的可變性。 (1) 服從對數正態分佈資產的期望收益一個對數正態分佈股票的期望年收益 E(r) =exp(p + G/2)-1 = exp(0.12 + 0.423/2)- 1= e0.2082-1 =0.2315(即2315%) 這只是關於分佈統計值的一個數學特性。鑑於此,一個有用的統計量定義如下: = 0.2082 2 當分析家們提到對數正態分佈資產年複利的期望時, 他們一般是指p。通常這份資產的年複利就被認為服從期望是p,標準差為o的正態分佈。 (2)考察期間長度的可變性對數正態分佈允許資產持有期的變動。假定我們希望能計算月收益,而非年收益。我們用:來表示我們要求的時間段,為方便起見,t用分數(以年單位)來表示;那麼在比例中我們就設t=1/12。為了把年收益的分佈轉化成:段收益的分佈,我們只需要把原分佈的期望與方差乘以唧可(本例中1=1/12)。 在我們這個例子中,股票月連續複利的期望和標準差次: (月)=0.12/12=0.01(即1%每月) (月)=0.42/V12 =0.1212(即12.12%每月) (月)=0.2082/12=0.01735(即1.735%每月) 注意我們在把年轉化為月時,方差應除以12;因此標準差應除以v12。 同樣的,我們可以把一個非年利的分佈轉化為一個以年利計算的分佈。例如,假設股票周連續複利服從正態分佈, 且p'=0.003,G=0.07,於是年連續複利分佈的各項指標為 w =52 × 0.003=0.156(即15.6%每年) a= J52 ×0.07=0.5048(即50.48%每年) 附錄A 定量計算的複習在實際應用中,為了得到標準正態分佈的連續複利R, 我們通常取原始收益率加1.0後所得和的對數: R=log(1+r) 在短時期內,原始收益率很小,所以連續複利R也會與原始收益r非常相近。所以對於一個月或短於一個月的期間來說,這個轉換並不是必需的。也就是說,用正態分佈的股票收益率來近似,已經足夠精確了。但是對於一個較長的時期來說,這個轉換還是很有必要的。 A.2 描述統計學迄今為止我們的分析都是“向前看”,或者系統經濟學家所說的“以過去推知未來”。我們已經討論了機率、期望值與驚奇。如果我們假設決策結果的分佈遵循一個相對簡單的公式,而且我們對該分佈與引數也瞭如指掌,那麼我們就能較容易、較準確地進行分析了。 投資管理人必須讓他們自己確信這些假設都是合理的, 而他們是透過長時期對相關隨機變數觀測值的積累來達到這一點的。為了做出最優決策,股票收益率在以前的分佈是他們必須知道的•個要素。確實,收益率的分佈隨著事件在不斷改變。但是,一個不太“古老”的樣本應該能夠對下一期的收益率分佈及引數提供相關的資訊。在這一節中,我們介紹描述統計學,也稱為歷史樣本的組織分析。 A.2.1 柱狀圖、盒式描點與時間序列描點表A-3列出了兩種主要資產:標準普爾500指數與長期政府債券資產組合1926~1993年的年超額收益(超過國庫券收益部分)。 理解這些資料的一種方法是把它們畫在圖上,一般是作成柱狀圖或頻率分佈圖。表A-3中68個觀測值被作成了如圖A-4所示的頻率分佈圖。本節我們要根據以下步驟及原則來得到頻率分佈圖: •隨機變數取值的值域一般被平均分成幾個相對較小的子值域。間隔的多少取決於可得觀測值的數量。表 A-3提供了68個資料,因此10分法(即10個間隔值域) 看來已經足夠。 •在第一個間隔值域中作出一個長方形,長方形的高度表示在該值域內觀察值出現次數的多少。 • 如果觀測大多都集中在整個值域中的一小部分,那麼該值域就可以被分成不相等的間隔。在這種情況下, 各間隔觀測值的頻率大小就由間隔中所作長方形的面積來表示(但這並不是我們這裡所要討論的例子)。 •如果樣本是具有代表性的,那麼該頻率分佈圖的形狀就可以揭示隨機變數真實的機率分佈了。我們所有的 68個觀測值並不是一個大樣本,但是頻率分佈圖的大 563
附錄A 定量計算的複習表A-3 股票及長期國債的超頰收益年份(年) 1926 1927 1928 1929 1930 1931 1932 1933 1934 1935 1936 1937 1938 1939 1940 1941 1942 1943 1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 股杈風險溢價 8.35 34.37 40.37 - 13.17 -27.31 -44.41 -9.15 53.69 -1.60 47.50 33.74 - 35.34 31.14 -0.43 -9.78 - 11.65 20.07 25.55 19.42 36.11 -8.42 5.21 4.69 17.69 30.51 22.53 16.71 -2.81 51.76 29.99 4.10 - 13.92 41.82 9.01 - 3.13 24.76 -11.46 . 債券到期溢價 4.50 5.81 -3.14 -1.33 2.25 -6.38 15.88 -0.38 9.86 4.81 7.33 -0.08 5.55 5.92 6.09 0.87 2.95 1.73 2.48 10.40 -0.45 -3.13 2.59 5.35 -1.14 -5.43 -0.50 1.81 6.33 -2.87 -8.05 4.31 -1.64 -5.21 11.12 - 1.16 4.16 年份(年) 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 樣本均值標準差最小值最大值資料來源:The Center for Research of Security Prices, University of Chicago. 致形狀確實說明了收益率大致服從一個正態或對數正股杈風險溢價 19.68 12.94 8.52 - 14.82 19.77 5.85 - 15.08 -2.52 9.92 15.14 -21.59 -34.47 31.40 18.76 - 12.30 -0.62 8.06 21.18 - 19.62 10.87 13.71 -3.58 24.44 12.31 -0.24 10.46 23.12 - 10.98 24.95 4.16 7.09 8.$7 20.90 -44.41 53.69 債券到期溢價 - 1.91 -0.03 -3.22 -1.II -13.40 -5.47 -11.66 5.57 8.84 1.84 -8.04 -3.65 3.39 11.67 -5.79 -8.34 -11.60 - 15.19 - 12.86 29.81 -8.12 5.58 23.25 18.28 -8.16 3.32 9.74 -1.63 13.70 4.54 15.34 1.62 8.50 - 15.19 29.81 態的分佈。 另外一個透過作圖把樣本資訊體現出來的方法是盒式描點法。圖A-5就是盒式描點的例子,它使用的同樣是表 A-3的資料。盒式描點是一種能體現樣本分佈離散性質的好方法。一個通常使用的散佈性質指標是“內四分值域”。我們可以回憶一下值域這種最原始的散佈指標,它是觀測值中最大值與最小值之間的差。由於它很可能會由兩個最極端的觀測值所決定,因此這個指標並不可靠。 內四分值域是關於值域概念的一個較令人滿意的簡單變體,它由樣本排序後最低1/4與最高1/4兩者之間的差來確定。對於最低1/4的觀測值來說,樣本中有25%的觀測值小於它;同樣,在最高1/4的觀測值上面,存在25%的大於它的觀測值。於是內四分值域就是樣本中間50%觀察值所組成樣本的值域。樣本散佈度越高,這兩個值之間的差距就越大。 在盒式描點圖中,水平的虛線表示中位數,中間的方盒表示內四分值域,垂直線則表示從方盒延伸出去的幅度。 564
附錄A 定量計算的複習 12 10 0 16 14 12 10 6 2 0 -45 -35 -25 -15 -5 15 25 35 45 55 a) -15 -105 -6 -1.5 3 7.5 12 16.5 21 b) 圖A-4 a) 股權以險溢價的歷史資料柱狀圖;b)債券到期溢價的歷史資料柱狀圖資料來源:The Wall Street Journal, October 15, 1997. 垂直線所表示的延伸值域一般只限制於內四分值域的1.5倍。 這樣許多極端的觀測值(圖中以分離的點表示)就只能被視為遠離中心的非常規點。 作為一次概念檢查,驗證一下表A-3的原始資料與圖 A-5的方盒描點作圖,並與下列數字作比較。 股權風險溢價最低的極端點 -44.41 - 35.34 -34.47 -27.31 -21.59 - 19.62 - 15.08 - 14.82 - 13.92 ~ 13.17 -12.30 債券到期溢價 ~ 15.19 -13.40 -12.86 -11.66 -11.60 -8.34 -8.16 -8.12 -8.05 -8.04 -7.64 -6.38 -5.79 -5.47 -5.43 最低1/4的分界點中位數最高1/4的分界點最高的極端點股杈風險溢價內四分值域內四分值域的1.5倍從: 到: -4.79 8.77 22.68 29.99 30.51 31.14 31.40 33.74 34.37 36.11 40.37 41.82 47.50 S1.76 $3.69 27.47 41.20 -11.84 29.37 25.5 30 (續) 債券到期溢價 -5.21 -3.33 1.77 5.64 8.84 9.74 9.86 10.40 11.12 11.67 13.70 15.34 15.88 18.28 23.25 29.81 8.97 13.45 -4.95 8.49 565
附錄A 定量計算的複習收益率(%) 60.00 50.00~ 40.00. 30.00 - 20.00一 1000 一 0.00+ 0 -10.00 一 -20.00~ -30.00 - ••: -40.00 1 • -50.00 股票債券圖A-5 年股權風險溢價與長期債券(到期) 風險溢價的盒式描點圖,1926~1993年最後是時間序列描點法,它能夠揭示經濟變數隨時間變化的運動規律。圖A-6是根據表A-3作的股票及債券超額收益時間序列點圖。儘管我們的眼睛已經習慣於看到由時間序列生成的隨機形狀,但考察一般長時期內時間序列的變化趨勢卻能給我們提供‘個有用的資訊。有時透過•些正規的統計分析,這樣的檢驗就會奏效。 A.2.2 樣本統計量假設在1926~1993年這68年中股票收益的機率分佈一直沒有變化。現在我們希望能從表A-3這68個股票年超額收益的觀測值中得到關於機率分佈的某些資訊。 表中的樣本值是否為特定機率分佈下的獨立觀測值, 這是一個很關鍵的中心問題。如果它們確實是,那麼所得的統計分析結果就比較正確。我們的分析都建立在這個假設之上。在許多情況下,金融市場上的實證研究能證實這個前提假設。 566 1.從樣本均值來估計期望收益期望收益的定義告訴我們,樣本均值應該可以作為樣本期望值的一個較好的估計。事實上,在期望值的眾多定義中,有一個定義就是當觀測值個數趨於無窮時的樣本均值。 假定表A-3中的收益樣本為R,1=1,2,⋯,T=68, 那麼年超額收益期望值的估計即頭 R=1/TZR, =8.57% R上的橫槓表示它是期望值的估計。從直覺上來看,樣本容量越大,樣本均值作為期望估計值的可靠性也就越大; 而隨機變數的標準差越大,均值作為期望估計期的可靠性也越小。下面我們將更詳細地討論這個性質。 2.估計高階矩以樣本均值來估計期望的原理同樣也適用於對更高階矩所進行的估計。回憶一下,高階矩的定義就是隨機變數對期望偏差若干次方的期望。比如說,方差(二階矩)是偏差二次方的期望。於是,樣本觀測值對樣本平均的偏差進行平方後,平方的平均值s即為方差的估計。 52= 一二(R, -R)”= T-1 67 2(R,-0.0857) = 0.043 68(s-20.90%) 其中頁即樣本均值。偏差平方取平均值時分母採用了T-1=67,這純粹是一個技術上的原因。如果我們除以T, 那麼方差的估計就會偏小,偏小因子T-1/T。同時,對高階矩來說,樣本容量越大,真實標準差越小,估計值的可靠性也就越大。 A.3 多隨機變數的統計分析資產組合的構建需要將所有隨機變數進行加總。資產組合的收益率就是各資產收益率的加權平均。因此對於資產組合分析來說,理解和量化各隨機變數之間的獨立性是相當重要的步驟。 在本節中,我們首先回到情景分析法,然後再考慮如何從樣本中獲取資訊。 A.3.1 隨機變數間關係的一個基本指標:協方差在表A-4中,我們把安休瑟一布希公司股票及其期權的收益率情況分析結果做了一下總結。對於隨機變數加一常數或乘以一個常數的情形,我們早已熟悉了。但當我們把兩個隨機變數加在一起,結果會怎樣呢?假如我們現在把股票收益加在看漲期權收益之上,我們於是得到了一個新的隨機變量,並把它記為r(s+c)= (S)+r(c),其中r(s)為股票收益, r(c)為看漲期權收益。
附錄A 定量計算的複習 60 50 40 30 20 10 0 -10 -20 -30 -40 -50 30 25 20 B8 93 B9 94 gg 01 93 9H 94 1979 1985 -5 -10 -15- -20 b 圖 A-6 a)股權風險溢價,1926~1993年;b)債券到期溢價,1926~1993年由定義可知,該合成隨機變數的期望值為: 變數的期望值之和。對於方差,這句話還適用嗎?回答是 Elr(s+ C)] =ZPr(ir.(s+c) (A-10) “不”,這也是資產組合理論中最重要的事實。其原因就歸根於聯合隨機變數之間的統計相關性。 把r(s+c)的定義代入式(A-10),我們有: 首先,我們來介紹一下相關性最基本的測度,方差。 Elr(s + c)] =z Pr(ilr(s)+r(c)] 儘管下面的表述看上去很艱深,但它們最多不過是平方和而 =z Pr(ir(S)+Z Pr(ir(c) (A-11) 已,也就是(a+b) =a’+B+2ab和(a-b} =a+6-2ab = E[r(s)]+ Elr(c)] 這兩個最基本的公式。其中的a、b可能表示隨機變數,也可也就是說,兩個隨機變數之和的期望值等於兩個隨機以是它們的期望,或者它們對其期望的偏差。由方差的定義, 567
附錄A 定量計算的複習我們有: (A-12) 表A-4 安休瑟-布希公司股票及期權收益的機率分佈情景1 情景2 0.20 0.50 情景3 0.30 機率收益率(%) 股漶看漲期權看跌期權股票看漲期權看跌期權 20 - 100 50 E(r) 0.340 0.:500 - 0.325 30 - 100 -25 a 0.1114 2.2913 0.5250 50 400 -100 0.0124 5.2500 0.2756 為了使式(A-12)到式(A-20)變得易於理解,我們以S,(腳標來表示隨機變數,然後以i來表示各種情景。在式(A-12)中替換r(S+c)及其期望的定義式,有: (A-13) 在式(A-13)中交換各變數的順序,有: 在平方的括弧裡面,其實就是兩個隨機變數對其期望偏差的和,我們以d記之,即: Oh - El(d,+d.)'1 (A-14) 式(A-14)是一個完全平方和的期望。把平方展開, 我們有: Ostc E(d+d+2d.d.) (A-15) 式(A-15)括號中由三個隨機變數的和組成。由於和的期望就是期望的和,我們可以把式(A-15)寫成: Oirc - Eld!)+E(d)+2E(d.d.) (A-16) 在式(A-16)中,等號右邊的前兩項就是股票收益的方差(即偏差平方的期望)加上期權收益的方差,第三項就是協方差的兩倍,該定義就在式(A-17)。(注意期望要乘以2,是因為隨機變數兩倍的期望等於隨機變數期望的兩倍。) 換句話來說,隨機變數之和的方差是方差之和再加上協方差的兩倍。我們這裡記協方差為: 協方差的值與表示式括號中兩個隨機變數的順序無關。 由於乘法計算與字母的順序無關,由式(A-17)協方差的定義可知字母順序的改變不會影響協方差的值。 我們利用表A-5中的資料作為原始輸人資料來計算協方差。計算過程及結果如表A-5所示。 568 表A-5 安休瑟-布希公司股票及期權收益相對於各自期望的偏差、偏差平方及偏差加權積情景1 情景2 情景3 機率加杈和機率股票的偏差偏差平方看漲期權的偏差偏差平方看跌期權的偏差偏差平方偏差乘積(d.d.) 偏差乘積(d.d。) 偏差乘積(d.d,) 0.20 0.50 0.30 -0.14 -0.04 0.16 0.019 6 0.0016 0.0256 0.0124 - 1.50 -1.50 3.50 2.25 2.25 12.25 5.25 0.825 0.75 -0.675 0.680 625 0.005 625 0.455 635 0.21 0.06 0.56 -0.1155 -0.003 -0.108 - 1.2375 -0.1125 -- 2.3625 0.275 628 0.24 -0.057 -1.0125 首先,我們分析股票與看漲期權之間的協方差。在情景1或情景2中,兩種資產都表現出了對各自期望值的負偏差,這是正的同步性的一種反映。當兩個負的偏差相乘時, 最終構成協方差的偏差乘積就會是正的。當隨機變數變化方向一致,那麼協方差就趨於正,當隨機變數的變化方向相反, 那麼協方差就趨向於負。在情景3中,兩種資產都是正偏差, 這更有力地表明瞭兩者的同步性。偏差乘積的大小程度,再乘以各個情景的發生機率,然後加總,所得的結果就是協方差。它不僅能說明同步性的方向(透過其符號),而且也能說明同步性的程度。 協方差是一個類似於方差的統計量。方差測度的是一個隨機變數偏離其期望值的程度,而協方差測度的是兩個隨機動性變數對其各自期望值偏離的同步性程度。對於資產組合分析來說,有一個性質是很重要的,那就是一個隨機變數與其自身的協方差等於它的方差。如果你在式(A-17)中適當地替換某些偏差,你就會看到這一點。此時,協方差的結果就是該隨機變數偏差平方的期望。 在表A-5最後一列的前三個值就是我們已經熟悉的三種資產的方差,它們分別是股票、看漲期權與看跌期權。該列最後三個數值是協方差,其中的兩個呈負值。比如說,我們考察股票與看跌期權的協方差。在情景1中,股票實現了負的偏差值,而看跌期權則實現了正的偏差值。當我們把它們相乘時,符號為負。在情景3下,同樣的情況也會發生,只是現在股票實現的是正偏差,而看跌期權為負偏差。同樣, 乘積仍為負,因此更加強了兩者之間負的同步性。 對其他的情景或者其他的資產來說,偏差乘積可以在某些情景下為負,在另一些情景下為正。這些乘積的值,再乘以它們各自實現的機率,決定了兩個隨機變數同步性的性質。但是,如果我們發現不管各種情景的乘積符號怎樣變化, 各自的結果會大致正負相抵,並最終得到一個很小的接近於零的協方差,那麼我們就會推斷各資產的收益間存在著小的同步性,甚至就根本不存在同步性。
由於協方差就是兩隨機變數對期望偏差乘積的期望, 要分析變數替換對協方差的影響,我們可以從變數替換對其偏差影響的分析來人手。 假設在其中一個隨機變數上加了一個常數,我們早就知道此時其期望也會增加同樣的常數,所以其對期望的偏差應該保持不變。就像對一個隨機變數加上一個常數不會影響其方差一樣,這樣做也不會影響它與其他變數的協方差。 把隨機變數乘以一個常數後,它的期望也擴大了常數倍,於是其對期望的偏差也擴大了常數倍。因此,這樣做會使它與其他隨機變數的協方差擴大該常數倍。利用協方差的定義公式,讀者可以驗證下式是否成立(該式是對上文討論的總結)。 (A-18) 有了協方差,我們就可以計算隨機變數之和的方差, 進而計算資產組合收益率的方差了。 A.3.2 一個純粹的相關性指標:相關係數假如我們告訴你,現在股票收益率與看漲期權收益率之間的協方差0.24(見表A-5)。你能得出什麼結果?因為符號為正,你可能會得出兩種收益大致為同向變動的結論。 但是,對於股票與看漲期權同步性的具體程度來說,0.24這個數字實在毫無用處。 要得到一個關於描述同步性程度的相關性指標,我們可以把協方差再除以這兩個變數的標準差。每個標準差即為其方差的平方根。於是兩個標準差的乘積就與方差具有同樣的測度單位,而且也與協方差的單位相同。所以,我們據此定義相關係數p Cov(t.f) Psc= (A-19) 0;0 其中p的下腳標標明瞭兩個隨機變數。由於在協方差的表達式中變數順序的變換與其數值結果無關,式(A-19)表明相關係數的數值也與字母順序無關。 我們利用表A-5,得到了三個隨機變數的協方差矩陣: 股粟晉漲期杈看跌期杈股票香漲期權看跌期權 1.00 0.94 0.97 0.94 1.00 -0.84 -0.97 -0.84 1.00 最高的(絕對值)相關係數是股票與看跌期權之間的相關係數P,=-0.97,儘管它們之間協方差的絕對值為最小。 原因很明顯,它們兩者的標準差乘積也很小。接下來就是幾條關於相關係數的重要性質: • 就像協方差⋯樣,相關係數只是關於兩個變數相關性的指標,它並不能反映兩者之間的因果性。因果性必須要得到理論及特定實證結果的支援。 附錄A 定量計算的複習 •如式(A-19)所示,相關係數完全由隨機變數對其期望的偏差所決定,因此我們推得相關係數並不會因為其中的隨機變數加減某個常數而改變。而當隨機變數乘以一個常數後,相關係數仍保持不變。你可以透過把協方差與標準差各乘以一個常數後的效果來驗證這一性質。 • 相關係數的取值範圍為I-1.0,1.0],-1.0表示完全的負相關,1.0表示完全的正相關。這可以從計算一個隨機變數與其自身相關係數得到。其結果應為1.0, 因為隨機變數與其自身的協方差即其方差,你可以用式(A-19)來驗證1.0的結果。你甚至還可以驗證一個隨機變數與其負的自身之間的相關係數為-1.0。 從式(A-17)你可以看到隨機變數與其負的自身之間的協方差等於負的方差。然後代人式(A-19),即可得到這一結果。 因為X與Y之間的相關性和Y與X之間的相關性沒有區別,所以相關係數矩陣是對稱的。對角線上的元素全為1.0, 因為它們是各隨機變數與其自身的相關係數。因此,習慣上我們僅須寫出相關係數矩陣的下三角部分。 再考察一下式(A-19)。你可以重新整理一下,得到式(A-20)。該式把協方差表示成相關係數與標準差乘積的形式: Cov(rr.)= PscO,O. (A-20) 這個公式很有用,因為許多人習慣用相關係數來考慮問題, 而不是用協方差。 從收益樣本中估計相關係數假設一個樣本由互相獨立的觀測值構成,於是我們對所有的觀測值賦以相同的權重,並用它們的簡單平均來估計其期望。當估計方差與協方差時,我們把平方和除以總觀測數減1,所得的平均值即估計值。 假定我們現在希望對股票與長期無風險政府債券之間的相關係數進行估計,我們仍以表A-3為例。假定現有 1926~1993年這68個年超額收益的樣本觀測值。 利用式(A-19)中相關係數的定義公式,你可以對下面的統計量進行估計(腳標s表示股票,b表示債券,t表示時期): 入.-00857.原-話2R.-0162 = 0.2090 /2 = 0.0850 CO0R.R)- 2(R.一原)(R,一原門-000314 Psb=- Cov(R,&)- 0.179 16 0;0 569
附錄A 定量計算的複習現在我們想說明一個有可能產生錯誤估計的例子。回憶一下,我們利用該樣本進行引數估計的前提假定是它們的機率分佈在整個樣本期內沒有變化。為了考察這個假定是否成立,我們現在對1965~1987年這段較近時期內股票、債券的相關係數進行重新估計。 如前面的計算過程,我們計算1965~1987年的資料。 我們得到: R, -0.0312; R,=-0.00317 0,-0.15565:0。 -0.11217 Cov(R,Rp) =0.0057; Psb =0.32647 兩組資料的差別說明隨機變數的機率分佈很有可能隨著時期的改變而改變,雖然這個論斷並不十分肯定,收益率與樣本容量的變化正是我們不能確信的原因。所以我們應該把注意力放在短期樣本統計量的研究上。 A.3.3 迴歸分析我們以1986年的CFA考試1級試題中的一個題目為例來代表理解迴歸分析所需的基礎水平。但是,我們先需要了解一些背景知識, 對相關性進行了這麼多的分析,我們其實忽略了因果性的問題。在因果性的分析中,變數被分因變數與自變量。假定理論(以其最基本的結構式)告訴我們所有資產的超額收益都由同一個經濟力量所決定,而這個經濟力量又由寬廣的市場指數運動所體現(比如說標準普爾500指數的超額收益)。 假定我們的理論預言,在任何資產與市場指數的收益率之間存在著一個簡單的線性關係。一個線性關係,即可以被一條直線所描述,一般具有如下的形式: R.. =Q, +bRM.,+e.1 (A-21) 其中下標/表示任何資產,M表示市場指數(在下面的敘述中,我們將儘可能地省略下標)。在式(A-21)的等號左邊, 資產j的超額收益是因變數;等號右邊分為兩部分,即因變量中的可被解釋部分與隨機部分。 R,可被解釋部分為a+bRn。它被繪於圖A-7。數值a, 有時也被稱為截距,給出了當自變數為零時R,,的取值。在該關係中,我們假設其常數。可被解釋部分中的第二項代表 Rm這種市場驅動力,當乘以敏感係數b後就把Rw的運動傳遞給了R;。同樣,我們也假設b為常數。圖A-7中b就是迴歸直線的斜率。 R,中不可被解釋部分以擾動項e;表示。我們假定擾動項與自變數Rw無關,而且具有零期望的特徵。這樣的變數也被稱為白噪聲變數,因為它僅僅能夠加大因變數R,的波動性, 而對其期望刧沒有任何影響。 我們把資料代人式(A-21)所示的關係,然後對其系 570 數進行估計,所得的方程即為迴歸方程。僅含有一個自變數的關係稱為簡單迴歸。引數a、b稱為迴歸係數。因每一個 R,的值都由迴歸方程所解釋,R,的期望值與方差也由該回歸方程所決定。利用式(A-21)中的期望表示式,我們有: E(R) = a +bE(RM) (A-22) 常數a不會對R,的方差產生影響。因為變數rw和e,不相關, 所以兩隨機變數和bRwte的方差為兩個隨機變數各自方差的和。由於Rw乘上了引數b,所以R的方差將為: (A-23) 式(A-23)告訴我們,R,波動性中Rw部分取決於迴歸係數(即斜率)b。(bOw)’這一項被稱為可被解釋方差,擾動項的方差構成了不可被解釋方差。 R,與Rm之間的協方差也可由迴歸方程得到。利用前文的定義公式,我們有 Cov(R,Rw) = Cov(a+ bRn+e, Rw) (A-24) = Cov(bRM, Rw) = bCOv(RM, Rw)= bOM 截距a之所以沒有出現在最後的表示式中,是因在隨機變數上加一個常數後,它與其他隨機變數的協方差將保持不變。另外,由於假設隨機擾動項e與市場收益無關,所以它也沒有出現在最後的表示式中。 式(A-24)列出了迴歸引數b的另一個表示式: b= Cov(R,Rw) OM 於是,b就成為了一個比例的測度,這個比例就是j與M 的同步變動在解釋變數M這一驅動力的運動中所佔的比例。 對迴歸方程解釋能力到底如何的一種測度方法是看R的總方差中可被方程解釋的方差所佔的比例。這個比值稱為確定係數p’,有 ba M=- q Bok+al (A-25) 注意,確定係數與1.0之間的差由不可解釋方差組成。 因此,表示確定係數的另一種方法是: 運用代數學知識,我們可知確定係數即為相關係數的平方。這也就是說,因變數中由自變數引起的方差所佔的比例即為相關係數的平方(參見圖A-7)。 根據使觀測值距迴歸估計值偏差的平方和最小的原則, 我們能得到迴歸係數a、b的估計值。你的計算器,或者任何一個電子表格程式,都可以計算迴歸係數的估計值。 1986年的CFA考試I級試題如下。
附錄A 定量計算的複習殘值=擾動項的估計實際價值 (a + bRu+e) 迴歸估計 (a +bRw) b=斜率 a=截距一 Ru! 圖A-7 簡單迴歸估計與殘值,迴歸線上方差和最小的截距與斜率問題在對貨幣管理人進行業績評估時,養老金計劃的出資人一般很注重對各管理人進行排名的結果。事實上,各養老金的出資人都自然而然地認為,那些在同等的有代表性的管理人樣本中,排在前1/4的管理人在今後的業績表現中將會優於那些排在後1/4的管理人。 透過對前一期管理人業績排名順序進行本期的百分比排名迴歸,我們可以對這種評判方法的正確性做出判斷。 1)假如出資人所認為的前提假定是正確的,即在各期內的百分比排名存在完全的正相關,那麼請給出迴歸直線的截距、斜率以及迴歸的R值。 2)假如管理人的百分比排名在各期之間沒有相互關係, 那麼請寫出迴歸所得的截距、斜率以及R值。 3)假定某一次迴歸分析所得的截距為0.51,斜率為 -0.05,R值為0.01。如果某管理人當期百分比排名為0.15, 那麼根據這些迴歸資料,請給出該管理人在下期內百分比排名的最佳估計。 4)某些養老金計劃的出資人認為,在實際應用中他們應該放棄那些處於前1/4的管理人,而轉向那些處於後1/4和管理人。請說明在贊成這種實際方法的出資人的頭腦中,他們的前提假定是什麼?或者說,在關於管理人連續兩期的百分比排名的關係中,他們認為迴歸結果應該是怎麼樣的? 答案 1) 截距=0,斜率=1,R=1。 2) 截距=0.5,斜率=0,R2=0。 3)第50名,由下述計算得到: y=a+bx=0.51-0.05×0.15=0.51-0.0075=05025 因為R’值太小,可能很難對管理人排名做出精確的預測。 4)這些贊成放棄好業績管理人,支援差業績管理人的出資人認為,連續兩期內百分比排名迴歸分析中的斜率及相關係數皆顯著地為負。 A.3.4 多因素迴歸分析一些基本理論告訴我們,在許多情況下一個因變數往往要由好多個獨立的自變數來決定。對這個概念的明釋只需以兩變數的情形為例。一個房地產分析家對一個分散性房地產資產組合的收益給出了一個迴歸方程: RE, = a+b,RE.-1+NVR,+e. (A-26) 其中因變數是t期的房地產資產組合RE,,模型說明該收益的被解釋部分由兩個獨立的部分組成。第一個是前期收益 RE-I,表示房地產發展勢頭的持續性。第二部分為當期國家的空房率NVR,。與簡單迴歸的分析一樣,a是截距,即為當自變數為零時RE的取值。迴歸係數(斜率)、b代表各自變數對RE,的邊際影晌。 確定係數的定義與前文一樣。干擾項e的方差與資產組合總方差的比值即為1.0減去該方程的確定係數。這裡迴歸係數的估計原則也是使觀測值相對於預測值偏差的平方和達到最小。 A.4 假設檢驗投資學理論的一箇中心假設就是不能被分散掉的系統風險將由一個較高的預期收益率來補償。但是這個理論是否得到實證資料的支援呢?考慮表A-3中股票的超額收益。超額收益預期的估計(即樣本均值)為8.57%。看上去這已是一個比較大的風險補償,但風險本身也是如此——樣本標準差的估計為20.9%。這個正相關的關係是否只是一時的運氣而已?假設檢驗正是要解決這個問題。 假設檢驗的第一步必須要確定被檢驗的命題。它被稱為原假設,記H。。相對於原假設,我們有一個備擇假設命題記為H,假設檢驗的目標就是要透過計算判斷出錯的機率而確定是否要拒絕原假設、接受備擇假設。 當對一個變數賦予某值時,我們稱其為特定假設。股票溢價為零就是特定假設的一個例子,但通常情況下假設是一般意義上的。股票風險溢價不為零這個命題是一個完全一般的假設,而且它就是風險溢價為零這個特定假設的備擇假設。它認為風險溢價可以是除零外的任何值。如果備擇假設認為風險溢價為正,儘管它並不是完全一般的,但它們也不是特定的。雖然有時我們不得不要對兩個非特定假設進行檢驗,(比如說,原假設認為風險溢價為零或負,備擇假設認為風險溢價為正),但這種非特定假設確實使確定出錯機率的工作複雜化了。 那麼,到底什麼是可能的錯誤?我們可以把它分為兩類,記第I類錯誤和第口類錯誤。第1類錯誤就是指當原 571
附錄A 定量計算的複習假設為真時我們拒絕原假設的事件,第1類錯誤出現的機率被稱為昆著水平。第I類錯誤是指當原假設為假時我們接受原假設的事件。 假定我們為接受H,確定了一個很寬鬆的標準,於是我們幾乎可以確信我們肯定會接受原假設。要達到這樣,我們會使顯著性水平趨向於零(零是有利的)。如果我們肯定不會拒絕原慢設,那麼當原假設為真時我們也肯定不會拒絕它。 同時第I類錯誤發生的機率就會接近於1(1是不利的)。如果我們肯定會接受原假設,那麼當原假設力假時我們也會無條件地接受它。 如果我們為接受H。確定了一個很嚴格的條件,此時情況就完全相反了:因為我們現在知道我們幾乎肯定會拒絕它。 這會使第I類錯誤的發生機率變為零(有利情況):因為從不接受原假設,所以當原假設為假時我們肯定會拒絕它。但現在顯著水平卻變成了1(不利情況)。如果我們經常拒絕原假設,那麼就算當原假設為真時,我們也會拒絕它。 兩種錯誤的互相妥協決定了假設檢驗必須要有合適的顯著水平;首先,它必須先限制第I類錯誤的發生機率,然後根據已有的條件,理想的檢驗應該使第I類錯誤發生的概率減至最小。如果我們要避免第I類錯誤(即當原假設為假時接受了它),那麼當你假設確定為假時,我們就必須拒絕它。避免的機率就是1減去第I類錯誤的發生機率,我們稱其力檢驗強度。使第I類錯誤發生機率最小化意味著檢驗強度的最大化。 對“股票能獲得風險補償”這一命題做出檢驗,我們寫出假設為: Ho: E(R)=0 即預期超額收益為零 H: E(R)>0 即預期超額收益次正 H,是一個非特定備擇假設。當對原假設和其相對的、 完全一般的備擇假設進行檢驗時,我們稱其為雙尾檢驗,因為這時你可能會因為過大或過小的數值而拒絕原假設。 當兩個假設都是非特定假設時,由於計算第I類錯誤的發生機率複雜化了,因此檢驗也變難了。通常情況下,至少會有一個假設是簡單的(即特定的),於是我們就設其為原假設,這樣我們計算檢驗顯著水平時就相對簡單了。而在非特定假設為真的前提下,檢驗強瘦的計算仍然是很複雜的; 一般情況下我們無法把它解出來。 我們接下來會說明,如果我們把希望拒絕的假設E(R) =0設為原假設,那麼要接受我們所希望看到的備擇假設就相對不易。 在對E(R)=0這一假設進行檢驗時,我們設定顯著水平為5%,這就是說,當原假設為真時,我們拒絕原假設(即認為存在一個正的風險溢價)的機率5%或更小。因此, 我們必須找到一個記為z。的邊界值(或稱為雙尾檢驗的邊界值),其中a=0.05。該值將會產生兩個區域:接受域與拒絕域。可以參看圖A-8。 572 圖A-8 在原假設下樣本的平均超額收益應在零周圍分佈,如果真實的平均超額收益為2~, 我們的結論為原假設是錯誤的如果樣本均值落在臨界值的右邊(即落在拒絕域),原假設即被拒絕;否則原假設就被接受。在後一個情況下,正的樣本均值就極有可能(也就是大於5%)是由樣本誤差所致。如果樣本均值大於臨界值,我們就拒絕原假設,接受備擇假設。由誤差引起該正的樣本均值的機率會小於5%。 如果和該例一樣,備擇假設是單邊(單尾)的,那麼接受區域就是負無窮到某正值,而大於該正值的機率為5%。 圖A-8中的臨界值即為2~。當備擇假設是雙邊的,5%的面積就會平分於兩個分佈的極端,且各為2.5%。比較而言,雙邊檢驗要更嚴格一些(也就是要拒絕原假設更難)。在單邊檢驗中,我們可以根據原假設來預測樣本均值偏差的方向。 這一事實將對備擇假設更為有利。為了解決該問題,對於顯著水平為5%的單邊檢驗,我們常用顯著水平為a/2=0.025 的雙邊檢驗來代替。 假設檢驗需要對樣本均值、樣本方差等檢驗指標的概率分佈做出必要的評價。為此,我們需要對所分析隨機變數的機率分佈做出一定的假設。這樣的前提假設是原假設整體的一部分,而且常常是一個隱含的條件。 在本例中我們假設股票的超額收益服從正態分佈。檢驗指標的分佈是從指標的數學定義和隨機變數機率分佈的假設中推出的,這裡我們的檢驗指標是樣本均值。 把所有觀測值加總(T=68),然後乘以1/T=1/68,所得的平均值即樣本均值。每一個觀測值都是一個隨機變數, 它們獨立地服從同一個期望隊,標準差為o的機率分佈。 所有觀測值之和的期望就是T個期望(都等於u)之和,除以T後即為個體均值的估計。計算結果為8.57%,其等於實際期望值加上樣本誤差。在原假設成立的條件下,實際期望值零,於是整個8.57%都是樣本誤差。 為了計算樣本均值的方差,我們假定所有觀測值相互之間是獨立的,或者說是不相關的。因此和的方差即為方差的和,也就是個體方差乘以T。但是,由於我們對和一般要進行乘以1/T的處理,因此我們需要對方差和TG除以T。結果我們得到樣本均值的方差即為個體方差除以T。樣本均值的標準差,一般稱為標準誤差,為: a樣本均)-(六2o) ½ 0,2090 -=0.0253 v68 (A-27) 我們的檢驗指標具有2.53%的標準偏差,而且,似乎觀測值的數目越大,期望估計的標準誤差就越小。但是,注意是“方差”下降的比例較大,為T=68;而“標準誤差”下降的比例僅為vT-8.25,該數值顯然較小。 我們得到了樣本均值8.57%和其標準差2.53%,而且知道在原假設成立的條件下其服從正態分佈,現在就可以進行檢驗了。我們想要做的是確定8.57%是否已經足夠地大於零。我們先使檢驗指標標準化,這個過程就是我們對指標減去原假設中的期望值,然後再除以它的標準偏差。現在這個標準化的指標就可能同標準正態表中的正值進行比較了。我們想問 R-E(R) ->2a 是否成立。 還有一個問題需要解決。檢驗指標的正態性假設是完全成立的,因為它是許多正態分佈隨機變數(根據收益的假設)的加權和;因此它也是服從正態分佈的。但是,以上的分析步驟要求我們知道其方差,而這裡我們只是用樣本方差來作為實際方差的估計。 該問題的解決是比較簡單的,只需把標準正態分佈替換成學生氏:分佈即可。和正態分佈一樣,1分佈是對稱的。 它依賴子自由度,數值上等於觀測數目減1。因此,我們只要把替換成 -即可。 現在的檢驗變成 R-E(R) >1。T.! 當我們把樣本資料代入上式後,左邊就是一個標準化的檢驗指標,而右邊是從:分佈表中得到的a=0.05,T-1= 68-1=67的t值。我們想知道的是該不等式是否成立。如果成立,我們就以5%的顯著水平拒絕原假設;如果不成立, 我們就不能拒絕原假設。(在該例中,10.05.67=1.67)我們發現: 00857-0 -=3.39>1.67 0.0253 在該例中不等式成立,因此我們拒絕原假設,並認為備擇假設正確,即存在正的風險溢價。 如果以1965~1987年的資料對假設再進行一次檢驗, 附錄A 定量計算的複習你可能會產生一些疑問。該期間的樣本均值為3.12%,樣本標準差為15.57%,自由度為23-1=22,這些數字是否給了你第二種看法? 迴歸係數的t檢驗假設我們以簡單迴歸模型[式(A-21)]來描述政府長期債券資產組合與股市指數之間的關係。利用表A-3中的樣本資料,我們迴歸的估計結果(%每年): a=0.9913 b=0.0729 R=0.0321 我們對這些數字的解釋如下:對於當市場指數超額收益為零的時期,我們期望債券能獲得99.13個基本點的超額收益,這是截距的作用。對於斜率來說,只要每年股票資產組合有1%的收益。債券資產組合就應該能多獲得7.29個基本點的收益。在樣本期內,股權的平均風險溢價為8.57%。 因此債券的樣本平均為0.991 3+0.0729× 8.57=1.62%。從相關係數平方這一項可以看出,在債券收益變化中,僅有 3.21%可由股票的方差做出解釋。 但我們是否可以完全相信這些統計資料呢?一個解決方法是進行假設檢驗,這裡主要是對迴歸係數b所做的檢驗。 H:b=0 迴歸係數零,這意味著自變數的變化不能引起因變數的變化 H:6>0 因變數對自變數的變化較敏感(兩者之間協方差為正) 任何一個像樣的迴歸軟體都能對統計數字進行這種假設檢驗。通常,迴歸時需要假設因變數和干擾項都服從正態分佈,而且都可以從樣本中估計出分佈的方差。於是迴歸系數b也服從正態分佈。因為原假設仍為b=0,我們所需做的只是對該指標的標準差進行估計。 迴歸係數標準差的估計可以透過干擾項標準差估計與自變數標準差估計中得到。對於這個迴歸,b的標準差估計為s(b)=0.0493,正如和前面的做法一樣。檢驗的臨界值是 s(b)1a,T-! 把它與係數b進行比較,如果我們就可以拒絕原假設,從而認為6>0。由於s(b)是正數,於是上述不等式可以寫成: b s(b) *檢驗會給出係數估計值與其標準差估計值之間的比值。 有了這個值,再加上觀測數目T,以及學生氏:分佈表,你就可以在你所要的顯著水平上進行檢驗了。 在我們的例子中, 為0.0729/0.0493=1.4787。自由度為68,顯著水平為5%的(表顯示我們不能拒絕原假設,因 573
附錄A 定量計算的複習為此時臨界值為1.67。 下面是1987年CFA考試的一道考題。透過它,我們會對迴歸分析與假設檢驗有進一步的瞭解。 問題一位學者告訴你,普通股收益的多少將取決於該公司的市場資本化程度、公司盈利增長的歷史、股票的現期收益以及公司的職員是否工會化,而你對這個觀點持懷疑態度。 因,你認為除了B這個市場指標外,再沒有其他的因素可以解釋樣本中不同證券的不同收益。 但是,你還是決定對是否存在其他因素能解釋收益差別進行一下檢驗。你以標準普爾500指數的股票作為樣本, 然後對5年來每個月的收益和每個月初的公司資本化程度進行迴歸。檢驗的因素還包括12個月來公司的盈利增長、上一年的股利除以每月初的股價以及一個反映公司工會化的虛變景(當職員有工會組織時,變數取1;若沒有,則取O) 1) 迴歸所得R”值的平均為0.15,而且月與月之間的變化很小。討論一下這個結果的意義。 2) 如果在迴歸計算的大部分月份中你所得的因素系數都具有大於2的:檢驗值。分析一下這些因素的收益解釋能力。 3)在許多回歸方程結果中你發現虛變數的係數為 -0.14且其值次-4.74。根據此資訊,分析工會化與公司普通收益之間的關係。 答案 1)這些因素的所有變化能對標準普爾500指數中股票的收益變化做出15%的解釋。剩下的不能被解釋的變化可能會由被省略的因素引起,這些資訊本身並不足以得出任何一種有價值的結論。R值在月份之間很少變化這個事實說明了收益與各因素之間的關係是穩定的,並不具有樣本的特殊性。 2) 在大部分月份中都具有大於2的:檢驗值,我們應該認為這個因素是很顯著的。如果因素係數與0差別不大,那麼在所有因素係數的:檢驗中,大於2的情況應在5%以下。 因為現在大於2的:檢驗值很頻繁,所以我們應該認為股票收益的解釋能力中,它們是很顯著的因素。 3) 因為表示工會化的係數總保持為負,而且具有統計意義上的顯著性,所以我們推知在其他因素不變的情況下, 工會化會降低公司普通股的收益。這也就是說,在其他任何因素都相同的情況下,不形成工會組織的公司的股票收益率將比那些形成工會組織的公司要高。當然,我們應該進一步檢驗是否存在解釋這個明顯差別的其他被忽略的變數。 574
附錄B CFA試題參考資料