離散因變量和受限因變量模型授課課件
ID:65527 2021-11-24 1 20.00元 70頁 611.58 KB
已閱讀10 頁,剩余60頁需下載查看
下載需要20.00元
免費下載這份資料?立即下載
離散因變量和受限因變量模型 通常的經(jīng)濟計量模型都假定因變量是連續(xù)的,但是在現(xiàn)實的經(jīng)濟決策中經(jīng)常面臨許多選擇問題。人們需要在可供選擇的有限多個方案中作出選擇,與通常被解釋變量是連續(xù)變量的假設(shè)相反,此時因變量只取有限多個離散的值。例如,人們對交通工具的選擇:地鐵、公共汽車或出租車;投資決策中,是投資股票還是房地產(chǎn)。以這樣的決策結(jié)果作為被解釋變量建立的計量經(jīng)濟模型,稱為離散被解釋變量數(shù)據(jù)計量經(jīng)濟學(xué)模型(modelswithdiscretedependentvariables),或者稱為離散選擇模型(discretechoicemodel,DCM)。 在實際中,還會經(jīng)常遇到因變量受到某種限制的情況,這種情況下,取得的樣本數(shù)據(jù)來自總體的一個子集,可能不能完全反映總體。這時需要建立的經(jīng)濟計量模型稱為受限因變量模型(limiteddependentvariablemodel)。這兩類模型經(jīng)常用于調(diào)查數(shù)據(jù)的分析中。 §7.1二元選擇模型在離散選擇模型中,最簡單的情形是在兩個可供選擇的方案中選擇其一,此時被解釋變量只取兩個值,稱為二元選擇模型(binarychoicemodel)。在實際生活中,我們經(jīng)常遇到二元選擇問題。例如,在買車與不買車的選擇中,買車記為1,不買記為0。是否買車與兩類因素有關(guān)系:一類是車本身所具有的屬性,如價格、型號等;另一類是決策者所具有的屬性如收入水平、對車的偏好程度等。如果我們要研究是否買車與收入之間的關(guān)系,即研究具有某一收入水平的個體買車的可能性。因此,二元選擇模型的目的是研究具有給定特征的個體作某種而不作另一種選擇的概率。 為了深刻地理解二元選擇模型,首先從最簡單的線性概率模型開始討論。線性概率模型的回歸形式為:(7.1.1)其中:N是樣本容量;k是解釋變量個數(shù);xj為第j個個體特征的取值。例如,x1表示收入;x2表示汽車的價格;x3表示消費者的偏好等。設(shè)yi表示取值為0和1的離散型隨機變量:式(7.1.1)中ui為相互獨立且均值為0的隨機擾動項。7.1.1線性概率模型及二元選擇模型的形式 令pi=P(yi=1),那么1-pi=P(yi=0),于是(7.1.2)又因為E(ui)=0,所以E(yi)=xi?,xi=(x1i,x2i,…,xki),?=(?1,?2,…,?k)?,從而有下面的等式:(7.1.3) 式(7.1.3)只有當xi?的取值在(0,1)之間時才成立,否則就會產(chǎn)生矛盾,而在實際應(yīng)用時很可能超出這個范圍。因此,線性概率模型常常寫成下面的形式:(7.1.4)此時就可以把因變量看成是一個概率。那么擾動項的方差為:(7.1.5)或(7.1.6) 由此可以看出,誤差項具有異方差性。異方差性使得參數(shù)估計不再是有效的,修正異方差的一個方法就是使用加權(quán)最小二乘估計。但是加權(quán)最小二乘法無法保證預(yù)測值?在(0,1)之內(nèi),這是線性概率模型一個嚴重的弱點。由于上述問題,我們考慮對線性概率模型進行一些變換,由此得到下面要討論的模型。假設(shè)有一個未被觀察到的潛在變量yi*,它與xi之間具有線性關(guān)系,即(7.1.7)其中:ui*是擾動項。yi和yi*的關(guān)系如下:(7.1.8) yi*大于臨界值0時,yi=1;小于等于0時,yi=0。這里把臨界值選為0,但事實上只要xi包含有常數(shù)項,臨界值的選擇就是無關(guān)的,所以不妨設(shè)為0。這樣(7.1.9)其中:F是ui*的分布函數(shù),要求它是一個連續(xù)函數(shù),并且是單調(diào)遞增的。因此,原始的回歸模型可以看成如下的一個回歸模型:(7.1.10)即yi關(guān)于它的條件均值的一個回歸。 分布函數(shù)的類型決定了二元選擇模型的類型,根據(jù)分布函數(shù)F的不同,二元選擇模型可以有不同的類型,常用的二元選擇模型如表7.1所示:表7.1常用的二元選擇模型ui*對應(yīng)的分布分布函數(shù)F相應(yīng)的二元選擇模型標準正態(tài)分布Probit模型邏輯分布Logit模型極值分布Extreme模型 二元選擇模型一般采用極大似然估計。似然函數(shù)為(7.1.11)即(7.1.12)對數(shù)似然函數(shù)為(7.1.13)7.1.2二元選擇模型的估計問題 對數(shù)似然函數(shù)的一階條件為(7.1.14)其中:fi表示概率密度函數(shù)。那么如果已知分布函數(shù)和密度函數(shù)的表達式及樣本值,求解該方程組,就可以得到參數(shù)的極大似然估計量。例如,將上述3種分布函數(shù)和密度函數(shù)代入式(7.1.14)就可以得到3種模型的參數(shù)極大似然估計。但是式(7.1.14)通常是非線性的,需用迭代法進行求解。二元選擇模型中估計的系數(shù)不能被解釋成對因變量的邊際影響,只能從符號上判斷。如果為正,表明解釋變量越大,因變量取1的概率越大;反之,如果系數(shù)為負,表明相應(yīng)的概率將越小。 例7.1二元選擇模型實例考慮Greene給出的斯佩克特和馬澤歐(1980)的例子,在例子中分析了某種教學(xué)方法對成績的有效性。因變量(GRADE)代表在接受新教學(xué)方法后成績是否改善,如果改善為1,未改善為0。解釋變量(PSI)代表是否接受新教學(xué)方法,如果接受為1,不接受為0。還有對新教學(xué)方法量度的其他解釋變量:平均分數(shù)(GPA)和測驗得分(TUCE),來分析新的教學(xué)方法的效果。 (1)模型的估計估計二元選擇模型,從EquationSpecification對話框中,選擇Binary估計方法。在二元模型的設(shè)定中分為兩部分。首先,在EquationSpecification區(qū)域中,鍵入二元因變量的名字,隨后鍵入一列回歸項。由于二元變量估計只支持列表形式的設(shè)定,所以不能輸入公式。然后,在Binaryestimationmethod中選擇Probit,Logit,Extremevalue選擇三種估計方法的一種。以例7.1為例,對話框如圖7.2所示。 圖7.2二元選擇模型估計對話框 例7.1的估計輸出結(jié)果如下: 參數(shù)估計結(jié)果的上半部分包含與一般的回歸結(jié)果類似的基本信息,標題包含關(guān)于估計方法(ML表示極大似然估計)和估計中所使用的樣本的基本信息,也包括達到收斂要求的迭代次數(shù)。和計算系數(shù)協(xié)方差矩陣所使用方法的信息。在其下面顯示的是系數(shù)的估計、漸近的標準誤差、z-統(tǒng)計量和相應(yīng)的概率值及各種有關(guān)統(tǒng)計量。 在回歸結(jié)果中還提供幾種似然函數(shù):①loglikelihood是對數(shù)似然函數(shù)的最大值L(b),b是未知參數(shù)?的估計值。②Avg.loglikelihood是用觀察值的個數(shù)N去除以對數(shù)似然函數(shù)L(b),即對數(shù)似然函數(shù)的平均值。③Restr.Loglikelihood是除了常數(shù)以外所有系數(shù)被限制為0時的極大似然函數(shù)L(b)。④LR統(tǒng)計量檢驗除了常數(shù)以外所有系數(shù)都是0的假設(shè),這類似于線性回歸模型中的統(tǒng)計量,測試模型整體的顯著性。圓括號中的數(shù)字表示自由度,它是該測試下約束變量的個數(shù)。 ⑤Probability(LRstat)是LR檢驗統(tǒng)計量的P值。在零假設(shè)下,LR檢驗統(tǒng)計量近似服從于自由度等于檢驗下約束變量的個數(shù)的?2分布。⑥McFaddenR-squared是計算似然比率指標,正像它的名字所表示的,它同線性回歸模型中的R2是類似的。它具有總是介于0和1之間的性質(zhì)。 利用式(7.1.10),分布函數(shù)采用標準正態(tài)分布,即Probit模型,例7.1計算結(jié)果為(7.1.15)z=(-2.93)(2.34)(0.62)(2.39)利用式(7.1.15)的Probit模型的系數(shù),本例按如下公式給出新教學(xué)法對學(xué)習(xí)成績影響的概率,當PSI=0時:(7.1.19)當PSI=1時:(7.1.20)式中測驗得分TUCE取均值(21.938),平均分數(shù)GPA是按從小到大重新排序后的序列。 圖7.1新教學(xué)法對學(xué)習(xí)成績影響的概率 (2)估計選項因為我們是用迭代法求極大似然函數(shù)的最大值,所以O(shè)ption選項可以從估計選項中設(shè)定估計算法與迭代限制。單擊Options按鈕,打開對話框如圖7.3所示。圖7.3Options對話框 Option對話框有以下幾項設(shè)置:①穩(wěn)健標準差(RobustStandardErrors)對二元因變量模型而言,EViews允許使用準-極大似然函數(shù)(Huber/White)或廣義的線性模型(GLM)方法估計標準誤差。察看RobustCovariance對話框,并從兩種方法中選擇一種。②初始值EViews的默認值是使用經(jīng)驗運算法則而選擇出來的,適用于二元選擇模型的每一種類型。③估計法則在Optimizationalgorithm一欄中選擇估計的運算法則。默認地,EViews使用quadratichill-climbing方法得到參數(shù)估計。這種運算法則使用對數(shù)似然分析二次導(dǎo)數(shù)的矩陣來形成迭代和計算估計的系數(shù)協(xié)方差矩陣。還有另外兩種不同的估計法則,Newton-Raphson也使用二次導(dǎo)數(shù),BHHH使用一次導(dǎo)數(shù),既確定迭代更新,又確定協(xié)方差矩陣估計。 (3)預(yù)測從方程工具欄選擇Procs/Forecast(FittedProbability/Index),然后單擊想要預(yù)測的對象。既可以計算擬合概率,,也可以計算指標的擬合值。像其他方法一樣,可以選擇預(yù)測樣本,顯示預(yù)測圖。如果解釋變量向量xt包括二元因變量yt的滯后值,選擇Dynamic選項預(yù)測,EViews使用擬合值得到預(yù)測值;而選擇Static選項,將使用實際的(滯后的)yt-1得到預(yù)測值。對于這種估計方法,無論預(yù)測評價還是預(yù)測標準誤差通常都無法自動計算。后者能夠通過使用View/CovarianceMatrix顯示的系數(shù)方差矩陣,或者使用@covariance函數(shù)來計算。 可以在各種方式上使用擬合指標,舉個例子,計算解釋變量的邊際影響。計算預(yù)測擬合的指標,并用序列xb中保存這個結(jié)果。然后生成序列@dnorm(-xb)、@dlogistic(-xb)、@dextreme(-xb),可以與估計的系數(shù)?j相乘,提供一個yi的期望值對xi的第j個分量的導(dǎo)數(shù)的估計。(7.5.1) (4)產(chǎn)生殘差序列通過Procs/MakeReidualSeries選項產(chǎn)生下面三種殘差類型中的一種類型。表7.6殘差類型普通殘差(Ordinary)標準化殘差(Standardized)廣義殘差(Generalized) §7.2排序選擇模型當因變量不止是兩種選擇時,就要用到多元選擇模型(multiplechoicemodel)。多元離散選擇問題普遍存在于經(jīng)濟生活中。例如:(1)一個人面臨多種職業(yè)選擇,將可供選擇的職業(yè)排隊,用0,1,2,3表示。影響選擇的因素有不同職業(yè)的收入、發(fā)展前景和個人偏好等;(2)同一種商品,不同的消費者對其偏好不同。例如,十分喜歡、一般喜歡、無所謂、一般厭惡和十分厭惡,分別用0,1,2,3,4表示。而影響消費者偏好的因素有商品的價格、性能、收入及對商品的需求程度等;(3)一個人選擇上班時所采用的方式——自己開車,乘出租車,乘公共汽車,還是騎自行車。 上述3個例子代表了多元選擇問題的不同類型。前兩個例子屬于排序選擇問題,所謂“排序”是指在各個選擇項之間有一定的順序或級別種類。而第3個例子只是同一個決策者面臨多種選擇,多種選擇之間沒有排序,不屬于排序選擇問題。與一般的多元選擇模型不同,排序選擇問題需要建立排序選擇模型(orderedchoicemodel)。下面我們主要介紹排序選擇模型。 與二元選擇模型類似,設(shè)有一個潛在變量yi*,是不可觀測的,可觀測的是yi,設(shè)yi有0,1,2,…,M等M+1個取值。(7.2.1)其中:ui*是獨立同分布的隨機變量,yi可以通過yi*按下式得到(7.2.2) 設(shè)ui*的分布函數(shù)為F(x),可以得到如下的概率(7.2.3)和二元選擇模型一樣,根據(jù)分布函數(shù)F(x)的不同可以有3種常見的模型:Probit模型、Logit模型和Extremevalue模型。仍然采用極大似然方法估計參數(shù),需要指出的是,M個臨界值c1,c2,…,cM事先也是不確定的,所以也作為參數(shù)和回歸系數(shù)一起估計。 例7.2排序模型的實例在調(diào)查執(zhí)政者的支持率的民意測驗中,由于執(zhí)政者執(zhí)行了對某一收入階層有利的政策而使得不同收入的人對其支持不同,所以收入成為決定人們是否支持的因素。通過調(diào)查取得了市民收入(INC)與支持與否(Y)的數(shù)據(jù),其中如果選民支持則Yi取0,中立取1,不支持取2。我們選取24個樣本進行排序選擇模型分析。 1.模型的估計與二元選擇模型類似,從主菜單中選擇Objects/NewObject,并從該菜單中選擇Equation選項。從EquationSpecification對話框,選擇估計方法ORDERED,標準估計對話框?qū)淖円云ヅ溥@種設(shè)定。在EquationSpecification區(qū)域,鍵入排序因變量的名字,其后列出回歸項。排序估計也只支持列表形式的設(shè)定,不用輸入一個明確的方程。然后選擇Normal,Logist,ExtremeValue三種誤差分布中的一種,單擊OK按鈕即可。對話框如圖7.4所示。 圖7.4排序模型的輸入對話框 例7.2估計結(jié)果如下: 有兩點需要指出:首先,EViews不能把常數(shù)項和臨界值區(qū)分開,因此在變量列表中設(shè)定的常數(shù)項會被忽略,即有無常數(shù)項都是等價的。其次,EViews要求因變量是整數(shù),否則將會出現(xiàn)錯誤信息,并且估計將會停止。然而,由于我們能夠在表達式中使用@round、@floor或@ceil函數(shù)自動將一個非整數(shù)序列轉(zhuǎn)化成整數(shù)序列,因此這并不是一個很嚴格的限制。估計收斂后,EViews將會在方程窗口顯示估計結(jié)果。表頭包含通常的標題信息,包括假定的誤差分布、估計樣本、迭代和收斂信息、y的排序選擇值的個數(shù)和計算系數(shù)協(xié)方差矩陣的方法。在標題信息之下是系數(shù)估計和漸近的標準誤差、相應(yīng)的z-統(tǒng)計量及概率值。然后,還給出了臨界值LIMIT_1:C(2),LIMIT_2:C(3)的估計及相應(yīng)的統(tǒng)計量。 2.常用的兩個過程①MakeOrderedLimitVector產(chǎn)生一個臨界值向量c,此向量被命名為LIMITS01,如果該名稱已被使用,則命名為LIMITS02,以此類推。②MakeOrderedLimitCovarianceMatrix產(chǎn)生臨界值向量c的估計值的協(xié)方差矩陣。命名為VLIMITS01,如果該名稱已被使用,則命名為VLIMITS02,以此類推。 3.預(yù)測因為排序選擇模型的因變量代表種類或等級數(shù)據(jù),所以不能從估計排序模型中直接預(yù)測。選擇Procs/MakeModel,打開一個包含方程系統(tǒng)的沒有標題的模型窗口,單擊模型窗口方程欄的Solve按鈕。例7.2因變量y的擬合線性指標序列被命名為i_Y_0,擬和值落在第一類中的擬合概率被命名為Y_0_0的序列,落在第二類中的擬合概率命名為Y_1_0的序列中,落在第三類中的擬合概率命名為Y_2_0的序列中,等等。注意對每一個觀察值,落在每個種類中的擬合概率相加值為1。表7.7中Y_0_0,Y_1_0,Y_2_0分別是支持、中立、不支持的概率,Y,INC是實際樣本。 4.產(chǎn)生殘差序列選擇Proc/MakeResidualSeries產(chǎn)生廣義殘差序列,輸入一個名字或用默認的名字,然后單擊OK按鈕。一個排序模型的廣義殘差由下式給出:(7.5.2)其中:c0=-?,cM+1=?。 §7.3受限因變量模型現(xiàn)實的經(jīng)濟生活中,有時會遇到這樣的問題,因變量是連續(xù)的,但是受到某種限制,也就是說所得到的因變量的觀測值來源于總體的一個受限制的子集,并不能完全反映總體的實際特征,那么通過這樣的樣本觀測值來推斷總體的特征就需要建立受限因變量模型(limiteddependentvariablemodels)。本節(jié)研究兩類受限因變量模型,即審查回歸模型(censoredregressionmodels)和截斷回歸模型(truncatedregressionmodels)。 7.3.1審查回歸模型1.模型的形式考慮下面的潛在因變量回歸模型(7.3.1)其中:?是比例系數(shù);y*是潛在變量。被觀察的數(shù)據(jù)y與潛在變量y*的關(guān)系如下:(7.3.2) 換句話說,yi*的所有負值被定義為0值。我們稱這些數(shù)據(jù)在0處進行了左截?。▽彶椋╨eftcensored)。而不是把觀測不到的yi*的所有負值簡單地從樣本中除掉。此模型稱為規(guī)范的審查回歸模型,也稱為Tobit模型。更一般地,可以在任意有限點的左邊和右邊截?。▽彶椋?7.3.3)其中:,代表截?。▽彶椋c,是常數(shù)值。如果沒有左截取(審查)點,可以設(shè)為。如果沒有右截取(審查)點,可以設(shè)為。規(guī)范的Tobit模型是具有和的一個特例。 2.審查回歸模型的極大似然估計與前邊介紹的幾個模型類似,可以采用極大似然法估計審查回歸模型的參數(shù),對數(shù)似然函數(shù)為(7.3.4)求式(7.3.4)的最大值即可得參數(shù)?,?的估計。這里f,F分別是u的密度函數(shù)和分布函數(shù)。 特別地,對于Tobit模型,設(shè)u~N(0,1),這時對數(shù)似然函數(shù)為(7.3.5)式(7.3.5)是由兩部分組成的。第一部分對應(yīng)沒有限制的觀測值,與經(jīng)典回歸的表達式是相同的;第二部分對應(yīng)于受限制的觀測值。因此,此似然函數(shù)是離散分布與連續(xù)分布的混合。將似然函數(shù)最大化就可以得到參數(shù)的極大似然估計。 例7.3審查模型的實例本例研究已婚婦女工作時間問題,共有50個調(diào)查數(shù)據(jù),來自于美國國勢調(diào)查局[U.S.BureauoftheCensus(CurrentPopulationSurvey,1993)],其中y表示已婚婦女工作時間,x1~x4分別表示已婚婦女的未成年子女個數(shù)、年齡、受教育的年限和丈夫的收入。只要已婚婦女沒有提供工作時間,就將工作時間作零對待,符合審查回歸模型的特點。 7.3.2截斷回歸模型截斷問題,形象地說就是掐頭或者去尾。即在很多實際問題中,不能從全部個體中抽取因變量的樣本觀測值,而只能從大于或小于某個數(shù)的范圍內(nèi)抽取樣本的觀測值,此時需要建立截斷因變量模型。例如,在研究與收入有關(guān)的問題時,收入作為被解釋變量。從理論上講,收入應(yīng)該是從零到正無窮,但實際中由于各種客觀條件的限制,只能獲得處在某個范圍內(nèi)的樣本觀測值。這就是一個截斷問題。截斷回歸模型的形式如下:(7.3.7)其中:yi只有在時才能取得樣本觀測值,,為兩個常數(shù)。對于截斷回歸模型,仍然可以采用極大似然法估計模型的參數(shù),只不過此時極大似然估計的密度函數(shù)是條件密度。 7.5.3估計審查回歸模型1.模型的估計為估計審查模型,打開Equation對話框,從EquationSpecification對話框所列估計方法中選擇CENSORED估計方法。在EquationSpecification區(qū)域,輸入被審查的因變量的名字及一系列回歸項。審查回歸模型的估計只支持列表形式的設(shè)定(圖7.5)。 圖7.5審查模型的估計對話框 在三種分布中選擇一種作為誤差項的分布,EViews提供三種可供選擇的分布(表7.8)。表7.8誤差項的分布StandardnormalLogisticExtremevalue(歐拉常數(shù))還需要在DependentVariableCensoringPoints一欄提供關(guān)于被檢查因變量的臨界點的信息。臨界點可以是數(shù)值、表達式、序列,還可以是空的。有兩種情況需要考慮:①臨界點對于所有個體都是已知的;②臨界點只對具有審查觀察值的個體是已知的。 (1)臨界點對所有個體都已知按照要求在編輯欄的左編輯區(qū)(Left)和右編輯區(qū)(Right)輸入臨界點表達式。注意如果在編輯區(qū)域留下空白,EViews將假定該種類型的觀測值沒有被審查。例如,在規(guī)范的Tobit模型中,數(shù)據(jù)在0值左邊審查,在0值右邊不被審查。這種情況可以被指定為:左編輯區(qū):0右編輯區(qū):[blank]而一般的左邊和右邊審查由下式給出:左編輯區(qū):右編輯區(qū):EViews也允許更一般的設(shè)定,這時審查點已知,但在觀察值之間有所不同。簡單地在適當?shù)木庉媴^(qū)域輸入包含審查點的序列名字。 (2)臨界點通過潛在變量產(chǎn)生并且只對被審查的觀測值個體已知在一些情況下,假設(shè)臨界點對于一些個體(和不是對所有的觀察值都是可觀察到的)是未知的,此時可以通過設(shè)置0-1虛擬變量(審查指示變量)來審查數(shù)據(jù)。EViews提供了另外一種數(shù)據(jù)審查的方法來適應(yīng)這種形式。簡單地,在估計對話框中選擇Fieldiszero/oneindicatorofcensoring選項,然后在合適的編輯區(qū)域輸入審查指示變量的序列名。對應(yīng)于審查指示變量值為1的觀察值要進行審查處理,而值為0的觀察值不進行審查。 例如,假定我們有個人失業(yè)時間的觀察值,但其中的一些觀察值反映的是在取得樣本時仍然繼續(xù)失業(yè)的情況,這些觀察值可以看作在報告值的右邊審查。如果變量rcens是一個代表審查的指示變量,可以選擇Fieldiszero/oneindicatorofcensoring設(shè)置,并在編輯區(qū)域輸入:左編輯區(qū):[blank]右編輯區(qū):rcens如果數(shù)據(jù)在左邊和右邊都需要審查的話,對于每種形式的審查使用單獨的審查指示變量:左編輯區(qū):lcens右編輯區(qū):rcens這里,lcens也是審查指示變量。完成模型的指定后,單擊OK。EViews將會使用合適的迭代步驟估計模型的參數(shù)。 例7.3的估計結(jié)果如下: 2.模型的預(yù)測與產(chǎn)生殘差EViews提供了預(yù)測因變量期望E(y|x,?,?)的選項,或預(yù)測潛在變量期望E(y*|x,?,?)的選項。從工具欄選擇Forecast打開預(yù)測對話框。為了預(yù)測因變量的期望,應(yīng)該選擇Expecteddependentvariable,并輸入一個序列名稱用于保存輸出結(jié)果。為了預(yù)測潛在變量的期望,單擊Index-Expectedlatentvariable,并輸入一個序列的名稱用于保存輸出結(jié)果。潛在變量的期望E(y*|x,?,?)可以從如下關(guān)系中得到:(7.5.3)通過選擇Procs/MakeResidualSeries,并從殘差的3種類型中進行一種,可以產(chǎn)生審查模型的殘差序列。審查模型的殘差也有3種類型,與前述類似。 3.估計截斷回歸模型估計一個截斷回歸模型和估計一個審查模型遵循同樣的步驟,從主菜單中選擇Quick/EstimateEquation,并在EquationSpecification對話框中,選擇CENSORED估計方法。出現(xiàn)估計審查和截斷回歸模型對話框。在EquationSpecification區(qū)域鍵入截斷因變量的名稱和回歸項的列表,并從三種分布中選擇一種作為誤差項的分布。選擇Truncatedsample選項估計截斷模型。有幾點需要補充說明:首先,截斷估計只對截斷點已知的模型進行估計。如果用指標指定截斷點,EViews將會給出錯誤信息,指出這種選擇是無效的。其次,如果有一些因變量的值在截斷點之外,EViews將會發(fā)出錯誤信息。而且,EViews將會自動排除掉嚴格等于截斷點的所有觀察值。例如,如果指定零作為左截斷點,如果有觀察值低于零,EViews將會發(fā)出錯誤信息,并將排除嚴格等于零的任何觀察值。 在實際應(yīng)用中,我們應(yīng)該根據(jù)要研究的變量的數(shù)據(jù)類型選擇合適的模型。當因變量y表示事件發(fā)生的數(shù)目,是離散的整數(shù),即為計數(shù)變量,并且數(shù)值較小,取零的個數(shù)多,而解釋變量多為定性變量時,應(yīng)該考慮應(yīng)用計數(shù)模型(countmodels)。例如,一個公司提出申請的專利的數(shù)目,以及在一個固定的時間間隔內(nèi)的失業(yè)人員的數(shù)目。在計數(shù)模型中應(yīng)用較廣泛的為泊松模型?!?.4計數(shù)模型 7.4.1泊松模型的形式與參數(shù)估計設(shè)每個觀測值yi都來自一個服從參數(shù)為m(xi,?)的泊松分布的總體,(7.4.1)對于泊松模型(poissonmodel),給定xi時yi的條件密度是泊松分布:(7.4.2)由泊松分布的特點,(7.4.3)參數(shù)?的極大似然估計量(MLE)通過最大化如下的對數(shù)似然函數(shù)來得到:(7.4.4) 倘若條件均值函數(shù)被正確的指定且的條件分布為泊松分布,則極大似然估計量是一致的、有效的、且服從漸近正態(tài)分布。泊松假定的約束條件在經(jīng)驗應(yīng)用中經(jīng)常不成立。最重要的約束條件是式(7.4.3)中的條件均值和條件方差相等。如果這一條件被拒絕,模型就被錯誤設(shè)定。這里要注意泊松估計量也可以被解釋成準極大似然估計量。這種結(jié)果的含義在下面討論。 7.4.2負二項式模型的形式與參數(shù)估計對泊松模型的常用替代是使用一個負二項式(negativebinomial)分布的似然函數(shù)極大化來估計模型的參數(shù)。負二項式分布的對數(shù)似然函數(shù)如下:(7.4.5)其中:?2是和參數(shù)?一起估計的參數(shù)。當數(shù)據(jù)過度分散時,經(jīng)常使用負二項式分布,這樣條件方差大于條件均值,由于下面的矩條件成立:(7.4.6)(7.4.7)因此,?2測量了條件方差超過條件均值的程度。 7.4.3準-極大似然估計如果因變量的分布不能被假定為泊松分布,那么就要在其他分布假定之下執(zhí)行準-極大似然估計(quasi-maximumlikelihood,QML)。即使分布被錯誤假定,這些準-極大似然估計量也能產(chǎn)生一個條件均值被正確設(shè)定的參數(shù)的一致估計,即對于這些QML模型,對一致性的要求是條件均值被正確設(shè)定。關(guān)于QML估計的進一步的細節(jié)參見Gourieroux,Monfort,和Trognon(1984a,1984b)。Wooldridge(1990)介紹了在估計計數(shù)模型參數(shù)時QML方法的使用。也可參見關(guān)于廣義線性模型(McCullagh和Nelder,1989)的擴展的相關(guān)文獻。 1.泊松準-極大似然估計如果條件均值被正確設(shè)定,泊松極大似然估計也是服從其他分布類型的數(shù)據(jù)的準-極大似然估計。它將產(chǎn)生參數(shù)?的一致估計量。 2.指數(shù)準-極大似然估計指數(shù)分布的對數(shù)似然函數(shù)如下:(7.4.8)和其他QML估計量一樣,倘若m(xi,?)被正確指定,即使y的條件分布不是指數(shù)分布,指數(shù)分布的準-極大似然估計仍是一致的。 3.正態(tài)準-極大似然估計正態(tài)分布的似然函數(shù)如下:(7.4.9)對于固定的?2和正確設(shè)定的m(xi,?),即使分布不是正態(tài)的,正態(tài)分布的對數(shù)極大似然函數(shù)仍提供了一致的估計。 4.負二項式準-極大似然估計最大化式(7.3.12)所表示的負二項式分布的對數(shù)似然函數(shù),對于固定的?2,可以得到參數(shù)?的準-極大似然估計。倘若m(xi,?)被正確指定,即使y的條件分布不服從負二項式分布,這個準-極大似然估計量仍是一致的。 例7.4計數(shù)模型的實例本例研究輪船發(fā)生事故的次數(shù)與輪船的特征屬性、運行時間之間的關(guān)系。因變量y表示平均每月輪船發(fā)生事故數(shù)。解釋變量是輪船特征屬性,包括輪船類型、建造時間、使用時期等。輪船類型有5種,分別用x1~x5表示,4個建造時間,分別用y1~y4表示,z1,z2表示兩個使用時期,da表示運行時間。本例數(shù)據(jù)符合計數(shù)模型的條件,故采用泊松模型建模。注意到定性數(shù)據(jù)較多,為防止多重共線性,在引進虛擬變量時,需要人為地去掉一個。例如,輪船類型有5種x1~x5,則去掉x1,而在模型中只用其余4個變量x2~x5,同樣4個建造時間y1~y4,在模型中只用其余3個變量y2~y4,兩個使用時期在模型中只用z2。模型如下:(7.4.10) 7.5.4估計計數(shù)模型1.模型的估計估計一個計數(shù)模型,打開Equation對話框,然后在估計方法中選擇COUNT作為估計方法。EViews顯示計數(shù)模型估計對話框(圖7.6)。圖7.6計數(shù)模型的估計對話框 在上面的編輯區(qū)域,列出被解釋變量和解釋變量。必須通過列表形式指定計數(shù)模型。模型的形式如方程(7.5.4)所示:(7.5.4)在Options標簽中,可以根據(jù)需要改變?nèi)笔」烙嫷倪\算法則、收斂準則、初始值和計算系數(shù)協(xié)方差的方法。 EViews提供的5種計數(shù)模型的估計方法:Poisson[MLandQML];Negativebinomial[ML];Exponential[QML];Normal/NLS[QML];Negativebinomial[QML]。從上面的5種計數(shù)模型中選擇一種,并且對于Negativebinomial[QML]模型需要指定一個值作為固定的方差參數(shù)。前4種方法對應(yīng)4種因變量的分布,分別為泊松分布、負二項分布、指數(shù)分布和正態(tài)分布。 例7.4的估計結(jié)果如下: 寫成方程如下:z=(-6.41)(-1.29)(-2.26)(-0.46)(1.13)(4.31)(4.28)(1.5)(3.13)(8.87)輪船類型對事故發(fā)生有影響,如類型是x5的系數(shù)是正的,會使事故發(fā)生的可能增加;建造時間y2~y4的系數(shù)基本是遞減的,表明建造時間越長,則發(fā)生事故的可能越大;使用時期z2也對事故發(fā)生產(chǎn)生很大影響,使用時間越長,則發(fā)生事故的可能越大;運行時間ln(da)的系數(shù)是0.9,表明運行時間每增加1%,則發(fā)生事故數(shù)量會增加0.9%,因此對發(fā)生事故有顯著的影響。 2.模型的預(yù)測與產(chǎn)生殘差選擇Forecast可以預(yù)測因變量?和線性指標(xb),b是參數(shù)?的估計值,二者的關(guān)系為?=exp(xb)。選擇ProcMakeResidualSeries,可以產(chǎn)生計數(shù)模型的3種類型殘差,殘差類型參照表7.6。
同類資料
更多
離散因變量和受限因變量模型授課課件