計量經濟學中6種模型(經濟計量學堂:二元響應模型,離散因變量模型)
2023-08-22
數據的類型決定了我們模型的選擇。對于截面數據,時間序列及面板數據,各自都有自己的建模思路。數據也可以分為離散數據和連續變量數據。對于離散數據,即為我們理解的虛擬變量,二元變量,啞變量。
這種數據在我們現實中比比皆是,比如是否考研,去那個城市工作,買房還是不買...雖然離散數據看起來不高級,但是我們做決策的時候實際上往往就是離散的形式。
如果離散虛擬變量作為解釋變量即為虛擬變量回歸,這點本科計量都作為基本知識點。
當離散虛擬變量為被解釋變量,問題就比虛擬變量回歸復雜多了。為什么呢?因為它破壞了回歸方程的經典假定。不能用ols進行直接回歸。
比如是否考研,雖然y的數值是0或1,但是實際上這個考研的決策是個類似于概率的潛變量。假定概率0. 5是個臨界值,當影響你考研決策的因素大于不考研因素的時候,即概率大于0.5時,你才選擇考研,否則不考研。
如果直接在0與1積聚的地方畫出一條直線,則誤差非常大,而且參與估計的統計推斷無法進行。
較理想的做法是在0與1之間找到光滑的鏈接函數,經過科學家嘗試,他們提出了正態分布函數和邏輯分布函數滿足這些要求,即為probit 模型和logit模型。在應用上,logit模型系數比較好估計而且有很好的經濟含義,比probit更常用。