這篇是自己的筆記,主要是最近在學 hierarchical liner modeling (HLM) ,以及如何用 Stata xtreg 指令 (當然還有其它的) 來分析。
這部分的內容是節錄&翻譯&改寫自 Multilevel and longitudinal modeling using Stata。
use http://www.stata-press.com/data/mlmus2/smoking
xtreg birwt smoke male mage hsgrad somecoll collgrad married black ///
kessner2 kessner3 novisit pretri2 pretri3, i(momid) mle
這部分是在研究嬰兒出生體重 (birwt) 是否與母親抽煙 (smoke)、性別 (male)、年齡 (mage)、母親學歷 (hsgrad、somecoll、collgrad)、婚姻狀況 (married)、種族 (black)、Kessner index (kessner2、kessner3)、雙親造訪 (novisit、pretri2、pretri3) 有關。
這個資料主要是看同樣的母親,在不同的時期、不同的情況下,兩個嬰兒出生體重的差異。因為母親體質的關係,同樣母親,嬰兒出生體重應該有一定的相關度,所以這種情況適合用 HLM 來製作。
Level 1: 母親的特質 (fixed effect)。
Level 2: 同樣的母親 (random effect)。
從結果可以看出來,smoke 的 coefficient 是 –218,意思是根據這個 model,母親在懷孕時如果吸煙的話,嬰兒出生體重預期會比母親在懷孕期間沒吸煙的嬰兒輕 218 公克。
從 smoke 到 pretris3,這些變數都是 fixed effect。在上方指令的 i(momid),標明母親是random effect。
/sigma_u 是 random-intercept standard deviation,/sigma_e 指的是 level-1 的 residual standard deviation 是371。rho 是 intraclass correlation,算法比較複雜,是:
simgma_u平方 除以 (sigma_u平方 加 sigma_e的平方) = 3392 / (3392 + 3712)
= 114921/ (114921 + 25252)。
rho,或是 intraclass correlation (亦有人稱之為 cluster effect) 的意思是:各組之間 (在這裡是 level 2) 有多少 variance in depedent variable,如果在此例子,就是母親之間,嬰兒出生體重差異大約為 46%。
還有一些小地方,等以後寫到 HLM 的時候再補上。標籤: 統計分析