要作統計分析,第一步通常是看descriptive statistics,但是要畫個表格那可就很麻煩了。Stata的好處就是可以讓你直接輸出這部分的表格,方法也很簡單。
如果想要跟我一起實作,可參考前兩篇:
Stata: 敘述統計(descriptive statistics)
Stata: 敘述統計(descriptive statistics)之二。
預備的code如下:
use http://twtcsl.org/dataset/gss2000.dta
tab race
tab race sex
sum race sex age income
tab race, gen(d)
rename d1 dwhite
rename d2 dblack
rename d3 dother
tab sex, gen(d)
rename d1 dmale
rename d2 dfemale
sum dwhite dblack dother dmale age income if !mi(age) & !mi(income)
執行結果像這樣:
好了,要怎麼輸出呢?一種是利用stata內建edit-copy table的方式剪貼,之後建議貼到excel檔稍微排版之後再送到word裡。另一種方法就是和輸出regression table一樣用程式的方式來控制。estpost sum dwhite dblack dother dmale age income if !mi(age) & !mi(income)
esttab using sum2.rtf, cells("mean(fmt(2)) sd(fmt(2)) min(fmt(1)) max(fmt(0))") nomtitle nonumber replace
輸出結果像下圖一樣:
如果要再進階一點,想要看age income在各種族的平均值等,就要多動一點手腳。這時候因為我們要用原本的race指令配合by來作summary,就不用後來產生的dummy variable,像是dwhite,而是用原先的變數race。不過要用by指令,要記得先sort。
sort race
by race: eststo: estpost sum age income if !mi(age) & !mi(income)
esttab using grp_sum.rtf, cells("mean(fmt(2)) sd(fmt(2))") replace
結果就像下圖所示:
漂漂亮亮的表格就出來了,之後再稍微修改一下就行了。標籤: 統計分析