要作統計分析通常會需要安裝統計軟體,SAS, SPSS, and Stata就是其中三套知名的商業軟體。雖然大部分我認識的人,用這三套軟體的原因都不是出於「自願」,而是看自己的老闆用什麼,但我還是決定寫下我的心得,讓有需要的人自行選擇。簡單地說,SAS是要寫指令的,沒什麼下拉選單可以幫你作統計,SPSS主要是下拉選單,要手寫程式還不大容易(SPSS 17已支援)。Stata是介於中間,你可用指令模式,忘了指令也可以下拉式選單來完成。
SAS是我覺得學習門檻最高的。雖然SAS和Stata都需要寫程式,但SAS的程式比Stata難寫得多。我是因為以前偶而也寫點程式,所以學SAS不難。舉幾個例子好了,SAS需要開頭和結尾都作宣告,像proc,每行結尾都要用;,最後還要加個run。指令就像下面這樣。
此外,SAS畫出來的圖是真的很醜!我拿我以前的作業,讓大家看一下。連我們老師那種死忠的SAS擁護者,都說他們會用別的軟體畫圖,讓人一整個無言啊.... SAS畫圖的門檻很高,有興趣的可到LCChien的部落格或是直接去他的繪圖技巧看看。
話說回來,SAS也不是一無是處。第一,美國很多國家大型資料庫用的都是SAS,你要用Stata或SPSS還得轉換才行。第二,沒寫過程式也不用那麼恐懼。寫程式總是有寫程式的好處,因為你知道你每一步做什麼,做錯了你只要改幾個字就好。用下拉式選單的話,如果你只給他看結果,別人可能不知道你怎麼做的。要接手工作就不是那麼容易了。如果你資料要修改的話,那寫程式是一定要的,因為你不會想要動到原本的資料(萬一誤刪了怎麼辦?)。要create dummy variables,寫程式還是比較保險的。
SPSS因為都是下拉式選單,我覺得學習上應該是一點門檻也沒有or很低(前提是你要懂統計 XD)。畫面就像下面一樣。SPSS的缺點其實就是SAS的優點,如果你要做dummy variables,或是你作問卷調查,要將幾個選項的分數加總,這在SPSS就比較複雜了。另外小小抱怨一下:SPSS的開啟速度是我不大能忍受的,有時候要個30秒耶....人生是有幾個30秒可浪費在等SPSS開啟呢?
更新:SPSS 17已經支援Python、R、VB.Net的plugin,據說就可用結合這些語言來作統計了。實際情形等我實測之後再跟大家分享。
Stata前面說過,是介於SAS與SPSS之間的。你可以下指令,也可以用下拉式選單操作。如果你要用command,建議你新增的一個do file,到時候把裡面要執行的指令選起來,選do就好了。此外,Stata最好的地方我覺得應該是它的help file和可擴充性。你只要在command 打help再加你要的指令,就會出現清楚的說明。可擴充性是有些常要作的routine,有人已經寫好了一些工具,你只要打findit 工具名,就可以安裝到你的stata了。
到哪去找這些好用的工具呢?你可以去這瞧瞧:http://www.ats.ucla.edu/stat/stata/ado/analysis/
標籤: 統計分析