什麼是統計檢定力 (power)?

Power 有人翻成統計檢定力、統計檢驗力、統計效能分析,為了我打字方便,我還是用 power。什麼是 power 呢?簡單地說,是指當有 effect 的時候,power 是偵測到這個 effect 的機率。可以換個方式說,power 是當事實上是要否定虛無假設,而拒絕虛無假設的機率 (it is the probability of rejecting the null hypothesis when it is in fact false)。再換個方式說,power 是避免錯誤接受虛無假設的機率

這部分詳細講就要牽涉到 Type I 與 Type II error 了。這部分想寫很久但還沒寫,先欠著。

那怎麼解讀 power 呢?可以舉個例子來說說嗎?當然可以,下面的例子來自進階閱讀,我簡單翻譯一下。

假設你有一個實驗,有兩組人,一組用 A 藥,一組用安慰劑 (也就是控制組)。A 藥是事實上真的有效的,在這個例子中,power 就是發現這兩組不同的機率。舉數字來說,如果 power 是 .8 ,而且這個實驗作了無數次。power 是 .8 的解讀就是:80% 的機率,我們會發現兩組之間的差異。從另外一方面來說,20% 的機率我們不會發現兩組之間的差異,雖然兩組確實存在差異的

為什麼要作 power analysis (統計檢定力分析) 呢?這雖然在某些領域不是很重視,但在美國要申請較大的 grant,其中是包含 intervention 的,如果沒有事前作 power analysis 的話,基本上是拿不到錢的。我們研究所裡有不少老師都在幫美國的一些機構 review grant proposals,而他們與我們分享申請 grant 的重點之一就是要作 power analysis。

另外一個作 power analysis 的好處就是決定樣本數。如果從先前文獻關於某個 intervention 的 effect size 是 0.4,你想要作相同的實驗,而且你想要 0.8 或 0.9 的 power,你就可以用這個 effect size 與其它相關資料來得到你所需要的樣本數。

那一般來說,power 要多大呢?這要看領域了,在我所接觸的領域,通常 0.8 就可以了,有些人會訂在 0.8 到 0.9 之間。

至於怎麼算 power,請待後文。

相關閱讀

樣本數規劃初探~林星帆顧問整理 (Sample size & power analysis)

http://tw.myblog.yahoo.com/da_sanlin/article?mid=1506&sc=1

進階閱讀

Statistical Computing Seminars Introduction to Power Analysis http://www.ats.ucla.edu/stat/seminars/intro_power/default.htm

標籤: