因素負荷量 (factor loadings) 與特徵值 (eigenvalues)

作因素分析常會碰到因素負荷量 (factor loadings) 與特徵值 (eigenvalues) 這兩個詞,不過在學習因素分析常碰到的問題是:數學太多了。對於不懂矩陣、數學的人來說,這就像天書一樣。我給自己設定目標就是:不講太多數學而能把這兩個名詞是什麼解釋清楚,並說明有什麼用。

特徵值 (eigenvalues)

我看到也有人稱為 characteristic roots。在作因素分析時,每一個因素都會得到一個 eigenvalues,而這個值表示在所有的變數裡面,這個因素可以解釋多少的 variance。所以如果你有十個變數,所有因素的eigenvalues加總應該要等於十

換言之,如果特徵值太小,表示此 factor 只能解釋非常少部分的變數特這對減少變數量並沒有什麼幫助。怎樣算是少呢?其實並沒有定論,但 rule of thumb 是不得小於 1 (Harman, 1976)。為什麼呢?其實道理跟特徵值的定義有關。如果特徵值小於 1,表示此因素解釋少於1個變數,當然也就不適合放在納入考量了。

有時候除了看 eighnvalue 以外,還可以看一下每個因素解釋多少 % of variance,這有助於你了解這些因素整體所能解釋的比例

因素負荷量 (factor loadings)

在因素分析裡,有個詞叫因素負荷量 (factor loadings),此詞簡單地說就是個別變數與因素之間的相關性 (沒轉軸前),所以這個值如同Pearson correlations一樣,數值介於-1至1之間因素負荷量的平方也就是這個因素可以解釋多少這個變數。舉例來說,如果因素負荷量是0.4,那表示該因素可解釋此變數0.16的variance。

由於一個因素會與多個變數相關,所以因素負荷量也可以解讀成:這些變數在這個因素裡面的weight有多少,或是這個變數多接近這個因素

在跑完因素分析之後,有一個要作的重要決定就是:哪些變數可歸入某個因素?依照 Hair et al. (1992) 的說法,低於 0.4 的因素負荷量是太低,0.6 以上是高。但要注意的是:這些只是一個準則而已,要決定一個變數是否應歸為一個因素取決於理論而非數據,數據只是佐證而已,有時候因為 sampling 或種種因素,得到結果或許稍微不如預期也是可以接受的。

如果對因素分析有興趣又不怕讀點英文,這個網頁 http://faculty.chass.ncsu.edu/garson/PA765/factor.htm 作得非常不錯,深入淺出,大家可以參考。

參考文獻

Hair, J. F., Black, B., Babin, B., Anderson, R. E., & Tatham, R. L. (1992). Multivariate Data Analysis (6th ed.). New York: Macmillan.
Harman, H. H. (1976). Modern factor analysis. Chicago: University Of Chicago Press.
Kim, J., & Mueller, C. W. (1978). Introduction to factor analysis: What it is and how to do it. Newbury Park, CA: Sage.

標籤: