最近在看Paul Allison寫的這本Multiple regression: A primer,光看第一章就覺得很精采了,因為他用問答的方式,讓你了解為什麼要用multiple regression。
我先把第一章的標題先列出來:
1.1 What is multiple regression?
1.2 What is multiple regression good for?
1.3 Are there other names for multiple regression?
1.4 Why is multiple regression so popular?
1.5 Why is regression "linear" ?
1.6 What does a linear equation look like with more than two variables?
1.7 Why does multiple regression use linear equations?
1.8 What kinds of data are needed for multiple regression?
1.9 What kinds of variables can be used in multiple regression?
1.10 What is ordinary least squares?
1.11 How can we judge how good the predictions are?
1.12 How do we judge how good the coefficient estimates are?
1.13 How does multiple regression "control" for variables?
1.14 Is multiple regression as good as an experiment?
光看就覺得很精采了,不是嗎?雖然這些我都學過也知道,但就是沒有老師在上課時這麼清楚地點出來,很多都是摸索以後才學到的。下面分享一下精華摘要:
1.1 什麼是線性迴歸
線性迴歸是研究單一依變項(dependent variable)與一個或以上自變項(independent variable)之間的關係。
1.2 線性迴歸有什麼好?
線上迴歸有兩個主要用處:預測(prediction)與因果分析(causal analysis)。預測指的是用已觀察的變數來預測依變項;因果分析則是將自變項當作是依變項發生的原因。
1.3 線性迴歸有別的名稱嗎?
全稱應為Ordinary least squares multiple linear regression. 有時候會看到這幾個字的組合,像linear regression, least squres regression, OLS regression (OLS指的是ordinary least squares)
1.4 為什麼線性迴歸這麼熱門?
線性迴歸有兩個非常令人滿意的地方:預測與因果分析。在使用預測的研究,線性迴歸可將許多變數結合起來作一個最佳預測;在使用因果分析的研究,線性迴歸則可以將每一個變數的影響分開。
1.5 為什麼迴歸是「線性」?
是線性因為是基於線性方程式。例子如下:
收入 = 8000 + (1000 x 受幾年教育)
1.6 多於兩個變數的線性方程式看起來是什麼樣子?
收入= 8000 + (1000 x 受幾年教育) + (500 x 年紀)
1.7 為什麼迴歸要用線性方程式?
真實情況有可能得用複雜的方程式來計算。不過我們沒有理由相信非線性一定比線性好。當你不知道的時候,就行簡單的開始。即使事物真實關係非線性,線性方程式也提供了一個近似值。
1.8 什麼資料是線性方程式所需?
要一些cases、要幾個變數。cases不應少於變數數量,而且愈多愈好。
1.9 什麼樣的變數能用在線性迴歸?
Interval scales,像是年紀、薪水,scale之間是等距的,這類變數是最理想的。ordinal scales理論上不應用在線性迴歸,因為每個scale之間的差異並不相同,但在實際研究上,這類變數常使用線性迴歸分析,而且也因為這類變數沒其它麵interval scales可取代。
ordinal scales的例子像是:1:非常不同意; 2:不同意 ;3同意; 4:非常同意。
剩下的部分就讓大家自己看囉!標籤: 統計分析