A, B, C, D 是四組資料的散佈圖,如圖所示。利用最小平方法計算它們的迴歸直線,發現有兩組資料的迴歸直線相同,試問是哪兩組?
A、B、C、D 四組資料的散佈圖
- A、B
- A、C
- A、D
- B、C
- B、D
詳解
利用最小平方法求得的迴歸直線公式為:
$$y - \bar{y} = m(x - \bar{x})$$
其中斜率 $m = \dfrac{\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^n (x_i - \bar{x})^2}$。
觀察 A、B、C、D 四組散佈圖:
1. 四組資料的 $x$ 軸坐標皆為 $3, 4, 5, 6, 7, 8$,因此其平均數皆為 $\bar{x} = 5.5$,分母 $\sum_{i=1}^6 (x_i - \bar{x})^2 = 17.5$ 皆相同。
2. 各組的迴歸直線皆會通過平均點 $(\bar{x}, \bar{y})$:
- **A 組**:資料點分布關於 $x = 5.5$ 左右對稱,故相關係數 $r = 0$,斜率 $m = 0$,迴歸直線為水平線 $y = 10$。
- **B 組**:$y$ 坐標數據為 $15, 8, 17, 5, 8, 7$,平均值 $\bar{y}_B = 10$。斜率分子 $\sum_{i=1}^6 (x_i - 5.5)(y_i - 10) = -26$,斜率 $m_B = -\dfrac{26}{17.5} = -\dfrac{52}{35}$。
- **C 組**:$y$ 坐標數據為 $14, 11, 13, 8, 8, 6$(或對應分布),平均值 $\bar{y}_C = 10$。斜率分子亦為 $-26$,斜率 $m_C = -\dfrac{52}{35}$。
- **D 組**:趨勢向右上傾斜,斜率為正值,且平均數 $\bar{y}_D \approx 10.4$。
由於 B 組與 C 組的平均點 $(\bar{x}, \bar{y}) = (5.5, 10)$ 且斜率 $m = -\dfrac{52}{35}$ 完全相同,故其迴歸直線相同。應選 $(4)$。