這篇只是教學材料。
==問題==
甲、乙、丙、丁、戊五位同學每週上課時數(x)與第一次段考英文成績(y)的統計如下表。將原始資料分別標準化,即令$X = \frac{x - \mu_x}{\sigma_x}, Y = \frac{y - \mu_y}{\sigma_y}$,而Y對X的回歸直線為$Y = aX+b$,試求數對$(a, b)$。
甲 | 乙 | 丙 | 丁 | 戊 | |
---|---|---|---|---|---|
每週上網時數$x$(小時) | 1 | 4 | 7 | 10 | 13 |
段考英文成績$y$(分) | 78 | 60 | 69 | 51 | 42 |
==解答==
首先計算兩個統計變量$x, y$個別的平均數與標準差。
$$\mu_x = \frac{1}{5}\left( 1+4+7+10+13 \right) = 7. $$
(請注意x的值呈現等差數列的形式)
$$\mu_y = \frac{1}{5} \left( 78+60+69+51+42 \right) = 60.$$
於是
$$x - \mu_x : -6, -3, 0, 3, 6,$$
$$y - \mu_y : 18, 0, 9, -9, -18.$$
那麼
$$\sigma_x = \sqrt{\frac{1}{5}\left[ (-6)^2 + (-3)^2 + 0^2 + 3^2 + 6^2 \right]} = 3\sqrt{2},$$
$$\sigma_y = \sqrt{\frac{1}{5} \left[ 18^2 + 0^2 + 9^2 + (-9)^2 + (-18)^2 \right]} = 9\sqrt{2}.$$
然後計算共變異數與相關係數:
$$Cov_{xy} = \frac{1}{5}\left[ (-6) \cdot 18 + (-3) \cdot 0 + 0 \cdot 9 + 3 \cdot (-9) + 6 \cdot (-8) \right] =-\frac{243}{5}. $$
$$r_{xy} = \frac{Cov_{xy}}{\sigma_x \cdot \sigma_y} = -\frac{9}{10}.$$
最後就可求出y對x的迴歸直線,公式為$\frac{y - \mu_y}{\sigma_y} = r \cdot \frac{x - \mu_x}{\sigma_x}$,代入以上計算的數值,得
$$\frac{y - 60}{9 \sqrt{2}} = -\frac{9}{10} \cdot \frac{x - 7}{3\sqrt{2}}.$$
而標準化為$X = \frac{x - \mu_x}{\sigma_x} = \frac{x - 7}{3\sqrt{2}}, Y = \frac{y - \mu_y}{\sigma_y} = \frac{y - 60}{9 \sqrt{2}}$,於是就有
$$Y = -\frac{9}{10} \cdot X,$$
因此$a = -\frac{9}{10}, b = 0$。