2021年5月10日 星期一

一題迴歸直線的計算

 這篇只是教學材料。

==問題==

甲、乙、丙、丁、戊五位同學每週上課時數(x)與第一次段考英文成績(y)的統計如下表。將原始資料分別標準化,即令$X = \frac{x - \mu_x}{\sigma_x}, Y = \frac{y - \mu_y}{\sigma_y}$,而YX的回歸直線為$Y = aX+b$,試求數對$(a, b)$。

每週上網時數$x$(小時) 1 4 7 10 13
段考英文成績$y$(分) 78 60 69 51 42

==解答==

首先計算兩個統計變量$x, y$個別的平均數與標準差。

$$\mu_x = \frac{1}{5}\left( 1+4+7+10+13 \right) = 7. $$

(請注意x的值呈現等差數列的形式)

$$\mu_y = \frac{1}{5} \left( 78+60+69+51+42 \right) = 60.$$

於是

$$x - \mu_x : -6, -3, 0, 3, 6,$$

$$y - \mu_y : 18, 0, 9, -9, -18.$$

那麼

$$\sigma_x = \sqrt{\frac{1}{5}\left[ (-6)^2 + (-3)^2 + 0^2 + 3^2 + 6^2 \right]} = 3\sqrt{2},$$

$$\sigma_y = \sqrt{\frac{1}{5} \left[ 18^2 + 0^2 + 9^2 + (-9)^2 + (-18)^2 \right]} = 9\sqrt{2}.$$

然後計算共變異數與相關係數:

$$Cov_{xy} = \frac{1}{5}\left[ (-6) \cdot 18 + (-3) \cdot 0 + 0 \cdot 9 + 3 \cdot (-9) + 6 \cdot (-8) \right] =-\frac{243}{5}. $$

$$r_{xy} = \frac{Cov_{xy}}{\sigma_x \cdot \sigma_y} = -\frac{9}{10}.$$

最後就可求出yx的迴歸直線,公式為$\frac{y - \mu_y}{\sigma_y} = r \cdot \frac{x - \mu_x}{\sigma_x}$,代入以上計算的數值,得

$$\frac{y - 60}{9 \sqrt{2}} = -\frac{9}{10} \cdot \frac{x - 7}{3\sqrt{2}}.$$

而標準化為$X = \frac{x - \mu_x}{\sigma_x} = \frac{x - 7}{3\sqrt{2}}, Y = \frac{y - \mu_y}{\sigma_y} = \frac{y - 60}{9 \sqrt{2}}$,於是就有

$$Y = -\frac{9}{10} \cdot X,$$

因此$a = -\frac{9}{10}, b = 0$。

沒有留言:

張貼留言