=題目=
某次統計得到了 10 筆相異數據,每筆數據皆為正數,問下列何者正確?(多選)
(A) 數據標準化後的平均數必小於原始數據的平均數
(B) 數據標準化後的標準差必小於原始數據的標準差
(C) 若原始數據成等差數列,則數據標準化後也成等差數列
(D) 若原始數據成等比數列,則數據標準化後也成等比數列
(E) 若將十筆數據中最大和最小的數據都刪除,則剩下的八筆數據的平均數和標準差都會變小。
=答案=
(A)(C)
=詳解=
【核心概念】
1. 數據標準化:將原始數據 $x$ 減去平均數 $\mu$ 後,再除以標準差 $\sigma$。得到的標準化數據 $z$ 具備兩個固定性質:
平均數必為 0。
標準差必為 1。
2. 線性變換:標準化公式 $z = \frac{x - \mu}{\sigma}$ 其實是一種線性變換(形如 $y = ax + b$)。
3. 平均數與標準差的敏感度:平均數容易受極端值影響;標準差代表數據的離散程度。
【逐步解法】
(A) 數據標準化後的平均數必小於原始數據的平均數
正確性:正確。
淺白說明:標準化後的數據平均數永遠固定為 0。而題目提到原始數據 10 筆皆為正數,因此原始平均數也必然大於 0。因為 $0 < \text{原始平均數}$,所以此選項正確。
(B) 數據標準化後的標準差必小於原始數據的標準差
正確性:錯誤。
反例:假設原始數據的標準差非常小,例如 $\sigma = 0.5$。由於標準化後的標準差固定為 1,此時 1 大於 0.5,標準化後的標準差反而變大了。
(C) 若原始數據成等差數列,則數據標準化後也成等差數列
正確性:正確。
淺白說明:標準化過程只是將所有數據同時「減去一個數」再「除以一個數」。原本間隔相等的數據(等差),在同時移動縮放後,彼此間的間隔依然會保持固定的比例縮放,因此仍會維持等差數列的特性。
(D) 若原始數據成等比數列,則數據標準化後也成等比數列
正確性:錯誤。
反例:假設原始數據為 $\{1, 2, 4\}$(公比為 2)。這組數據的平均數為 $7/3 \approx 2.33$。標準化時需要將每個數減去 2.33,得到 $\{1-2.33, 2-2.33, 4-2.33\} = \{-1.33, -0.33, 1.67\}$。這組新數據的正負號不一,且數值間不具備固定的公比,因此不再是等比數列。
(E) 若將十筆數據中最大和最小的數據都刪除,則剩下的八筆數據的平均數和標準差都會變小
正確性:錯誤。
反例:
針對平均數:假設數據為 $\{1, 10, 11, 12, \dots, 15\}$。如果最小值 1 離平均數非常遠,而最大值 15 離平均數很近,刪除這兩者後,剩下的數據會整體「偏向大數」,導致平均數反而變大。
針對標準差:雖然通常刪除極端值會讓數據變集中(標準差變小),但平均數若產生大幅位移,標準差的變化仍需視具體數據分佈而定,不能說「必會」變小。
沒有留言:
張貼留言