統計 - 標準正態分佈
標準正態分佈是指均值為 0,標準差為 1 的正態分佈。
標準正態分佈
服從正態分佈的資料可以轉換為標準正態分佈。
對服從正態分佈的資料進行標準化處理,可以更容易地比較不同的資料集。
標準正態分佈用於
- 計算置信區間
- 假設檢驗
下圖是標準正態分佈的圖形,其中標示了標準差之間的機率值(p 值)。
標準化處理可以更容易地計算機率。
計算機率的函式非常複雜,難以手動計算。
通常,機率是透過查詢預先計算值的表格,或使用軟體和程式來找到的。
標準正態分佈也稱為“Z 分佈”,其值稱為“Z 值”(或 Z 分數)。
Z 值
Z 值表示一個值距離均值有多少個標準差。
計算 Z 值的公式是:
\(\displaystyle Z = \frac{x-\mu}{\sigma}\)
其中 \(x\) 是要標準化的值,\(\mu\) 是均值,\(\sigma\) 是標準差。
例如,如果我們知道:
德國人平均身高為 170 釐米(\(\mu\))
德國人身高的標準差為 10 釐米(\(\sigma\))
鮑勃的身高為 200 釐米(\(x\))
鮑勃比德國人的平均身高高 30 釐米。
30 釐米是 10 釐米的 3 倍。所以鮑勃的身高比德國平均身高高 3 個標準差。
使用公式:
\(\displaystyle Z = \frac{x-\mu}{\sigma} = \frac{200-170}{10} = \frac{30}{10} = \underline{3} \)
鮑勃身高(200 釐米)的 Z 值為 3。
查詢 Z 值的 P 值
使用 Z 表或程式設計,我們可以計算德國有多少人比鮑勃矮,有多少人比鮑勃高。
示例
使用 Python,可以使用 Scipy Stats 庫的 norm.cdf()
函式找到 Z 值為 3 的機率(即小於 Z 值為 3 的機率)。
import scipy.stats as stats
print(stats.norm.cdf(3))
自己動手試一試 »
使用任何一種方法,我們都可以發現機率約為 \(\approx 0.9987\),即 \( 99.87\% \)。
這意味著鮑勃比 99.87% 的德國人高。
下圖是標準正態分佈和 Z 值為 3 的圖形,以視覺化機率。
這些方法找到的是特定 z 值以下的 p 值。
要找到 z 值以上的 p 值,我們可以計算 1 減去該機率。
所以,在鮑勃的例子中,我們可以計算 1 - 0.9987 = 0.0013,即 0.13%。
這意味著只有 0.13% 的德國人比鮑勃高。
查詢 Z 值之間的 P 值
如果我們想知道德國有多少人身高在 155 釐米到 165 釐米之間,使用相同的例子:
德國人平均身高為 170 釐米(\(\mu\))
德國人身高的標準差為 10 釐米(\(\sigma\))
現在我們需要計算 155 釐米和 165 釐米的 Z 值。
\(\displaystyle Z = \frac{x-\mu}{\sigma} = \frac{155-170}{10} = \frac{-15}{10} = \underline{-1.5} \)
155 釐米的 Z 值為 -1.5。
\(\displaystyle Z = \frac{x-\mu}{\sigma} = \frac{165-170}{10} = \frac{-5}{10} = \underline{-0.5} \)
165 釐米的 Z 值為 -0.5。
使用 Z 表或程式設計,我們可以找到兩個 z 值的 p 值:
- Z 值小於 -0.5(身高小於 165 釐米)的機率為 30.85%。
- Z 值小於 -1.5(身高小於 155 釐米)的機率為 6.68%。
將 6.68% 從 30.85% 中減去,以找到它們之間的 Z 值的機率。
30.85% - 6.68% = 24.17%
這是一組圖示化該過程的圖形。
查詢 P 值的 Z 值
您也可以使用 p 值(機率)來查詢 z 值。
例如
“如果您比 90% 的德國人高,您的身高是多少?”
p 值為 0.9,即 90%。
使用 Z 表或程式設計,我們可以計算 z 值。
示例
使用 Python,可以使用 Scipy Stats 庫的 norm.ppf()
函式找到將前 10% 與後 90% 分隔的 z 值。
import scipy.stats as stats
print(stats.norm.ppf(0.9))
自己動手試一試 »
使用任一方法,我們都可以發現 Z 值為 \(\approx 1.281\)。
這意味著一個比德國人平均身高高 1.281 個標準差的人比 90% 的德國人高。
然後我們使用公式根據均值(\(\mu\)) 為 170 釐米,標準差(\(\sigma\)) 為 10 釐米來計算身高(\(x\))。
\(\displaystyle Z = \frac{x-\mu}{\sigma} \)
\(\displaystyle 1.281 = \frac{x-170}{10} \)
\(1.281 \cdot 10 = x-170 \)
\(12.81 = x - 170 \)
\(12.81 + 170 = x \)
\(\underline{182.81} = x \)
因此,我們可以得出結論:
"您至少需要達到 182.81 釐米高,才能比 90% 的德國人高"