統計 - 均值假設檢驗（左側尾部）

❮ 上一個下一個 ❯

總體均值是一個總體的值的平均數。

假設檢驗用於檢查關於該總體均值大小的宣告。

均值假設檢驗

假設檢驗使用以下步驟

檢查條件
定義斷言
確定顯著性水平
計算檢驗統計量
結論

例如

總體：諾貝爾獎得主
類別：獲獎時的年齡。

我們要檢驗的斷言是

“諾貝爾獎獲得者在獲獎時的平均年齡**小於** 60 歲”

透過抽取 30 名隨機選擇的諾貝爾獎獲得者樣本，我們可以發現：

樣本均值 (\(\bar{x}\)) 為 62.1

樣本年齡的標準差 (\(s\)) 為 13.46

我們根據以下步驟，使用此樣本資料檢驗斷言。

1. 檢查條件

計算比例置信區間的條件是

樣本是隨機選擇的
並且滿足以下任一條件：
- 總體資料呈正態分佈
- 樣本量足夠大

通常，30 這樣的中等樣本量就足夠大了。

在此示例中，樣本量為 30 且是隨機抽取的，因此條件已滿足。

注意： 資料是否呈正態分佈可以透過專門的統計檢驗來檢查。

2. 定義斷言

我們需要根據我們正在檢驗的斷言來定義一個零假設 (\(H_{0}\)) 和一個備擇假設 (\(H_{1}\))。

斷言是

“諾貝爾獎獲得者在獲獎時的平均年齡**小於** 60 歲”

在這種情況下，引數是諾貝爾獎獲得者獲獎時的平均年齡 (\(\mu\))。

零假設和備擇假設是

零假設：平均年齡為 60 歲。

備擇假設：平均年齡**小於** 60 歲。

可以用符號表示為

\(H_{0}\)： \(\mu = 60 \)

\(H_{1}： \mu < 60 \)

這是一個“**左側**尾部”檢驗，因為備擇假設聲稱的比例**小於**零假設中的比例。

如果資料支援備擇假設，我們拒絕零假設並接受備擇假設。

3. 確定顯著性水平

顯著性水平 (\(\alpha\)) 是我們在假設檢驗中拒絕零假設時接受的不確定性。

顯著性水平是意外做出錯誤結論的百分比機率。

典型的顯著性水平是

\(\alpha = 0.1\) (10%)
\(\alpha = 0.05\) (5%)
\(\alpha = 0.01\) (1%)

較低的顯著性水平意味著資料中的證據需要更強才能拒絕零假設。

沒有“正確”的顯著性水平——它只說明瞭結論的不確定性。

注意：5% 的顯著性水平意味著當我們拒絕一個零假設時

我們預計在 100 次中會拒絕 5 次真實的零假設。

4. 計算檢驗統計量

檢驗統計量用於決定假設檢驗的結果。

檢驗統計量是根據樣本計算出的標準化值。

總體均值檢驗統計量 (TS) 的公式是：

\(\displaystyle \frac{\bar{x} - \mu}{s} \cdot \sqrt{n} \)

\(\bar{x}-\mu\) 是樣本均值 (\(\bar{x}\)) 與所聲稱的總體均值 (\(\mu\)) 之間的差值。

\(s\) 是樣本標準差。

\(n\) 是樣本大小。

在我們的例子中

聲稱的（\(H_{0}\)）總體均值（\(\mu\)) 為 \( 60 \)

樣本均值 (\(\bar{x}\)) 為 \(62.1\)

樣本標準差 (\(s\)) 為 \(13.46\)

樣本量 (\(n\)) 為 \(30\)

所以檢驗統計量 (TS) 是

\(\displaystyle \frac{62.1-60}{13.46} \cdot \sqrt{30} = \frac{2.1}{13.46} \cdot \sqrt{30} \approx 0.156 \cdot 5.477 = \underline{0.855}\)

您也可以使用程式語言函式計算檢驗統計量

示例

使用 Python，可以利用 scipy 和 math 庫來計算檢驗統計量。

import scipy.stats as stats
import math

# 指定樣本均值 (x_bar)、樣本標準差 (s)、零假設聲稱的均值 (mu_null) 和樣本量 (n)
x_bar = 62.1
s = 13.46
mu_null = 60
n = 30

# 計算並列印檢驗統計量
print((x_bar - mu_null)/(s/math.sqrt(n)))

自己動手試一試 »

示例

使用 R，可以利用內建的數學和統計函式來計算檢驗統計量。

# 指定樣本均值 (x_bar)、樣本標準差 (s)、零假設聲稱的均值 (mu_null) 和樣本量 (n)
x_bar <- 62.1
s <- 13.46
mu_null <- 60
n <- 30

# 輸出檢驗統計量
(x_bar - mu_null)/(s/sqrt(n))

自己動手試一試 »

5. 做出結論

做出假設檢驗結論主要有兩種方法

臨界值方法將檢驗統計量與顯著性水平的臨界值進行比較。
P 值方法將檢驗統計量的 P 值與顯著性水平進行比較。

注意：這兩種方法只是在呈現結論的方式上有所不同。

臨界值方法

對於臨界值方法，我們需要找到顯著性水平 (\(\alpha\)) 的臨界值 (CV)。

對於總體均值檢驗，臨界值 (CV) 是來自學生 t 分佈的 T 值。

這個臨界 T 值 (CV) 定義了檢驗的拒絕域。

拒絕域是標準正態分佈尾部的機率區域。

因為聲稱總體均值**小於** 60，所以拒絕區域在左側尾部。

Student's T-Distribution with a left tail area (rejection region) denoted as the greek symbol alpha

拒絕域的大小由顯著性水平 (\(\alpha\)) 決定。

學生 t 分佈會根據較小樣本的不確定性進行調整。

這種調整稱為自由度 (df)，它是樣本量 \((n) - 1\)

在本例中，自由度 (df) 是：\(30 - 1 = \underline{29} \)

選擇顯著性水平（\(\alpha\)) 為 0.05，即 5%，我們可以從 T 表或使用程式語言函式找到臨界 T 值。

示例

使用 Python，可以使用 Scipy Stats 庫的 t.ppf() 函式為 \(\alpha\) = 0.05 且自由度（df）為 29 的情況找到 T 值。

import scipy.stats as stats
print(stats.t.ppf(0.05, 29))

自己動手試一試 »

示例

使用 R，可以使用內建的 qt() 函式查詢 \(\alpha\) = 0.05 且自由度（df）為 29 的 t 值。

qt(0.05, 29)

自己動手試一試 »

使用以上任一方法，我們都可以找到臨界 T 值為 \(\approx \underline{-1.699}\)

對於**左側**尾部檢驗，我們需要檢查檢驗統計量（TS）是否**小於**臨界值（CV）。

如果檢驗統計量小於臨界值，則檢驗統計量位於**拒絕區域**。

當檢驗統計量在拒絕域內時，我們拒絕零假設 (\(H_{0}\))。

此處，檢驗統計量（TS）約為 \(\approx \underline{0.855}\)，臨界值為 \(\approx \underline{-1.699}\)

下圖顯示了此檢驗的圖示

Student's T-Distribution with a left tail area (rejection region) equal to 0.01, a critical value of 2.462, and a test statistic of 2.889

由於檢驗統計量**大於**臨界值，我們**保留**零假設。

這意味著樣本資料不支援備擇假設。

我們可以總結結論如下

在 **5% 的顯著性水平**下，樣本資料**不支援**“諾貝爾獎獲得者在獲獎時的平均年齡小於 60 歲”的說法。

P 值方法

對於 P 值方法，我們需要找到檢驗統計量 (TS) 的 P 值。

如果 P 值小於顯著性水平 (\(\alpha\))，我們拒絕零假設 (\(H_{0}\))。

發現的檢驗統計量為 \( \approx \underline{0.855} \)

對於總體比例檢驗，檢驗統計量是來自學生 t 分佈的 T 值。

由於這是**左側**尾部檢驗，我們需要找到比 0.855 **更小**的 t 值的 P 值。

學生 t 分佈根據自由度 (df) 進行調整，自由度為樣本量 \((30) - 1 = \underline{29}\)

我們可以使用 T 表或程式語言函式來找到 P 值。

示例

使用 Python，可以使用 Scipy Stats 庫的 t.cdf() 函式為 \(\alpha\) = 0.855 且自由度（df）為 29 的情況找到 T 值的 P 值。

import scipy.stats as stats
print(stats.t.cdf(0.855, 29))

自己動手試一試 »

示例

使用 R，可以使用內建的 pt() 函式查詢 \(\alpha\) = 0.855 且自由度（df）為 29 的 T 值的 P 值。

pt(0.855, 29)

自己動手試一試 »

使用以上任一方法，我們都可以找到 P 值為 \(\approx \underline{0.800}\)

這告訴我們，要**拒絕**零假設，顯著性水平（\(\alpha\)) 需要小於 0.80，即 80%。

下圖顯示了此檢驗的圖示

該 P 值遠**大於**任何常見的顯著性水平（10%、5%、1%）。

因此，零假設在所有這些顯著性水平下都被保留。

我們可以總結結論如下

在 **10%、5% 或 1% 的顯著性水平**下，樣本資料**不支援**“諾貝爾獎獲得者在獲獎時的平均年齡小於 60 歲”的說法。

使用程式設計計算假設檢驗的 P 值

許多程式語言可以計算 P 值來決定假設檢驗的結果。

對於大型資料集，使用軟體和程式設計計算統計量更為常見，因為手動計算會變得困難。

此處計算的 P 值將告訴我們零假設可以被拒絕的最低可能顯著性水平。

示例

使用 Python，可以使用 scipy 和 math 庫來計算左側尾部均值假設檢驗的 P 值。

此處，樣本量為 30，樣本均值為 62.1，樣本標準差為 13.46，檢驗目標是均值小於 60。

import scipy.stats as stats
import math

# 指定樣本均值 (x_bar)、樣本標準差 (s)、零假設聲稱的均值 (mu_null) 和樣本量 (n)
x_bar = 62.1
s = 13.46
mu_null = 60
n = 30

# 計算檢驗統計量
test_stat = (x_bar - mu_null)/(s/math.sqrt(n))

# 輸出檢驗統計量（左側尾部檢驗）的 p 值
print(stats.t.cdf(test_stat, n-1))

自己動手試一試 »

示例

使用 R，可以使用內建的數學和統計函式來查詢左側尾部均值假設檢驗的 P 值。

此處，樣本量為 30，樣本均值為 62.1，樣本標準差為 13.46，檢驗目標是均值小於 60。

# 指定樣本均值 (x_bar)、樣本標準差 (s)、零假設聲稱的均值 (mu_null) 和樣本量 (n)
x_bar <- 62.1
s <- 13.46
mu_null <- 60
n <- 30

# 計算檢驗統計量
test_stat = (x_bar - mu_null)/(s/sqrt(n))

# P 值：檢驗統計量（左側尾部檢驗）的 p 值
pt(test_stat, n-1)

自己動手試一試 »

左尾和雙尾檢驗

這是一個**左側**尾部檢驗的示例，其中備擇假設聲稱的引數**小於**零假設的聲稱值。

您可以在此處檢視其他型別的等效分步指南

❮ 上一個下一個 ❯

★ +1

W3schools 學習路徑

跟蹤您的進度 - 免費！

統計學 教程

描述性統計

推論統計

統計學 參考

統計 - 均值假設檢驗（左側尾部）

均值假設檢驗

1. 檢查條件

2. 定義斷言

3. 確定顯著性水平

4. 計算檢驗統計量

示例

示例

5. 做出結論

臨界值方法

示例

示例

P 值方法

示例

示例

使用程式設計計算假設檢驗的 P 值

示例

示例

左尾和雙尾檢驗

拾色器

聯絡銷售

報告錯誤

熱門教程

熱門參考

熱門示例

獲取證書

統計學教程

統計學參考