統計 - 假設檢驗
假設檢驗是一種正式的方法,用於檢查關於某個總體的假設是否真實。
假設檢驗
假設是對總體引數的聲稱。
假設檢驗是一種正式程式,用於檢查假設是否真實。
可檢驗聲稱的示例
丹麥人的平均身高高於 170 釐米。
澳大利亞左撇子人的比例不是 10%。
牙醫的平均收入低於律師的平均收入。
原假設和備擇假設
假設檢驗基於對總體引數提出兩個不同的聲稱。
原假設 (\(H_{0} \)) 和備擇假設 (\(H_{1}\)) 是這些聲稱。
這兩個聲稱必須互斥,這意味著只有一個聲稱可以為真。
備擇假設通常是我們試圖證明的。
例如,我們要檢查以下聲稱
“丹麥人的平均身高高於 170 釐米。”
在這種情況下,引數是丹麥人的平均身高 (\(\mu\))。
原假設和備擇假設將是
原假設:丹麥人的平均身高是 170 釐米。
備擇假設:丹麥人的平均身高高於 170 釐米。
這些聲稱通常用符號表示,如下所示
\(H_{0}\): \(\mu = 170 \: cm \)
\(H_{1}\): \(\mu > 170 \: cm \)
如果資料支援備擇假設,我們拒絕零假設並接受備擇假設。
如果資料不支援備擇假設,我們則保留原假設。
注意:備擇假設也稱為 (\(H_{A} \))。
顯著性水平
顯著性水平 (\(\alpha\)) 是我們在假設檢驗中拒絕原假設時所接受的不確定性。
顯著性水平是意外做出錯誤結論的百分比機率。
典型的顯著性水平是
- \(\alpha = 0.1\) (10%)
- \(\alpha = 0.05\) (5%)
- \(\alpha = 0.01\) (1%)
較低的顯著性水平意味著資料中的證據需要更強才能拒絕零假設。
沒有“正確”的顯著性水平——它只說明瞭結論的不確定性。
注意:5% 的顯著性水平意味著當我們拒絕一個零假設時
我們預計在 100 次中會拒絕 5 次真實的零假設。
檢驗統計量
檢驗統計量用於決定假設檢驗的結果。
檢驗統計量是根據樣本計算出的標準化值。
標準化是指將統計量轉換為一個眾所周知的機率分佈。
機率分佈的型別取決於檢驗的型別。
常見的例子是
注意:您將在接下來的章節中學習如何計算每種型別檢驗的檢驗統計量。
臨界值和 P 值方法
假設檢驗主要有兩種方法
- 臨界值方法將檢驗統計量與顯著性水平的臨界值進行比較。
- P 值方法將檢驗統計量的 P 值與顯著性水平進行比較。
臨界值方法
臨界值方法檢查檢驗統計量是否在拒絕域內。
拒絕域是分佈尾部的機率區域。
拒絕域的大小由顯著性水平 (\(\alpha\)) 決定。
分隔拒絕域與其他區域的值稱為臨界值。
以下是圖形說明
如果檢驗統計量在此拒絕域內,則拒絕原假設。
例如,如果檢驗統計量為 2.3,臨界值為 2,顯著性水平為 (\(\alpha = 0.05\))
我們在 0.05 的顯著性水平 (\(\alpha\)) 下拒絕原假設 (\(H_{0} \))。
P 值方法
P 值方法檢查檢驗統計量的 P 值是否小於顯著性水平 (\(\alpha\))。
檢驗統計量的 P 值是分佈尾部從檢驗統計量值開始的機率區域。
以下是圖形說明
如果 P 值小於顯著性水平,則拒絕原假設。
P 值直接告訴我們最低顯著性水平,在該水平下我們可以拒絕原假設。
例如,如果 P 值為 0.03
我們在 0.05 的顯著性水平 (\(\alpha\)) 下拒絕原假設 (\(H_{0} \))。
我們在 0.01 的顯著性水平 (\(\alpha\)) 下保留原假設 (\(H_{0}\))。
注意:這兩種方法只是在呈現結論的方式上有所不同。
假設檢驗步驟
假設檢驗使用以下步驟
- 檢查條件
- 定義斷言
- 確定顯著性水平
- 計算檢驗統計量
- 結論
一個條件是樣本是隨機抽取自總體的。
其他條件取決於您要檢驗假設的引數型別。
用於檢驗假設的常見引數有
- 比例(定性資料)
- 均值(數值資料)
您將在接下來的頁面中學習這兩種型別的步驟。