選單
×
   ❮   
HTML CSS JAVASCRIPT SQL PYTHON JAVA PHP HOW TO W3.CSS C C++ C# BOOTSTRAP REACT MYSQL JQUERY EXCEL XML DJANGO NUMPY PANDAS NODEJS R TYPESCRIPT ANGULAR GIT POSTGRESQL MONGODB ASP AI GO KOTLIN SASS VUE DSA GEN AI SCIPY AWS CYBERSECURITY DATA SCIENCE
     ❯   

統計 - 假設檢驗


假設檢驗是一種正式的方法,用於檢查關於某個總體的假設是否真實。


假設檢驗

假設是對總體引數的聲稱。

假設檢驗是一種正式程式,用於檢查假設是否真實。

可檢驗聲稱的示例

丹麥人的平均身高高於 170 釐米。

澳大利亞左撇子人的比例是 10%。

牙醫的平均收入低於律師的平均收入。


原假設和備擇假設

假設檢驗基於對總體引數提出兩個不同的聲稱。

原假設 (\(H_{0} \)) 和備擇假設 (\(H_{1}\)) 是這些聲稱。

這兩個聲稱必須互斥,這意味著只有一個聲稱可以為真。

備擇假設通常是我們試圖證明的。

例如,我們要檢查以下聲稱

“丹麥人的平均身高高於 170 釐米。”

在這種情況下,引數是丹麥人的平均身高 (\(\mu\))。

原假設和備擇假設將是

原假設:丹麥人的平均身高 170 釐米。

備擇假設:丹麥人的平均身高高於 170 釐米。

這些聲稱通常用符號表示,如下所示

\(H_{0}\): \(\mu = 170 \: cm \)

\(H_{1}\): \(\mu > 170 \: cm \)

如果資料支援備擇假設,我們拒絕零假設並接受備擇假設。

如果資料不支援備擇假設,我們則保留原假設。

注意:備擇假設也稱為 (\(H_{A} \))。


顯著性水平

顯著性水平 (\(\alpha\)) 是我們在假設檢驗中拒絕原假設時所接受的不確定性

顯著性水平是意外做出錯誤結論的百分比機率。

典型的顯著性水平是

  • \(\alpha = 0.1\) (10%)
  • \(\alpha = 0.05\) (5%)
  • \(\alpha = 0.01\) (1%)

較低的顯著性水平意味著資料中的證據需要更強才能拒絕零假設。

沒有“正確”的顯著性水平——它只說明瞭結論的不確定性。

注意:5% 的顯著性水平意味著當我們拒絕一個零假設時

我們預計在 100 次中會拒絕 5 次真實的零假設。



檢驗統計量

檢驗統計量用於決定假設檢驗的結果。

檢驗統計量是根據樣本計算出的標準化值。

標準化是指將統計量轉換為一個眾所周知的機率分佈

機率分佈的型別取決於檢驗的型別。

常見的例子是

注意:您將在接下來的章節中學習如何計算每種型別檢驗的檢驗統計量。


臨界值和 P 值方法

假設檢驗主要有兩種方法

  • 臨界值方法將檢驗統計量與顯著性水平的臨界值進行比較。
  • P 值方法將檢驗統計量的 P 值與顯著性水平進行比較。

臨界值方法

臨界值方法檢查檢驗統計量是否在拒絕域內。

拒絕域是分佈尾部的機率區域。

拒絕域的大小由顯著性水平 (\(\alpha\)) 決定。

分隔拒絕域與其他區域的值稱為臨界值

以下是圖形說明

Graph of T-Distribution for right-tailed test, rejection region (alpha), critical value, and test statistic in the rejection area.

如果檢驗統計量此拒絕域內,則拒絕原假設。

例如,如果檢驗統計量為 2.3,臨界值為 2,顯著性水平為 (\(\alpha = 0.05\))

我們在 0.05 的顯著性水平 (\(\alpha\)) 下拒絕原假設 (\(H_{0} \))。

P 值方法

P 值方法檢查檢驗統計量的 P 值是否小於顯著性水平 (\(\alpha\))。

檢驗統計量的 P 值是分佈尾部從檢驗統計量值開始的機率區域。

以下是圖形說明

Graphs of T-Distributions for right-tailed test with tail area (alpha), and tail area equal to p-value of test statistic.

如果 P 值小於顯著性水平,則拒絕原假設。

P 值直接告訴我們最低顯著性水平,在該水平下我們可以拒絕原假設。

例如,如果 P 值為 0.03

我們在 0.05 的顯著性水平 (\(\alpha\)) 下拒絕原假設 (\(H_{0} \))。

我們在 0.01 的顯著性水平 (\(\alpha\)) 下保留原假設 (\(H_{0}\))。

注意:這兩種方法只是在呈現結論的方式上有所不同。


假設檢驗步驟

假設檢驗使用以下步驟

  1. 檢查條件
  2. 定義斷言
  3. 確定顯著性水平
  4. 計算檢驗統計量
  5. 結論

一個條件是樣本是隨機抽取自總體的。

其他條件取決於您要檢驗假設的引數型別。

用於檢驗假設的常見引數有

  • 比例(定性資料)
  • 均值(數值資料)

您將在接下來的頁面中學習這兩種型別的步驟。


×

聯絡銷售

如果您想將 W3Schools 服務用於教育機構、團隊或企業,請傳送電子郵件給我們
sales@w3schools.com

報告錯誤

如果您想報告錯誤,或想提出建議,請傳送電子郵件給我們
help@w3schools.com

W3Schools 經過最佳化,旨在方便學習和培訓。示例可能經過簡化,以提高閱讀和學習體驗。教程、參考資料和示例會不斷審查,以避免錯誤,但我們無法保證所有內容的完全正確性。使用 W3Schools 即表示您已閱讀並接受我們的使用條款Cookie 和隱私政策

版權所有 1999-2024 Refsnes Data。保留所有權利。W3Schools 由 W3.CSS 提供支援