選單
×
   ❮   
HTML CSS JAVASCRIPT SQL PYTHON JAVA PHP HOW TO W3.CSS C C++ C# BOOTSTRAP REACT MYSQL JQUERY EXCEL XML DJANGO NUMPY PANDAS NODEJS R TYPESCRIPT ANGULAR GIT POSTGRESQL MONGODB ASP AI GO KOTLIN SASS VUE DSA GEN AI SCIPY AWS CYBERSECURITY DATA SCIENCE
     ❯   

統計 - 標準差


標準差是變化性中最常用的度量,它描述了資料的離散程度。


標準差

標準差 (σ) 衡量“典型”觀測值與資料平均值 (μ) 的距離。

標準差對於許多統計方法都很重要。

這是截至 2020 年所有 934 位諾貝爾獎獲得者年齡的直方圖,顯示了標準差

Histogram of the age of Nobel Prize winners with interquartile range shown.

直方圖中的每條虛線都表示增加一個標準差的偏移。

如果資料是正態分佈的:

  • 大約 68.3% 的資料在平均值的一個標準差範圍內 (從 μ-1σ 到 μ+1σ)
  • 大約 95.5% 的資料在平均值的兩個標準差範圍內 (從 μ-2σ 到 μ+2σ)
  • 大約 99.7% 的資料在平均值的三個標準差範圍內 (從 μ-3σ 到 μ+3σ)

注意:正態分佈呈“鐘形”,並向兩側均勻分佈。


計算標準差

您可以計算總體樣本的標準差。

這兩個公式幾乎相同,並使用不同的符號來指代標準差 (\(\sigma\)) 和樣本標準差 (\(s\))。

標準差 (\(\sigma\)) 的計算公式為:

\(\displaystyle \sigma = \sqrt{\frac{\sum (x_{i}-\mu)^2}{n}}\)

樣本標準差 (\(s\)) 的計算公式為:

\(\displaystyle s = \sqrt{\frac{\sum (x_{i}-\bar{x})^2}{n-1}}\)

\(n\) 是觀測值的總數。

\(\sum \) 是將一系列數字相加的符號。

\(x_{i}\) 是資料中的值列表:\(x_{1}, x_{2}, x_{3}, \ldots \)

\(\mu\) 是總體均值,\(\bar{x}\) 是樣本均值(平均值)。

\( (x_{i} - \mu ) \) 和 \( (x_{i} - \bar{x} ) \) 是觀測值 (\(x_{i}\)) 與均值之間的差值。

每個差值都被平方並相加。

然後將總和除以 \(n\) 或 (\( n - 1 \)),然後計算平方根。

使用這 4 個示例值計算總體標準差

4, 11, 7, 14

我們必須先找到均值

\(\displaystyle \mu = \frac{\sum x_{i}}{n} = \frac{4 + 11 + 7 + 14}{4} = \frac{36}{4} = \underline{9} \)

然後我們找到每個值與均值的差值 \( (x_{i}- \mu)\)

  • \( 4-9 \; \:= -5 \)
  • \( 11-9 = 2 \)
  • \( 7-9 \; \:= -2 \)
  • \( 14-9 = 5 \)

然後將每個值平方,即乘以自身 \( ( x_{i}- \mu )^2\)

  • \( (-5)^2 = (-5)(-5) = 25 \)
  • \( 2^2 \; \; \; \; \; \, = 2*2 \; \; \; \; \; \; \; \: = 4 \)
  • \( (-2)^2 = (-2)(-2) = 4 \)
  • \( 5^2 \; \; \; \; \; \, = 5*5 \; \; \; \; \; \; \; \: = 25 \)

然後將所有平方差相加 \( \sum (x_{i} -\mu )^2\)

\( 25 + 4 + 4 + 25 = 58\)

然後將總和除以觀測值的總數 \( n \)

\( \displaystyle \frac{58}{4} = 14.5\)

最後,我們取這個數字的平方根

\( \sqrt{14.5} \approx \underline{3.81} \)

因此,示例值的標準差大約為:\(3.81 \)



使用程式設計計算標準差

使用許多程式語言可以輕鬆計算標準差。

使用軟體和程式設計計算統計資料對於較大的資料集更為常見,因為手動計算會變得困難。

總體標準差

示例

在 Python 中,使用 NumPy 庫的 std() 方法查詢值 4,11,7,14 的標準差

import numpy

values = [4,11,7,14]

x = numpy.std(values)

print(x)
自己動手試一試 »

示例

使用 R 公式查詢值 4,11,7,14 的標準差

values <- c(4,7,11,14)

sqrt(mean((values-mean(values))^2))
自己動手試一試 »

樣本標準差

示例

在 Python 中,使用 NumPy 庫的 std() 方法查詢值 4,11,7,14 的樣本標準差

import numpy

values = [4,11,7,14]

x = numpy.std(values, ddof=1)

print(x)
自己動手試一試 »

示例

使用 R sd() 函式查詢值 4,11,7,14 的樣本標準差

values <- c(4,7,11,14)

sd(values)
自己動手試一試 »

統計符號參考

符號 描述
\( \sigma \) 總體標準差。發音為“sigma”。
\( s \) 樣本標準差。
\( \mu \) 總體均值。發音為“mu”。
\( \bar{x} \) 樣本均值。發音為“x-bar”。
\( \sum \) 求和運算子,“大寫 Sigma”。
\( x \) 我們要計算平均值的變數“x”。
\( i \) 變數“x”的索引“i”。它標識了變數的每個觀測值。
\( n \) 觀測值的數量。

×

聯絡銷售

如果您想將 W3Schools 服務用於教育機構、團隊或企業,請傳送電子郵件給我們
sales@w3schools.com

報告錯誤

如果您想報告錯誤,或想提出建議,請傳送電子郵件給我們
help@w3schools.com

W3Schools 經過最佳化,旨在方便學習和培訓。示例可能經過簡化,以提高閱讀和學習體驗。教程、參考資料和示例會不斷審查,以避免錯誤,但我們無法保證所有內容的完全正確性。使用 W3Schools 即表示您已閱讀並接受我們的使用條款Cookie 和隱私政策

版權所有 1999-2024 Refsnes Data。保留所有權利。W3Schools 由 W3.CSS 提供支援