統計 - 中位數
中位數是一種平均值,用來描述資料中心的定位。
中位數
中位數是按從低到高排序的資料集中**中間**的值。
計算中位數
中位數只能針對數值型變數進行計算。
計算中間值的方法是:
\( \displaystyle \frac{n + 1}{2} \)
其中 \(n\) 是觀察值的總數。
如果觀察值的總數為**奇數**,則公式會得到一個整數,這個整數對應的觀察值即為中位數。
13, 21, 21, 40, 48, 55, 72
此處共有 7 個觀察值,因此中位數是第 4 個值:
\( \displaystyle \frac{7 + 1}{2} = \frac{8}{2} = 4 \)
排序列表中的第 4 個值為 **40**,所以 40 是中位數。
如果觀察值的總數為**偶數**,則公式會得到一個介於兩個觀察值之間的十進位制數。
13, 21, 21, 40, 42, 48, 55, 72
此處共有 8 個觀察值,因此中位數介於第 4 個和第 5 個值之間:
\( \displaystyle \frac{8 + 1}{2} = \frac{9}{2} = 4.5 \)
排序列表中的第 4 個和第 5 個值分別是 **40** 和 **42**,因此中位數是這兩個值的**平均值**。即這兩個值之和除以 2:
\( \displaystyle \frac{40+42}{2} = \frac{82}{2} = \underline{41} \)
注意:在計算中位數之前,務必對數字進行排序。
使用程式設計計算中位數
使用許多程式語言可以輕鬆計算中位數。
使用軟體和程式設計來計算統計資料在處理大型資料集時更為常見,因為手動計算會變得困難。
示例
使用 Python 的 NumPy 庫,使用 median()
方法來計算值 13, 21, 21, 40, 42, 48, 55, 72 的中位數:
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.median(values)
print(x)
自己動手試一試 »
示例
使用 R 的 median()
函式來計算值 13, 21, 21, 40, 42, 48, 55, 72 的中位數:
values <- c(13,21,21,40,42,48,55,72)
median(values)
自己動手試一試 »