統計 - 四分位數和百分位數
四分位數和百分位數是變異性度量,用於描述資料的分散程度。
四分位數和百分位數都屬於分位數。
四分位數
四分位數是將資料分成四等份的值。
這是截至 2020 年所有 934 位諾貝爾獎獲得者年齡的直方圖,顯示了四分位數
四分位數(Q0、Q1、Q2、Q3、Q4)是分隔每個四分之一段的值。
Q0 和 Q1 之間是資料中最低的 25% 的值。Q1 和 Q2 之間是下一個 25%。以此類推。
- Q0 是資料中的最小值。
- Q1 是分隔資料第一象限和第二象限的值。
- Q2 是中間值(中位數),分隔下半部分和上半部分。
- Q3 是分隔第三象限和第四象限的值。
- Q4 是資料中的最大值。
使用程式設計計算四分位數
許多程式語言都可以輕鬆找到四分位數。
使用軟體和程式設計來計算統計資料在處理大型資料集時更為常見,因為手動計算會變得困難。
示例
使用 Python 和 NumPy 庫的 quantile()
方法可以找到值 13、21、21、40、42、48、55、72 的四分位數。
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.quantile(values, [0,0.25,0.5,0.75,1])
print(x)
自己動手試一試 »
示例
使用 R 的 quantile()
函式可以找到值 13、21、21、40、42、48、55、72 的分位數。
values <- c(13,21,21,40,42,48,55,72)
quantile(values)
自己動手試一試 »
百分位數
百分位數是將資料分成 100 等份的值。
例如,第 95 個百分位數將最低的 95% 的值與最高的 5% 的值分開。
第 25 個百分位數 (P25%) 與第一個四分位數 (Q1) 相同。
第 50 個百分位數 (P50%) 與第二個四分位數 (Q2) 和中位數相同。
第 75 個百分位數 (P75%) 與第三個四分位數 (Q3) 相同。
使用程式設計計算百分位數
許多程式語言都可以輕鬆找到百分位數。
使用軟體和程式設計來計算統計資料在處理大型資料集時更為常見,因為手動計算會變得困難。
示例
使用 Python 和 NumPy 庫的 percentile()
方法可以找到值 13、21、21、40、42、48、55、72 的第 65
個百分位數。
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.percentile(values, 65)
print(x)
自己動手試一試 »
示例
使用 R 的 quantile()
函式可以找到值 13、21、21、40、42、48、55、72 的第 65 個百分位數(0.65
)。
values <- c(13,21,21,40,42,48,55,72)
quantile(values, 0.65)
自己動手試一試 »