機器學習 - 正態資料分佈
正態資料分佈
在上一章中,我們學習瞭如何建立給定大小且在兩個給定值之間完全隨機的陣列。
在本章中,我們將學習如何建立值集中在給定值附近的陣列。
在機率論中,這種資料分佈被稱為*正態資料分佈*,或*高斯資料分佈*,以提出這種資料分佈公式的數學家卡爾·弗里德里希·高斯命名。
示例
典型的正態資料分佈
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
結果
注意: 正態分佈圖也因其特徵性的鐘形而被稱為*鐘形曲線*。
直方圖解釋
我們使用來自 numpy.random.normal()
方法的陣列,包含 100000 個值,繪製一個包含 100 個條形的直方圖。
我們指定平均值為 5.0,標準差為 1.0。
這意味著這些值應該集中在 5.0 附近,並且很少偏離平均值超過 1.0。
從直方圖中可以看出,大多數值在 4.0 到 6.0 之間,最高點大約在 5.0。