隨機資料分佈
什麼是資料分佈?
資料分佈是所有可能值的列表,以及每個值出現的頻率。
在處理統計和資料科學時,這類列表很重要。
random 模組提供了返回隨機生成資料分佈的方法。
隨機分佈
隨機分佈是一組遵循特定機率密度函式的隨機數。
機率密度函式:描述連續機率的函式。即陣列中所有值的機率。
我們可以使用 random 模組的 choice()
方法,根據定義的機率生成隨機數。
choice()
方法允許我們指定每個值出現的機率。
機率由 0 到 1 之間的數字設定,其中 0 表示該值永遠不會出現,1 表示該值總是會發生。
示例
生成一個包含 100 個值的 1-D 陣列,其中每個值必須是 3、5、7 或 9。
值為 3 的機率設定為 0.1
值為 5 的機率設定為 0.3
值為 7 的機率設定為 0.6
值為 9 的機率設定為 0
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))
print(x)
自己動手試一試 »
所有機率數字的總和應為 1。
即使您執行上面的示例 100 次,值 9 也永遠不會出現。
透過在 size
引數中指定形狀,您可以返回任何形狀和大小的陣列。
示例
與上面的示例相同,但返回一個 3 行 5 列的 2-D 陣列。
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))
print(x)
自己動手試一試 »