隨機資料分佈

什麼是資料分佈？

資料分佈是所有可能值的列表，以及每個值出現的頻率。

在處理統計和資料科學時，這類列表很重要。

random 模組提供了返回隨機生成資料分佈的方法。

隨機分佈是一組遵循特定機率密度函式的隨機數。

機率密度函式：描述連續機率的函式。即陣列中所有值的機率。

我們可以使用 random 模組的 choice() 方法，根據定義的機率生成隨機數。

choice() 方法允許我們指定每個值出現的機率。

機率由 0 到 1 之間的數字設定，其中 0 表示該值永遠不會出現，1 表示該值總是會發生。

生成一個包含 100 個值的 1-D 陣列，其中每個值必須是 3、5、7 或 9。

值為 3 的機率設定為 0.1

值為 5 的機率設定為 0.3

值為 7 的機率設定為 0.6

值為 9 的機率設定為 0

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))

print(x)

所有機率數字的總和應為 1。

即使您執行上面的示例 100 次，值 9 也永遠不會出現。

透過在 size 引數中指定形狀，您可以返回任何形狀和大小的陣列。

與上面的示例相同，但返回一個 3 行 5 列的 2-D 陣列。

from numpy import random

x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))

print(x)

W3schools 學習路徑

跟蹤您的進度 - 免費！