機器學習統計
統計是獲取資料答案的工具
- 常見是什麼?
- 預期是什麼?
- 正常是什麼?
- 機率是什麼?
推論統計
推斷統計是從一個小樣本量化總體特徵的方法
您從樣本中獲取資料,並對整個總體進行預測。
例如,您可以在一家商店中站著,詢問100人樣本是否喜歡巧克力。
根據您的研究,使用推斷統計,您可以預測所有顧客中有91%喜歡巧克力。
令人難以置信的巧克力事實
十個人中有九個人喜歡巧克力。
美國人口的50%無法忍受每天沒有巧克力。
您使用推斷統計從少量資料樣本預測整個領域。
描述性統計
描述性統計總結(描述)一組資料的觀察結果。
由於我們登記每個新生兒,我們可以知道100箇中有51個是男孩。
根據這些收集到的數字,我們可以預測新生的嬰兒是男孩的機率為51%。
令人費解的是,這個比例不是50%,這與基本的生物學預測不符。我們只知道自17世紀以來,性別比例一直傾斜。
注意
原始觀察只是資料。它們不是真正的知識。
您使用描述性統計將原始觀察轉化為您可以理解的資料。
描述性統計度量
描述性統計被分為不同的度量
集中趨勢(中心度量)
- 均值(平均值)
- 中位數(中點值)
- 眾數(最常見的值)
離散程度(變異性度量)
- 最小值和最大值
- 標準差
- 方差
- 偏度(Skewness)
- 峰度(Kurtosis)