統計學入門
統計學為我們提供了從資料中獲取知識的方法。
統計學用於什麼?
統計學被用於各種科學和商業應用。
統計學能讓我們獲得更準確的知識,幫助我們做出更好的決定。
統計學可以側重於對未來可能發生的事情做出預測。它也可以側重於解釋事物之間是如何聯絡的。
注意: 良好的統計學解釋也有助於預測。
統計方法的典型步驟
典型的步驟是- 收集資料
- 描述和視覺化資料
- 得出結論
對於我們想了解的任何問題,都要牢記這三個步驟是很重要的。
瞭解可用的資料型別可以告訴你用統計方法可以回答哪些問題。
瞭解你想回答的問題可以幫助指導你需要什麼樣的資料。可能有很多資料可用,知道要關注什麼很重要。
統計學是如何使用的?
統計學可以用來精確地解釋事物。你可以用它來理解你想了解的群體並得出結論。這個群體被稱為總體。
總體可以是許多不同種類的群體。它可以是
- 一個國家的所有人
- 一個行業的所有企業
- 一個企業的所有客戶
- 所有年齡超過 45 歲並且踢足球的人
等等——這取決於你想了解什麼。
收集關於總體的資料會得到一個樣本。這是總體的一部分。然後對該樣本使用統計方法。
從樣本得出的統計方法結果被用來對總體做出結論。
注意: “統計資料”一詞也可以指特定的知識片段;比如某物的平均值。
統計學中的重要概念
- 預測和解釋
- 總體和樣本
- 引數和樣本統計量
- 抽樣方法
- 資料型別
- 測量水平
- 描述性統計
- 隨機變數
- 單變數和多變數統計
- 機率計算
- 機率分佈
- 統計推斷
- 引數估計
- 假設檢驗
- 相關性
- 迴歸分析
- 因果推斷
我們將在此教程中逐步介紹這些主題。
統計學與程式設計
統計分析通常透過計算機完成。少量資料也可以很好地進行分析,而無需計算機。
歷史上,所有資料分析都是手動進行的。它耗時且容易出錯。
如今,程式設計和軟體通常用於資料分析。
在本課程中,我們將展示使用 Python 和 R 程式語言進行統計分析的程式碼示例。