資料科學 - 資料是什麼?
資料是什麼?
資料是資訊的集合。
資料科學的一個目的是構建資料,使其可解釋且易於使用。
資料可以分為兩類
- 結構化資料
- 非結構化資料
非結構化資料
非結構化資料未經過組織。我們必須為分析目的組織資料。
結構化資料
結構化資料經過組織且更易於使用。
如何組織資料?
我們可以使用陣列或資料庫表來組織或呈現資料。
陣列示例
[80, 85, 90, 95, 100, 105, 110, 115, 120, 125]
以下示例展示瞭如何在 Python 中建立陣列
在資料科學中,通常使用非常大的資料集。
在本教程中,我們將盡力使資料科學的概念儘可能易於理解。因此,我們將使用一個易於解釋的小型資料集。