資料科學 - 資料庫表
資料庫表
資料庫表是包含結構化資料的表。
下表顯示了一個從運動手錶中提取的包含健康資料的資料庫表。
持續時間 | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
該資料集包含典型訓練課程的資訊,例如持續時間、平均脈搏、消耗卡路里等。
資料庫表結構
資料庫表由列(Column)和行(Row)組成。
列 1 | 列 2 | 列 3 | 列 4 | 列 5 | 列 6 | |
持續時間 | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep | |
---|---|---|---|---|---|---|
行 1 | 30 | 80 | 120 | 240 | 10 | 7 |
行 2 | 30 | 85 | 120 | 250 | 10 | 7 |
行 3 | 45 | 90 | 130 | 260 | 8 | 7 |
行 4 | 45 | 95 | 130 | 270 | 8 | 7 |
行 5 | 45 | 100 | 140 | 280 | 0 | 7 |
行 6 | 60 | 105 | 140 | 290 | 7 | 8 |
行 7 | 60 | 110 | 145 | 300 | 7 | 8 |
行 8 | 60 | 115 | 145 | 310 | 8 | 8 |
行 9 | 75 | 120 | 150 | 320 | 0 | 8 |
行 10 | 75 | 125 | 150 | 330 | 8 | 8 |
行是資料的水平表示。
列是資料的垂直表示。
變數
變數(Variable)被定義為可以測量或計數的事物。
例如,可以是字元、數字或時間。
在下面的示例中,我們可以看到每一列代表一個變數。
持續時間 | Average_Pulse | Max_Pulse | Calorie_Burnage | Hours_Work | Hours_Sleep |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
共有 6 列,這意味著有 6 個變數(Duration、Average_Pulse、Max_Pulse、Calorie_Burnage、Hours_Work、Hours_Sleep)。
共有 11 行,這意味著每個變數有 10 個觀測值。
但是,如果只有 11 行,為什麼只有 10 個觀測值呢?
這是因為第一行是標籤,意味著它是變數的名稱。