Pandas DataFrame describe() 方法
示例
返回 DataFrame 中資料的統計描述
import pandas as pd
data = [[10, 18, 11], [13, 15, 8], [9, 20, 3]]
df = pd.DataFrame(data)
print(df.describe())
自己動手試一試 »
定義和用法
describe() 方法返回 DataFrame 中資料的描述。
如果 DataFrame 包含數值資料,則描述包含每列的以下資訊:
count - 非空值的數量。
mean - 平均值。
std - 標準差。
min - 最小值。
25% - 第 25 百分位數*。
50% - 第 50 百分位數*。
75% - 第 75 百分位數*。
max - 最大值。
*百分位數含義:有多少值小於給定的百分位數。在我們的機器學習百分位數章節中閱讀更多關於百分位數的內容。
語法
dataframe.describe(percentiles, include, exclude, datetime_is_numeric)
引數
percentile、include、exclude、datetime_is_numeric 引數是關鍵字引數。
| 引數 | 值 | 描述 |
|---|---|---|
| percentile | 0 到 1 之間的數字 0 和 1 |
可選,要在結果中包含的百分位數列表,預設為[.25, .50, .75]. |
| include | 無資料型別 |
可選,結果中允許的資料型別列表 |
| exclude | 無資料型別 |
可選,結果中不允許的資料型別列表 |
| datetime_is_numeric | True |
可選,預設為 False。設定為 True 以將日期時間資料視為數值 |
返回值
一個包含每行統計資訊的 DataFrame 物件。