Pandas DataFrame describe() 方法
示例
返回 DataFrame 中資料的統計描述
import pandas as pd
data = [[10, 18, 11], [13, 15, 8], [9, 20, 3]]
df = pd.DataFrame(data)
print(df.describe())
自己動手試一試 »
定義和用法
describe()
方法返回 DataFrame 中資料的描述。
如果 DataFrame 包含數值資料,則描述包含每列的以下資訊:
count - 非空值的數量。
mean - 平均值。
std - 標準差。
min - 最小值。
25% - 第 25 百分位數*。
50% - 第 50 百分位數*。
75% - 第 75 百分位數*。
max - 最大值。
*百分位數含義:有多少值小於給定的百分位數。在我們的機器學習百分位數章節中閱讀更多關於百分位數的內容。
語法
dataframe.describe(percentiles, include, exclude, datetime_is_numeric)
引數
percentile
、include
、exclude
、datetime_is_numeric
引數是關鍵字引數。
引數 | 值 | 描述 |
---|---|---|
percentile | 0 到 1 之間的數字 0 和 1 |
可選,要在結果中包含的百分位數列表,預設為[.25, .50, .75] . |
include | 無 資料型別 |
可選,結果中允許的資料型別列表 |
exclude | 無 資料型別 |
可選,結果中不允許的資料型別列表 |
datetime_is_numeric | True |
可選,預設為 False。設定為 True 以將日期時間資料視為數值 |
返回值
一個包含每行統計資訊的 DataFrame 物件。