Pandas DataFrame groupby() 方法
示例
計算每輛汽車品牌的平均二氧化碳排放量
import pandas as pd
data = {
'co2': [95, 90, 99, 104, 105, 94, 99, 104],
'model': ['Citigo', 'Fabia', 'Fiesta', 'Rapid', 'Focus', 'Mondeo', 'Octavia', 'B-Max'],
'car': ['Skoda', 'Skoda', 'Ford', 'Skoda', 'Ford', 'Ford', 'Skoda', 'Ford']
}
df = pd.DataFrame(data)
print(df.groupby(["car"]).mean())
自己動手試一試 »
定義和用法
groupby()
方法允許您對資料進行分組並對這些組執行函式。
語法
dataframe.transform(by, axis, level, as_index, sort, group_keys, observed, dropna)
引數
axis
、level
、as_index
、sort
、group_keys
、observed
、dropna
引數是關鍵字引數。
引數 | 值 | 描述 |
---|---|---|
by | 必需。一個標籤、一組標籤或一個用於指定如何分組 DataFrame 的函式。 | |
axis | 0 |
可選。指定按哪個軸進行分組,預設為 0。 |
level | level無 |
可選。指定是否按特定級別進行分組。預設為 None |
as_index | True |
可選,預設為 True。如果結果不應使用組標籤作為索引,則設定為 False。 |
排序 | True |
可選,預設為 True。為提高效能,如果不希望對組鍵進行排序,則設定為 False。 |
group_keys | True |
可選,預設為 True。如果不希望將組鍵新增到索引,則設定為 False。 |
dropna | True |
可選,預設為 True。如果結果應包含組鍵為 NULL 值(空值)的行/列,則設定為 False。 |
返回值
一個 DataFrameGroupBy 物件,其中行/列已分組。