Pandas DataFrame groupby() 方法
示例
計算每輛汽車品牌的平均二氧化碳排放量
import pandas as pd
data = {
'co2': [95, 90, 99, 104, 105, 94, 99, 104],
'model': ['Citigo', 'Fabia', 'Fiesta', 'Rapid', 'Focus', 'Mondeo', 'Octavia', 'B-Max'],
'car': ['Skoda', 'Skoda', 'Ford', 'Skoda', 'Ford', 'Ford', 'Skoda', 'Ford']
}
df = pd.DataFrame(data)
print(df.groupby(["car"]).mean())
自己動手試一試 »
定義和用法
groupby() 方法允許您對資料進行分組並對這些組執行函式。
語法
dataframe.transform(by, axis, level, as_index, sort, group_keys, observed, dropna)
引數
axis、level、as_index、sort、group_keys、observed、dropna 引數是關鍵字引數。
| 引數 | 值 | 描述 |
|---|---|---|
| by | 必需。一個標籤、一組標籤或一個用於指定如何分組 DataFrame 的函式。 | |
| axis | 0 |
可選。指定按哪個軸進行分組,預設為 0。 |
| level | level無 |
可選。指定是否按特定級別進行分組。預設為 None |
| as_index | True |
可選,預設為 True。如果結果不應使用組標籤作為索引,則設定為 False。 |
| 排序 | True |
可選,預設為 True。為提高效能,如果不希望對組鍵進行排序,則設定為 False。 |
| group_keys | True |
可選,預設為 True。如果不希望將組鍵新增到索引,則設定為 False。 |
| dropna | True |
可選,預設為 True。如果結果應包含組鍵為 NULL 值(空值)的行/列,則設定為 False。 |
返回值
一個 DataFrameGroupBy 物件,其中行/列已分組。