選單
×
   ❮     
HTML CSS JAVASCRIPT SQL PYTHON JAVA PHP HOW TO W3.CSS C C++ C# BOOTSTRAP REACT MYSQL JQUERY EXCEL XML DJANGO NUMPY PANDAS NODEJS R TYPESCRIPT ANGULAR GIT POSTGRESQL MONGODB ASP AI GO KOTLIN SASS VUE DSA GEN AI SCIPY AWS CYBERSECURITY DATA SCIENCE
     ❯   

Pandas DataFrame duplicated() 方法

❮ DataFrame 參考


示例

檢查哪些行是重複的,哪些不是

import pandas as pd

data = {
  "name": ["John", "Mary", "John", "Sally", "Mary"],
  "age": [40, 30, 40, 50, 30],
  "city": ["Bergen", "Oslo", "Stavanger", "Oslo", "Oslo"]
}

df = pd.DataFrame(data)

s = df.duplicated()

print(s)
自己動手試一試 »

定義和用法

duplicated() 方法返回一個包含 True 和 False 值的 Series,用於描述 DataFrame 中的哪些行是重複的,哪些不是。

使用 subset 引數指定在查詢重複項時要包含哪些列。預設情況下,所有列都會被包含。

預設情況下,兩個或多個重複項中的第一個出現將被設定為 False。

keep 引數設定為 False,也會將第一個出現的項設定為 True。


語法

dataframe.duplicated(subset, keep)

引數

引數是 關鍵字引數

引數 描述
subset 列標籤 可選。一個字串或列表,包含在查詢重複項時要包含的列名。預設 subset=None(表示未指定子集,應包含所有列)。
keep 'first'
'last'
False
可選,預設為 'first'。指定如何處理重複項。
'first' 表示將第一個出現的項設定為 False,其餘設定為 True。
'last' 表示將最後一個出現的項設定為 False,其餘設定為 True。
False 表示將所有出現的項都設定為 True。

返回值

一個 Series,其中包含 DataFrame 中每一行的布林值。


更多示例

示例

只包含 "name" 和 "age" 列

s = df.duplicated(subset=["name", "age"])

print(s)
自己動手試一試 »

示例

將所有重複出現的項都設定為 True

s = df.duplicated(keep=False)

print(s)
自己動手試一試 »

❮ DataFrame 參考

×

聯絡銷售

如果您想將 W3Schools 服務用於教育機構、團隊或企業,請傳送電子郵件給我們
sales@w3schools.com

報告錯誤

如果您想報告錯誤,或想提出建議,請傳送電子郵件給我們
help@w3schools.com

W3Schools 經過最佳化,旨在方便學習和培訓。示例可能經過簡化,以提高閱讀和學習體驗。教程、參考資料和示例會不斷審查,以避免錯誤,但我們無法保證所有內容的完全正確性。使用 W3Schools 即表示您已閱讀並接受我們的使用條款Cookie 和隱私政策

版權所有 1999-2024 Refsnes Data。保留所有權利。W3Schools 由 W3.CSS 提供支援