python去重函数是什么

数据去重可以使用duplicated()和drop_duplicates()两个方法。

DataFrame.duplicated（subset = None，keep =‘first’）返回boolean Series表示重复行

参数：

subset：列标签或标签序列，可选

仅考虑用于标识重复项的某些列，默认情况下使用所有列

keep：{‘first’，‘last’，False}，默认’first’

first：标记重复，True除了第一次出现。

last：标记重复，True除了最后一次出现。

错误：将所有重复项标记为True。