pd drop_duplicates返回结果count和to_csv的结果不一致

时间:2022-12-02 14:54:12


目的是从表中找出不重复的公司个数,一开始采用了drop_duplicates获取一个去重后的表,count()后发现是500多家,神奇的是当我将结果导入csv,发现只有不到100条。然后我采用groupby的方式获取分组结果,发现分组后的公司确实是500多家,导入csv与count的结果是一致的,这里记录一下,还没有解决。