今天这篇推文,就是给大家总结一下我用pandas读取csv文件遇到的坑。
一直处理csv文件都是用pandas的read_csv函数读取csv文件之后处理,都没碰到过什么问题。But,But今天帮朋友处理csv文件时,读取一直错误。
首先文件长这样,(文件名为:重庆全量.csv):
首先,导入pandas包后,直接用read_csv函数读取报错OSError,如下:
运行之后没有报错,正在我欣喜之余,输出一下data.head()想看看数据时候,看到了心痛的感觉,数据乱码了。
然后,一通百度,解决方案是加上参数,encoding=‘utf-8’。结果,这回数据成这样了:
感受到我心累的感觉了吧。
后来我发现,两个解决方案:
第一个:关掉Anaconda,重启Anaconda之后再使用pd.read_csv()加上参数engine='python’之后就成功了(但是到现在还是没想明白为啥)。
第二个:将文件名改为英文名之后直接使用pd.read_csv()就成功了。
我们下次再见,如果还有下次的话!!!
【新浪微博@516数据工作室】
长按下方二维码关注"516数据工作室"