'\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1' , 这个是课题里遇到的问题, 在招聘数据的薪水这一栏处理的时候有UnicodeError, 所以无法把str的薪水转换成int, 最后找到了这个字符串, 正因为有它, 所以才报错的, 但是他是什么中文? Python小白表示完全不知道。。。
data = qcwy_df.salary[qcwy_df.salary.str.contains('\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1', na=False)]
print data.index
这样试也不行, 只能转换成中文再找。。。
网上也没搜到, 最后竟然试出来了, print unicode('\xe5\x8c\x97\xe4\xba\xac\xe6\x96\xb0\xe5\x8d\x8e\xe7\x94\xb5\xe8\x84\x91\xe5\xad\xa6\xe6\xa0\xa1', 'utf-8')即可。