python 如何把中文编码转换为UTF-8的编码

时间:2021-05-27 08:44:09
读取一个文件,然后开始转换编码格式 

我写的有错误
from BeautifulSoup import BeautifulSoup          # For processing HTML
import os
import sys
fp = open('2.htm','r')
html = fp.read()
#htmp_utf = unicode(html, "gbk").encode("utf8")
soup = BeautifulSoup(html_utf)
print soup.prettify()


我希望有大大 可以考虑更多的情况 ,当编码不是gbk 或其他编码的时候  写一个完善的函数 来进行转换

3 个解决方案

#1


在第一行加上
# encoding:utf-8

#2


引用 1 楼 rabbitlbj 的回复:
在第一行加上
# encoding:utf-8

额 这个不行吧 

#3


这个是一楼的宝典。不管什么问题,不管什么现象,只要和中文有关的,加上之后应该就能解决问题。如果这都不能解决问题,他会来CSDN发帖的。

#1


在第一行加上
# encoding:utf-8

#2


引用 1 楼 rabbitlbj 的回复:
在第一行加上
# encoding:utf-8

额 这个不行吧 

#3


这个是一楼的宝典。不管什么问题,不管什么现象,只要和中文有关的,加上之后应该就能解决问题。如果这都不能解决问题,他会来CSDN发帖的。