Python2.X UNICODE, UTF-8转换

时间:2021-03-09 20:17:04
# UTF-8
content = u'\xe5\xb1\x82\xe5\x8f\xa0\xe6\xa0\xb7\xe5\xbc\x8f\xe8\xa1\xa8' # UTF-8 编码
content  # u'\xe5\xb1\x82\xe5\x8f\xa0\xe6\xa0\xb7\xe5\xbc\x8f\xe8\xa1\xa8'  # UNICODE 
print content # å±å æ ·å¼è¡¨ # 打印乱码

content.encode('latin1') # '\xe5\xb1\x82\xe5\x8f\xa0\xe6\xa0\xb7\xe5\xbc\x8f\xe8\xa1\xa8'

content.encode('latin1').decode('utf8') # u'\u5c42\u53e0\u6837\u5f0f\u8868'
print(content.encode('latin1').decode('utf8')) # 层叠样式表