将字符串从xmlcharrestplace转换回utf-8。

时间:2021-06-30 20:13:40

I've next part of code:

我的下一部分代码:

In [8]: st = u"опа"

In [11]: st.encode("ascii", "xmlcharrefreplace")
Out[11]: 'опа'

In [14]: st1 = st.encode("ascii", "xmlcharrefreplace")

In [15]: st1.decode("ascii", "xmlcharrefreplace")
Out[15]: u'опа'

In [16]: st1.decode("utf-8", "xmlcharrefreplace")
Out[16]: u'опа'

Do you have any idea how to convert st1 back to u"опа"?

你知道如何将相约回到你“опа”?

1 个解决方案

#1


15  

Using an instance of HTMLParser.HTMLParser():

使用HTMLParser.HTMLParser()的一个实例:

>>> from HTMLParser import HTMLParser
>>> parser = HTMLParser()
>>> parser.unescape('опа')
u'\u043e\u043f\u0430'
>>> print parser.unescape('опа')
опа

#1


15  

Using an instance of HTMLParser.HTMLParser():

使用HTMLParser.HTMLParser()的一个实例:

>>> from HTMLParser import HTMLParser
>>> parser = HTMLParser()
>>> parser.unescape('опа')
u'\u043e\u043f\u0430'
>>> print parser.unescape('опа')
опа