unidecode:Unicode文本的ASCII音译-GitHub镜像

时间:2024-05-21 13:56:57
【文件属性】:

文件名称:unidecode:Unicode文本的ASCII音译-GitHub镜像

文件大小:245KB

文件格式:ZIP

更新时间:2024-05-21 13:56:57

Python

Unicode文本的Unidecode,有损ASCII音译 通常,您有采用Unicode的文本数据,但是您需要用ASCII表示它。 例如,当与不支持Unicode的旧代码进行集成时,或者为了便于在美国键盘上输入非罗马名称时,或者从仍易于理解的人类可读Unicode字符串构造ASCII机器标识符时。 一个流行的例子是从文章标题中创建一个URL段。 Unidecode不能代替完全支持Unicode的程序字符串。 它的使用有很多警告,特别是当其输出对用户直接可见时。 在项目中使用Unidecode之前,请阅读本自述文件的其余部分。 在上面列出的大多数示例中,您可以将Unicode字符表示为??? 或\\15BA\\15A0\\1610 ,以提及两种极端情况。 但这对于真正想要阅读文本内容的人来说几乎是没有用的。 Unidecode提供的是一条中间路线:函数unidecode()接收Unic


网友评论