文件名称:unidecode:从 Unicode 到 US-ASCII 和 ISO 8859-2 的音译
文件大小:128KB
文件格式:ZIP
更新时间:2024-07-04 12:24:40
Java
单解码 Unidecode 是 Perl 库的 Java 端口,用于解决将 Unicode 文本音译为 US-ASCII 的问题。 此实现不仅限于 ASCII 字符,目前还支持 ISO-8859-2(又名拉丁文 2)并且可以轻松扩展到更多字符集(欢迎提供)。 请注意,这只是一种快速而肮脏的音译方法,它不是灵丹妙药! 从 Sean M. Burke 的原始 Text::Unidecode 中阅读有关其限制的详细。 如何使用 音译为 ASCII Unidecode unidecode = Unidecode . toAscii(); unidecode . decode( " České „uvozovky“ " ); >>> Ceske " uvozovky " unidecode . decode( " 42 ≥ 24 " ); >>> 42 >= 24 unidecode . d