文件名称:jchardet-1.1jchardet-1.1jchardet-1.1
文件大小:84KB
文件格式:ZIP
更新时间:2012-12-14 11:31:36
jchardet-1.1 字符编码识别
jchardet-1.1 字符编码识别jchardet-1.1 字符编码识jchardet是mozilla自动字Java字符串(及字符)类以Unicode编码保存数据。当处理来自外部的国际性文本时,我们需要提供关于这些文本的编码,以便准确地将它们转换为 Unicode。这意味着你必须知道你的java代码要处理的所有文件的编码。许多基于Internet的Java应用程序,要处理来自随机数据源的数据,而很多数据的编码不能确切的知道。例如,一个HTML页面中的数据,如果没有元数据标签明确地指定页面的字符集,就很难确实其编码,将其转换为 Java Unicode字符串时也会误用而终止。符集探测算法代码的
【文件预览】:
jchardet-1.1
----ASCII码表.txt(9KB)
----LICENSE(25KB)
----dist()
--------lib()
----src()
--------nsDetector.java(3KB)
--------Big5Statistics.java(11KB)
--------nsISO2022JPVerifier.java(10KB)
--------nsPSMDetector.java(11KB)
--------nsUCS2BEVerifier.java(11KB)
--------nsISO2022KRVerifier.java(10KB)
--------nsHZVerifier.java(10KB)
--------EUCJPStatistics.java(11KB)
--------GB2312Statistics.java(11KB)
--------HtmlCharsetDetector.java(4KB)
--------nsCP1252Verifier.java(10KB)
--------EUCTWStatistics.java(10KB)
--------nsICharsetDetector.java(2KB)
--------nsEUCStatistics.java(2KB)
--------nsEUCTWVerifier.java(10KB)
--------nsSJISVerifier.java(10KB)
--------nsUTF8Verifier.java(15KB)
--------nsGB18030Verifier.java(10KB)
--------nsEUCSampler.java(5KB)
--------nsEUCKRVerifier.java(9KB)
--------nsEUCJPVerifier.java(10KB)
--------nsUCS2LEVerifier.java(11KB)
--------nsBIG5Verifier.java(10KB)
--------nsVerifier.java(3KB)
--------nsICharsetDetectionObserver.java(2KB)
--------EUCKRStatistics.java(11KB)
--------nsISO2022CNVerifier.java(11KB)
--------nsGB2312Verifier.java(9KB)
----build.xml(1KB)