PHP使用自定义码表查询汉字拼音

时间:2014-11-28 10:22:40
【文件属性】:

文件名称:PHP使用自定义码表查询汉字拼音

文件大小:27KB

文件格式:RAR

更新时间:2014-11-28 10:22:40

PHP 码表 汉字 拼音 反查

通过汉字GBK码计算出汉字的区位码,目前仅使用了GB2312的6763个汉字。实现了多音的查询。 如“啊”,其GBK码:45217,区位码:1601,因此可以通过第16区,第01位快速定位其位置。 每个正常读音(第一次出现的读音)占4个字节,前两个表示其读音的个数及在多音块中的偏移,后两位表示其读音的位置。 拼音部分为不定长,从其读音的位置先读1个字节,表示其拼音长度,再读出相应的拼音后还原。


【文件预览】:
根据码表查拼音.php
pymb.txt
码表.php
mb.bin

网友评论

  • 对多音字的支持很不错,是属于gb2312编码的,需要自己转换才能支持utf8的汉字。