文件名称:PHP使用自定义码表查询汉字拼音
文件大小:27KB
文件格式:RAR
更新时间:2014-11-28 10:22:40
PHP 码表 汉字 拼音 反查
通过汉字GBK码计算出汉字的区位码,目前仅使用了GB2312的6763个汉字。实现了多音的查询。 如“啊”,其GBK码:45217,区位码:1601,因此可以通过第16区,第01位快速定位其位置。 每个正常读音(第一次出现的读音)占4个字节,前两个表示其读音的个数及在多音块中的偏移,后两位表示其读音的位置。 拼音部分为不定长,从其读音的位置先读1个字节,表示其拼音长度,再读出相应的拼音后还原。
【文件预览】:
根据码表查拼音.php
pymb.txt
码表.php
mb.bin