chai:汉字自动分解系统开发

时间:2024-03-31 11:07:02
【文件属性】:

文件名称:chai:汉字自动分解系统开发

文件大小:253KB

文件格式:ZIP

更新时间:2024-03-31 11:07:02

系统开源

昔有仓颉作书,天雨粟,鬼夜哭;今有落萧拆字,以程序之力,解世纪难题。时值元旦,万象更新,特奉上「汉字自动分割系统」1.0,以飨编码者! 自上世纪七十年代以来,无数的汉字编码方案交替不同的作者提出,发展,兴盛或衰亡。今天,计算机的运算能力得到了空前的发展,而其在汉字编码方案中应用的潜力从未被充分挖掘,压缩编码方案的作者仍然在使用人工分割的方式对汉字编码。人工分割的任务量繁重,增删一个字根就需要替换多处分解结果进行替换,这大大降低了编码优化的效率。因此,自动化程度的提高,已经成为当前汉字编码方案发展的重大问题。 “汉字自动拆分系统”就是为了解决这一难题而又产生了。总览众多现有方案的细分特点,我们抽象出了一套通用的汉字拆分框架,通过枚举可能字根的方式最大程度地满足不同方案的需求,采用细分规则以组件化的形式集成在框架中,方便用户进行调用。 现在,您只需要在配置文件中指定您的汉字编码方案所使用的字


【文件预览】:
chai-master
----setup.py(783B)
----.gitignore(166B)
----requirements.txt(871B)
----LICENSE(34KB)
----doc()
--------api()
--------_templates()
--------index.rst(946B)
--------conf.py(3KB)
--------_static()
--------user()
--------developer()
----awesome()
----.gitmodules(83B)
----.github()
--------workflows()
----README.md(5KB)
----pychai()
--------core()
--------data()
--------__init__.py(76B)
--------util()
--------preset()
--------base()
--------logger()
----.gitattributes(194B)
----test()
--------__init__.py(0B)
--------util()
--------base()
----.editorconfig(184B)

网友评论