文件名称:麻将:开源中文分词工具包,中文分词Web API,Lucene中文分词,中英文混合分词
文件大小:14.9MB
文件格式:ZIP
更新时间:2024-02-26 14:31:27
go hmm scala deep-learning crf
麻将中文分词 简介 麻将一直是广受欢迎的传统娱乐活动,字牌的组合千变万化。汉字的组合也是变化多端,麻将这个项目希望能从汉字组合中发现汉语的秘密,为自然语言处理提供好的中文分词工具。 麻将是基于Scala的语言实现的中文分词软件包。这个项目的核心是最大概率分词,整个项目专为搜索引擎,文本信息抽取和自然语言处理设计,参考我来实现。性能优异,速度快。整个分词包易于使用,测试覆盖率高。 在线展示 :链接 ,您可以自己测试它的功能。有任何问题,可以发邮件至: 。 分词歧义解决方案 分词的方法有很多,现在越来越多的研究认为分词是一个的序列标注问题。但是基于字典的方法速度快,容易快速应用在领域应用中。