使用friso中文分词注意

时间:2023-03-09 00:26:15
使用friso中文分词注意

friso是使用c语言开发的一款中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。目前只支持
UTF-8 编码。 源码无需修改就能在各种平台下编译使用,加载完20万的词条,内存占用稳定为13.5M。
官方首页: https://code.google.com/p/friso
下载地址: https://code.google.com/p/friso/downloads/list

C++等引用,添加头文件时要注意:

extern "C"
{
#include "friso_API.h"
#include "friso.h"
}

friso中的字典等最好不要使用中文路径,否则很悲催。