文件名称:基于Nutch中文分词的研究与实现
文件大小:2.64MB
文件格式:DOC
更新时间:2018-11-15 03:43:03
爬虫 搜索引擎 Nutch 中文分词技术
作为舆情监测系统的一部分,本文的目标是基于Nutch,同时,结合目前最常用中文分词技术,根据不同的中文分词方法,实验并得出不同分词方法在性能以及使用环境上的优缺点,以此为舆情监测系统选择合适的中文分词方法,为系统下一步的实现打下基础。
文件名称:基于Nutch中文分词的研究与实现
文件大小:2.64MB
文件格式:DOC
更新时间:2018-11-15 03:43:03
爬虫 搜索引擎 Nutch 中文分词技术
作为舆情监测系统的一部分,本文的目标是基于Nutch,同时,结合目前最常用中文分词技术,根据不同的中文分词方法,实验并得出不同分词方法在性能以及使用环境上的优缺点,以此为舆情监测系统选择合适的中文分词方法,为系统下一步的实现打下基础。