文件名称:js-stemmer-comparison:比较各种英语词干分析器的性能和结果
文件大小:4KB
文件格式:ZIP
更新时间:2024-06-11 13:08:20
JavaScript
node.js词干比较 比较各种英语词干的性能和结果: (供参考) TODO:使停用词期望统一。 指示 安装各种词干依赖项: npm i 使用分析配置创建ElasticSearch索引: ./create_es_index.sh 如果您不想运行ElasticSearch,请将其从index.js删除。 逐行将文本数据源通过管道传递到脚本中: .../my_data_source | node index.js 当建议使用管道输送。 样品输出 来自统一的英语新闻文本: 176878 lines processed: Times: ES=100% natural.Porter=36.86% natural.Lancaster=16.31% lancaster=6.14% snowball=7.54% porter=6.43% stm=54.09% nlp.porter=4
【文件预览】:
js-stemmer-comparison-master
----benchmark.js(3KB)
----README.md(2KB)
----create_es_index.sh(896B)
----index.js(3KB)
----package.json(452B)