文件名称:Classifier:文本文档分类模型
文件大小:3KB
文件格式:ZIP
更新时间:2024-05-19 10:41:49
JavaScript
已归档 我十二岁那年写的。 它很慢,不准确,不应该使用。 文字分类 这是一种可以训练以对文本进行分类的算法。 它使用以下逻辑工作: 训练: 将给定的记录拆分为每个可能的n-gram(例如,“这是一个例子”将变为“这”,“是”,“一个”,“例子”,“这是”,“是”,“例子” ,“这是一个例子”,“这是一个例子”,“这是一个例子”)。 存储每个n-gram及其在每个类的文档中出现的次数。 分类: 在目标文档中找到该模型之前已看到的每个n-gram。 使用目标文档中每个n-gram出现在该班级中的次数计算每个班级的得分。 归一化所有分数,使其总和为1.0。 训练 var Classifier = require ( 'Smallclassifier' ) ; var classifier = new Classifier ( ) ; classifier . train ( 'He
【文件预览】:
Classifier-master
----package.json(403B)
----README.md(1KB)
----classifier.js(4KB)