Classifier:文本文档分类模型

时间:2024-05-19 10:41:49
【文件属性】:

文件名称:Classifier:文本文档分类模型

文件大小:3KB

文件格式:ZIP

更新时间:2024-05-19 10:41:49

JavaScript

已归档 我十二岁那年写的。 它很慢,不准确,不应该使用。 文字分类 这是一种可以训练以对文本进行分类的算法。 它使用以下逻辑工作: 训练: 将给定的记录拆分为每个可能的n-gram(例如,“这是一个例子”将变为“这”,“是”,“一个”,“例子”,“这是”,“是”,“例子” ,“这是一个例子”,“这是一个例子”,“这是一个例子”)。 存储每个n-gram及其在每个类的文档中出现的次数。 分类: 在目标文档中找到该模型之前已看到的每个n-gram。 使用目标文档中每个n-gram出现在该班级中的次数计算每个班级的得分。 归一化所有分数,使其总和为1.0。 训练 var Classifier = require ( 'Smallclassifier' ) ; var classifier = new Classifier ( ) ; classifier . train ( 'He


【文件预览】:
Classifier-master
----package.json(403B)
----README.md(1KB)
----classifier.js(4KB)

网友评论