文件名称:random-drift:从 code.google.comprandom-drift 自动导出
文件大小:21KB
文件格式:ZIP
更新时间:2024-06-20 05:11:21
Java
随机漂移 Random-drift 是一个基于随机投影和小波的语义分类库。 该库的主要目的是在语义搜索/分类的上下文中提供增量索引,这是其他方法(如潜在语义分析实现)不提供的。 仅支持分类,目前的搜索虽然可行,但无法扩展,因为每个查询都需要完整的索引扫描。 这应该是一个面向可扩展性的简单实现。 有关更全面的实现,请查看语义向量( )。 当前的实现是基于 lucene(使用版本 3.6.2)索引的随机向量索引。 矢量分类有以下缺点: 训练类别或类别所需的正数数量随着类别/类别数量的增加而增加。 类别的训练随着内容的变化而变得陈旧,例如,与新闻内容一样。 今天用于训练类别的文档可能会在几周后与相同上下文中术语的实际出现不同步 语义分类系统的价值主要取决于为向量分类系统的上述局限性提供解决方案
【文件预览】:
random-drift-master
----README.md(1KB)
----src()
--------org()