tagrelator:Java编程项目

时间:2024-05-24 10:44:57
【文件属性】:

文件名称:tagrelator:Java编程项目

文件大小:353KB

文件格式:ZIP

更新时间:2024-05-24 10:44:57

Java

标签相关器 这是大学中一个编程项目的结果。 该方法取自可以在此处找到的论文。 目的是计算表达其含义相似性的一对单词的分数。 对于像猫-老虎这样的对,分数应该相当高,这意味着这两个词描述的概念相似,而对于像猫-老虎这样的对,分数应该是相当低的。 利用对大量书面文本的统计分析,可以自动计算分数。 得分背后的假设是,含义相似的单词也具有相似的上下文。 上下文是在书面文本中出现之后出现的单词。 这就是为什么需要大量文本来查找目标词的出现并查看其上下文的原因。 对于从这些上下文收集的数据,应用了两个度量PMI-逐点互信息和SOC-PMI-二阶共生PMI来计算一对单词的相似性得分。 对于编程项目,采用了本文中的方法。 此外,它已被移植到Flickr照片标签的新领域。 这主要包括在Flickr和存储上实现数据收集。 Java类 该项目已开发并作为一个整体使用,尽管我尝试以某些类可以单独使用的


网友评论