文件名称:nlp-course:csc nlp课程作业
文件大小:1.92MB
文件格式:ZIP
更新时间:2024-07-14 09:56:29
Java
hw1. 将文本解析为句子 src 单元测试(解析器成功“获取”的文本示例): : 语料库结果:F1 = 0.985,精度 = 0.988,召回率 = 0.982,准确度 = 0.985,tp = 8205955,fp = 96511,fn = 145627 hw01_data 结果:F1 = 0.980,精度 = 0.975,召回率 = 0.986,准确度 = 0.980,tp = 85468,fp = 2172,fn = 1170 由于错误的框架,有很多问题,在大数据上,甚至很明显你不能专注于引号 - 我禁用了这个功能。 目前尚不清楚缩写后的大写字母如何处理。 hw2。 按主题对新闻进行排序 在我的集合(4x10 = 40 个文档)中,卡方只给出了 3 个属性,这还不够。 尝试对所有属性进行分类在 SMO 中仅产生 20% 的准确率。 我没有看别人,我开始改进功能。 我