文件名称:用lucene实现摘要的高亮点
文件大小:132KB
文件格式:DOC
更新时间:2012-09-16 18:24:53
Lucene 自动摘要 高亮
类主要是符合本人项目的需求,内容摘要的高亮点实现没这么复杂,此类中不仅仅包含了内容的高亮点实现,还包含了获取xml内容和html纯文本的提取。注意一点的是在对内容进行高亮度化的过程中,其实也就是进行全文检索的过程,所以对文本内容进行分词是必不可少的。否则将无法找到文本中对应的关键词。详细请看类的实现
文件名称:用lucene实现摘要的高亮点
文件大小:132KB
文件格式:DOC
更新时间:2012-09-16 18:24:53
Lucene 自动摘要 高亮
类主要是符合本人项目的需求,内容摘要的高亮点实现没这么复杂,此类中不仅仅包含了内容的高亮点实现,还包含了获取xml内容和html纯文本的提取。注意一点的是在对内容进行高亮度化的过程中,其实也就是进行全文检索的过程,所以对文本内容进行分词是必不可少的。否则将无法找到文本中对应的关键词。详细请看类的实现