文件名称:JAVA源码文本-Text-Summarizer:基于开源Java的文本汇总算法
文件大小:4KB
文件格式:ZIP
更新时间:2024-06-09 20:12:04
系统开源
JAVA原始码文字摘要 基于开源Java的文本汇总算法 我的Android应用程序中使用了此文本摘要程序,该应用程序名为“ SumIt!Text Summarizer”。 我一直在努力改善从此算法/实现中获得的结果。 这是我自己的实现。 它的目的不仅是支持粘贴/传递的大块文本,而且还支持在线URL中的文本(这意味着正确删除和格式化文本)。 回到我最初进行此操作时,它实际上仅支持文本。 但是现在我向有兴趣的人开放。 对于那些想要修改或改进它的人。 这是您可以尝试的方法 只需调用Summarize(String text,int maxSummarySize)方法。 输入您的文本,然后输入您希望摘要的句子数。 运作方式如下 首先记录文本中单词的原始频率。 理想情况下,地图对此最有效。 接下来,将过滤掉Map中的所有停用词; 从而减少冗余并仅保留某些关键短语和单词。 之后,从最大词频到最小词频对Map进行排序。 然后,从原始文本中获取句子,对其进行格式化,并确保带句点或小数的任何缩写和后缀均不算作句子的结尾。 接下来,对于在线文本,我们需要对其进行格式设置和调整,以便删除某些不需要的文本。
【文件预览】:
Text-Summarizer-master
----Summarizer.java(8KB)
----README.md(2KB)