论文研究-面向CDN网络的高效海量数据分发机制研究.pdf

时间:2022-10-02 15:19:37
【文件属性】:

文件名称:论文研究-面向CDN网络的高效海量数据分发机制研究.pdf

文件大小:541KB

文件格式:PDF

更新时间:2022-10-02 15:19:37

论文研究

现行的子串归并算法都是采用一对一的方式针对同频子串提出的。但是在使用词法分析工具对文本进行切分时,不可避免地会产生很多的分词碎片,这直接导致了很多无意义子串的产生。通过分析这些无意义子串和众多父串之间的这种一对多关系,提出了一种基于独立性统计的子串归并算法。最后将该子串归并算法应用在中文术语抽取系统中,使得系统的准确率从91.3%提升到了93.32%。


网友评论