海量数据topk问题1

时间:2022-08-04 13:43:05
【文件属性】:

文件名称:海量数据topk问题1

文件大小:248KB

文件格式:PDF

更新时间:2022-08-04 13:43:05

机器学习 html

第一步,都是按照数字/词语hashcode将大文件拆分成小文件 第二步:用HashMap统计词频, 最小堆对每个文件求topk(多线程优化) 第三步:合并top


网友评论