文件名称:海量数据topk问题1
文件大小:248KB
文件格式:PDF
更新时间:2022-08-04 13:43:05
机器学习 html
第一步,都是按照数字/词语hashcode将大文件拆分成小文件 第二步:用HashMap统计词频, 最小堆对每个文件求topk(多线程优化) 第三步:合并top
文件名称:海量数据topk问题1
文件大小:248KB
文件格式:PDF
更新时间:2022-08-04 13:43:05
机器学习 html
第一步,都是按照数字/词语hashcode将大文件拆分成小文件 第二步:用HashMap统计词频, 最小堆对每个文件求topk(多线程优化) 第三步:合并top