WebCorpus:用于大型网络语料库的可扩展处理的 Hadoop 框架-开源

时间:2024-07-28 08:16:26
【文件属性】:

文件名称:WebCorpus:用于大型网络语料库的可扩展处理的 Hadoop 框架-开源

文件大小:26.06MB

文件格式:JAR

更新时间:2024-07-28 08:16:26

开源软件

WebCorpus 是一个基于 Hadoop 的框架,使您能够计算从网络爬行中提取的大型网络语料库的统计数据。


网友评论