hadoop讲义

时间:2021-09-04 01:20:10
【文件属性】:

文件名称:hadoop讲义

文件大小:4.91MB

文件格式:DOCX

更新时间:2021-09-04 01:20:10

flume

2004年,开发一款搜索引擎,nutch。nutch基于Lucence实现的搜索引擎,能够从互联网上抓取网页数据。抓取来的海量数据的存储问题。但是,这些海量数据都是非结构化数据,不能存在关系型数据库里。如果连数据的存储和管理都解决不了的话,就谈不上后续为用户提供搜索服务,包括通过算法去优化检索速度


网友评论