文件名称:一种基于混合索引的HDFS小文件存储策略 (2015年)
文件大小:2.37MB
文件格式:PDF
更新时间:2024-05-27 17:23:51
自然科学 论文
Hadoop分布式文件系统(hadoop distributed file system,HDFS)因其稳定高效?低成本等优势,已被很多大型企业广泛使用?针对HDFS海量小文件存储时元数据服务器节点内存开销过大,合并文件中小文件访问效率不高的问题,提出一种改进的基于混合索引的小文件存储策略,应用分类器分类标记小文件,并在元数据服务器建立H - B + 树索引,在存储节点根据小文件大小建立不同的块内索引,达到提高小文件访问效率的目标?实现中采用缓存结构,以提高客户端访问的响应速度,同时也有利于元数据服务器节