大规模分布式存储系统读书笔记前三章(未完)

时间:2021-02-13 21:51:10

第一章:概述

2.分布式存储分类:
非结构化数据: 所有格式的办公文档,文本,图片,图像,音频…
结构化数据: 一般存储在关系型数据库里,可以用二维关系表描述
半结构化数据: 介于结构化数据和非结构化数据之间,html文档就属于半结构化数据。
分布式文件系统: 存放Blob(二进制大对象),定长块,大文件;常作为分布式表格系统和分布式数据库的底层存储
分布式键值系统: 一般做缓存,存放半结构化数据,支持CRUD;一致性哈希是常用的数据分布技术;是分布式表格系统的简单实现
分布式表格系统: 支持CRUD,还支持简单的范围查询(一般存放半结构化数据,只能执行简单的单表查询);支持简单的事务(单行事务),多个数据航也不要求包含相同类型的列
分布式数据库: 存放结构化数据,支持CRUD,支持多表查询和嵌套查询,支持事务和并发控制

第二章:单机存储引擎

2.单机存储引擎
1)哈希存储引擎