Neo4j作为图形数据库,有其独特的数据存储结构。
数据存储主要分为节点、关系、节点或关系上属性这三类数据存储,这些数据也可以通过Lucene进行存储检索。
一个节点共占9个byte,,格式
in_use(byte)+next_rel_id(int)+next_prop_id(int)
节点是否可用+最近一个关系的Id(-1表示无)+最近一个属性的Id(-1表示无)
通过每个节点Id号,很容易通过计算偏移量获取这个节点的相关数据。
Node[0,used=true,rel=9,prop=-1]
Node[1,used=true,rel=1,prop=0]
Node[2,used=true,rel=2,prop=2]
Node[3,used=true,rel=2,prop=4]
Node[4,used=true,rel=4,prop=6]
Node[5,used=true,rel=5,prop=8]
Node[6,used=true,rel=5,prop=10]
Node[7,used=true,rel=7,prop=12]
Node[8,used=true,rel=8,prop=14]
Node[9,used=true,rel=8,prop=16]
Node[10,used=true,rel=10,prop=18]
Node[11,used=true,rel=11,prop=20]
Node[12,used=true,rel=11,prop=22]
一个关系占33个byte,格式
directed|in_use(byte)+first_node(int)+second_node(int)+rel_type(int)+ first_prev_rel_id(int)+first_next_rel_id+second_prev_rel_id(int)+second_next_rel_id+next_prop_id(int)
是否可用+关系的头节点+关系的尾节点+关系类型+头节点的前一个关系Id+头节点的后一个关系id+尾节点的前一个关系Id+尾节点的后一个关系Id+关系的最近属性Id
其中节点的前一个或后一个关系Id,是怎么算出来的?
如果这个节点在添加关系过程中,如果是最初添加的则没有尾关系Id(-1表示),如果是最后一个关系则没有前一个关系Id(-1表示),中间添加的关系都应该有前一个和后一个关系Id,最终通过这些关系Id形成节点的关系列表。
Relationship[0,used=true,source=1,target=0,type=0,sPrev=1,sNext=-1,tPrev=3,tNext=-1,prop=1]
Relationship[1,used=true,source=2,target=1,type=1,sPrev=2,sNext=-1,tPrev=-1,tNext=0,prop=3]
Relationship[2,used=true,source=3,target=2,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=1,prop=5]
Relationship[3,used=true,source=4,target=0,type=0,sPrev=4,sNext=-1,tPrev=6,tNext=0,prop=7]
Relationship[4,used=true,source=5,target=4,type=1,sPrev=5,sNext=-1,tPrev=-1,tNext=3,prop=9]
Relationship[5,used=true,source=6,target=5,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=4,prop=11]
Relationship[6,used=true,source=7,target=0,type=0,sPrev=7,sNext=-1,tPrev=9,tNext=3,prop=13]
Relationship[7,used=true,source=8,target=7,type=1,sPrev=8,sNext=-1,tPrev=-1,tNext=6,prop=15]
Relationship[8,used=true,source=9,target=8,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=7,prop=17]
Relationship[9,used=true,source=10,target=0,type=0,sPrev=10,sNext=-1,tPrev=-1,tNext=6,prop=19]
Relationship[10,used=true,source=11,target=10,type=1,sPrev=11,sNext=-1,tPrev=-1,tNext=9,prop=21]
Relationship[11,used=true,source=12,target=11,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=10,prop=23]
一个属性默认占41个byte,格式
1/*next and prev high bits*/ +4/*next*/ + 4/*prev*/ + DEFAULT_PAYLOAD_SIZE /*property blocks*/;
是否可用+前一个属性Id+后一个属性Id+属性块32个字节
PropertyRecords形成一个双向链表,每一个持有一个或多个PropertyBlocks的实际的属性键/值对。因为PropertyBlocks长度是可变的,一个完整的PropertyRecord可以只是一个PropertyBlock。
属性块格式:属性类型(8B)+属性值(如果非基础类型占8B)
属性键与属性值分别存储在不同的文件中。
属性记录属于动态存储格式。
为什么属性块要32个字节,还得慢慢看!
32个字节只是系统默认的大小。
一个节点如果有多个属性,一个属性记录集无法存下则通过下一个属性Id存储,最终通过上下属性Id完成列表连接。
DEFAULT_PAYLOAD_SIZE 是动态可变的,基础类型占一个8B,动态类型是类型占8B,值占8B,
如果属性值大于默认长度,则需要动态存储,类似数据库BLOB字段的存储。
Neo4j通过属性的header 计算属性的类型与属性所占字节数,仍不知道怎么计算出????
PropertyStore.encodeValue方法对属性数据进行编码处理。
LongerShortString对字符、数字等短字符进行编码,是否DEFAULT_PAYLOAD_SIZE可以存储下当前属性值。
对长字符或动态属性数据则通过动态方式存储。
动态存储格式:(in_use+next high)(1 byte)+nr_of_bytes(3 bytes)+next_block(int)
是否有效+字符长度+下一个块Id
属性值的加载都是延迟加载,除非前端需要获取属性值才会读取属性值,否则不会加载属性值。
通过生成的neo4j文件,输出节点、关系、属性了解他们之间的关系,数据存储结构的关系。
Node[3,used=true,rel=2,prop=10]
header:1426063367 numBlocks:[1]
PropertyBlock[INT,key=7,value=5]
Property[10,used=true,prev=-1,next=9,PropertyBlock[INT,key=7,value=5]]
header:956301315 numBlocks:[1]
PropertyBlock[STRING,key=3,firstDynamic=3]
header:973078532 numBlocks:[1]
PropertyBlock[ARRAY,key=4,firstDynamic=3]
header:889192453 numBlocks:[1]
PropertyBlock[INT,key=5,value=3]
header:1157627910 numBlocks:[1]
PropertyBlock[INT,key=6,value=4]
Property[9,used=true,prev=10,next=8,PropertyBlock[STRING,key=3,firstDynamic=3],PropertyBlock[ARRAY,key=4,firstDynamic=3],PropertyBlock[INT,key=5,value=3],
DynamicRecord[3,used=true,light=true(99),type=0,data=null,next=-1]DynamicRecord[3,used=true,light=true(17),type=0,data=null,next=-1]
PropertyBlock[INT,key=6,value=4]]nextProp4294967295header:-3348670910683938816 numBlocks:[2]value block:1618PropertyBlock[SHORT_STRING,key=0,value=Cypher]header:371083010969174017 numBlocks:[1]PropertyBlock[SHORT_STRING,key=1,value=test]header:308431181316098 numBlocks:[1]PropertyBlock[SHORT_STRING,key=2,value=QQ]Property[8,used=true,prev=9,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=test],PropertyBlock[SHORT_STRING,key=2,value=QQ]]
Node[0,used=true,rel=9,prop=-1]
Node[1,used=true,rel=1,prop=0]
Property[0,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Neo122333],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[2,used=true,rel=2,prop=2]
Property[2,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Morpheus],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[3,used=true,rel=2,prop=4]
Property[4,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[4,used=true,rel=4,prop=6]
Property[6,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Neo122333],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[5,used=true,rel=5,prop=8]
Property[8,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Morpheus],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[6,used=true,rel=5,prop=10]
Property[10,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[7,used=true,rel=7,prop=12]
Property[12,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Neo122333],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[8,used=true,rel=8,prop=14]
Property[14,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Morpheus],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[9,used=true,rel=8,prop=16]
Property[16,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[10,used=true,rel=10,prop=18]
Property[18,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Neo122333],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[11,used=true,rel=11,prop=20]
Property[20,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Morpheus],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]
Node[12,used=true,rel=11,prop=22]
Property[22,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]