数据库表的拆分,根据不同的业务分为垂直拆分和水平拆分:
垂直拆分
垂直拆分是指数据列的拆分,把一张列比较多的表拆分为多张表。垂直拆分更多时候就应该在数据表设计之初就
执行的步骤,然后查询的时候用join关联起来即可。
拆分原则:
1.把不常用的字段单独放在一张表;
2.把text,blob等大字段拆分出来放在附件表中;
3.经常组合查询的列放在一张表中。
水平拆分
水平拆分是指数据表行的拆分,表的行数超过200万行时,就会变慢,这时可以把一张表的数据拆成多张表来存
放。进行水平拆分后的表,字段的列和类型和原表应该是相同的,但是要记得去掉auto_increment自增长。
拆分原则:
1.表数据量很大,分割后可以降低在查询时需要读的数据和索引的页数,同时也降低了索引的层数,加快索引速
度。
2.表中的数据本来就有独立性,例如表中分别记录各个地区的数据或不同时期的数据,特别是有些数据常用,而
另外一些数据不常用。
3.需要把数据存放到多个介质上。
4.需要把历史数据和当前的数据拆分。
拆分方式:
通常情况下,我们采用取模的方式来进行表的拆分。比如一张有400万的用户表users,为提高其查询效率我们把
其分成4张表user1,user2,user3,user4.通过用ID取模的方法把数据分散到四张表内 Id%4 +1 =[1,2,3,4]。 然后查
询、更新、删除也是通过取模的方法来进行。
在insert时还需要一张临时表uid_temp来提供自增的ID,该表的唯一用处就是提供自增的ID。得到自增的ID后,
又通过取模法进行分表插入。
总结
部分业务逻辑也可以通过地区,年份等字段来进行归档拆分。
进行拆分后的表,只能满足部分查询的高效查询需求,这时我们就要在产品策划上,从界面上约束用户查询行
为。比如我们是按年来进行归档拆分的,这时在页面设计上就约束用户必须要先选择年,然后才能进行查询。
在做分析或者统计时,由于是自己人的需求,多点等待其实是没有关系的,并且并发很低。这时可以用union把所
有表都组合成一张视图来进行查询。