【转】MySQL数据库原理

原文地址：http://www.cnblogs.com/qiuyi116/p/4349233.html

　　我们知道，数据是信息的载体——一种我们约定了如何解释的符号。在计算机系统中，最常见的应该是文本数据。我们用它记录配置信息，写日志，等等。而在应用程序中，按一定的数据结构来组织数据的方式叫做数据库管理系统(DBMS)。数据库就是把数据按照一定的规则，有效的组织存放，以提供更高效、更便捷的数据访问和处理。要理解数据库原理，并使用数据库，需要理解三点内容：1>数据库的数据组织的方式；2>数据库的逻辑架构及物理实现；3>数据库客户端的操作方法。也许，对于使用数据库来说，只需要掌握最后一点，即操作方法就可以了。但是，一个只能掌握具体操作，而无法理解领会为何要这么操作，及这些操作是为何操作的人，不过是个熟练的技术工。因为具体的操作，是一项技能，是“术”的层面的东西；而原理是“道”的层面的东西。一门技术，可能兴盛，也可能被淘汰，但原理是不会过时和被淘汰的。比如，8086处理器的指令，可以多数已经过时了，但是它的设计思想，确实永远不会过时的。

　　先说说数据库的数据结构。我们日常所用的文本文件，是按字节顺序存储的。要找到一个文本中的某些特定的信息，必须通过文本流的方式，从头到尾一字节一字节的将文本扫描。这种效率，平时写写脚本，理解练习I/O原理是可以的。但实际应用中，显然是不现实的。比如腾讯的几亿人的QQ号的数据，要是使用纯文本来存储，每个人登录时，岂不是都要将整个文件扫描一次？

　　在数据库中，用到的数据结构是——B-Tree。要了解B-Tree，我们先来了解一些二叉查找树(Binary Search Tree)。二叉查找树是一种查找高效的数据结构。二叉查找树有三个特点：1>每个节点最多只有两个子树；2>左子树的值总是小于父节点，右子树的值总是大于父节点；3>在二叉查找树中找到一个数据，平均只需要logN次比较。

【转】MySQL数据库原理　　　　　　　　　　　　　　　　　　图1——二叉查找树

　　但是二叉查找树因为每一层最多只能有两个节点，大量的数据存放会导致层次太深。而数据的实际存放是通过文件系统存储在硬盘上的。我们知道，硬盘这个I/O外设的访问速度和内存的速度比起来，差的可是N多数量级啊。所以，访问硬盘的次数越少越好。而二叉查找树的过深的层次结构导致访问硬盘的次数剧增。所以，才有了B-Tree这个数据结构，用以组织数据库中的数据。B-Tree也有三个特点：1>一个节点可以容纳多个值；2>除非本层数据已经填满，否则不会开辟新的层；3>子节点中的值，与父节点中的值，有严格的大小对应关系。如下图：

【转】MySQL数据库原理　　　　　　　　　　　　　　　　　图2——B-Tree

　　因此，当使用B-Tree时，只需要2层就可以实现1万的数据存储。而使用二叉查找树则需要10层。同时，B-Tree具备二叉查找树的高效查找特性。当进行查找操作时，使用B树只需2次读取硬盘进行比较就可以了。而使用二叉查找树则需要10次读取硬盘进行比较。所以，B树的效率更高。

　　说了数据库的数据结构，在说说后面两个内容。以用得比较广泛的LAMP开源轻架构中的MySQL为例，说说MySQL的逻辑结构。MySQL由Client和Server构成，是典型的C/S架构。1>在实际应用中，充当Client通常是第三方应用(Python, PHP, Perl等)中的MySQL驱动。2>与Client通信的部分叫做连接池(connection pool)，主要负责“Client”与Server的连接以及验证等。以本地socket通信和TCP/IP通信实现连接与验证。3>然后是核心层，负责提供SQL接口和查询缓存，以及查询的优化和部分内部函数的执行。4>再后是存储引擎层，真正负责数据的存储和提取。有多种存储引擎，提供不同的功能。5>最后是数据存储层，真正把数据存储在文件系统中。

【转】MySQL数据库原理

【转】MySQL数据库原理的更多相关文章

MySQL数据库原理
我们知道,数据是信息的载体——一种我们约定了如何解释的符号.在计算机系统中,最常见的应该是文本数据.我们用它记录配置信息,写日志,等等.而在应用程序中,按一定的数据结构来组织数据的方式叫做数据库管理系 ...
zabbix利用自带的模板监控mysql数据库
zabbix利用自带的模板监控mysql数据库作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 有些东西你不会的时候觉得它特别难,但是当你去做的时候就发现如此的简单~zabbix功能 ...
Xtrabackup原理及使用innobackupex进行MySQL数据库备份恢复
Xtrabackup是由percona提供的mysql数据库备份工具,据官方介绍,这也是世界上惟一一款开源的能够对innodb和xtradb数据库进行热备的工具. Xtrabackup中主要包含两个工 ...
使用Memcache缓存mysql数据库操作的原理和缓存过程浅析
转载自脚本之家 http://www.jb51.net/article/51831.htm 作者:忙碌的松鼠对于大型网站如facebook,ebay等网站,如果没有Memcache做为中间缓存层, ...
烂泥：学习mysql数据库主从同步复制原理
本文由秀依林枫提供友情赞助,首发于烂泥行天下. 说明本篇文章部分转载自互联网. MySQL的Replication(英文为复制)是一个多MySQL数据库做主从同步的方案,特点是异步复制,广泛用在各种对 ...
MySQL数据库InnoDB存储引擎多版本控制(MVCC)实现原理分析
文/何登成导读: 来自网易研究院的MySQL内核技术研究人何登成,把MySQL数据库InnoDB存储引擎的多版本控制(简称:MVCC)实现原理,做了深入的研究与详细的文字图表分析,方便大家理解I ...
MySQL执行原理，逻辑分层、更改数据库处理引擎
MySQL执行原理,逻辑分层.更改数据库处理引擎作者:Stanley 罗昊 [转载请注明出处和署名,谢谢!] 用了那么长时间的MySQL,sql语句相信早已烂熟于心,于是,我就试着去了解它的执行原理 ...
mysql数据库主从同步复制原理
MySQL的Replication(英文为复制)是一个多MySQL数据库做主从同步的方案,特点是异步复制,广泛用在各种对MySQL有更高性能.更高可靠性要求的场合.与之对应的是另一个同步技术是MySQ ...
重新学习MySQL数据库5：根据MySQL索引原理进行分析与优化
重新学习MySQL数据库5:根据MySQL索引原理进行分析与优化一:Mysql原理与慢查询 MySQL凭借着出色的性能.低廉的成本.丰富的资源,已经成为绝大多数互联网公司的首选关系型数据库.虽然性能 ...

随机推荐

ZooKeeper开发手册中文翻译（转）
本文Github地址:https://github.com/sundiontheway/zookeeper-guide-cn 本文假设你已经具有一定分布式计算的基础知识.你将在第一部分看到以下内容: ...
display&colon;inline 和display&colon;inline-block和display&colon;block的区别
之前讲过块级元素使用display:block 行内元素使用display:inline 那么今天我们就来区分一下display:inline,display:inline-block和display ...
9&lowbar;13学习完整修改和查询&amp&semi;&amp&semi;实体类，数据访问类
完整修改和查询:中间变量运用. 1.先查 2.执行操作 ---------------------------------------------------- namespace ADO.NET_小 ...
asp&period;net(vs2005) + Sql2000 缓存依赖
1.开启数据库缓存依赖支持开始,运行,cmd 输入 C:\WINDOWS\Microsoft.NET\Framework\v2.0.50727\aspnet_regsql -S localhost ...
cs模式与bs模式
关于CS(Client-Server)模式和BS(Browser-Server)模式的水很深,盆地自己也认为对此了解不够透彻,但作为手机客户端设计,如果不对CS.BS做一定程度的了解,是很容易出现一 ...
Hive 行列转换
一.列转行 (对某列拆分,一列拆多行) 使用函数:lateral view explode(split(column, ',')) num eg: 如表:t_row_to_column_tmp 数据如 ...
javaMail实现收发邮件（一）
电子邮件的传输过程电子邮件系统采用客户/服务器模式.电子邮件传送需要用到以下3个重要模块:MUA(Mail User Agent,邮件用户代理):用户通过它与电子邮件服务器打交道.MUA实际上就是邮 ...
理解syslinux，SYSLINUX和PXELINUX
在研究网络装机的过程中,菜菜地被Syslinux.SYSLINUX和PXELINUX这些定义折磨了一下它们有什么区别和联系?为什么配置PXELINUX要安装的是Syslinux而不是Pxelinux ...
dojo：为数据表格添加复选框
一.添加复选框此时应该选用EnhancedGrid,而不是普通的DataGrid.添加复选框需要设置EnhancedGrid的plugins属性,如下: gridLayout =[{ default ...
thrift系列 - 快速入门
1.简介 Thrift是当前流行的RPC框架之一,它有强大的代码生成引擎,可以跨语言,轻松解决程序间的通信问题. 本文旨在帮助大家快速入门,若想深入原理,请参见thrift官网:h ...