接下来我们要讨论的是数据库性能优化的另一方面,即运用数据库服务器内建的工具辅助性能分析和优化。
▲SHOW
执行下面这个命令可以了解服务器的运行状态:
mysql>showstatus;
该命令将显示出一长列状态变量及其对应的值,其中包括:被中止访问的用户数量,被中止的连接数量,尝试连接的次数,并发连接数量最大值,以及其他许多有用的信息。这些信息对于确定系统问题和效率低下的原因是十分有用的。
SHOW命令除了能够显示出MySQL服务器整体状态信息之外,它还能够显示出有关日志文件、指定数据库、表、索引、进程和许可权限表的宝贵信息。请访问http://www.mysql.com/doc/S/H/SHOW.html了解更多信息。
▲EXPLAIN
EXPLAIN能够分析SELECT命令的处理过程。这不仅对于决定是否要为表加上索引很有用,而且对于了解MySQL处理复杂连接的过程也很有用。
下面这个例子显示了如何用EXPLAIN提供的信息逐步地优化连接查询。(本例来自MySQL文档,见http://www.mysql.com/doc/E/X/EXPLAIN.html。原文写到这里似乎有点潦草了事,特加上此例。)
假定用EXPLAIN分析的SELECT命令如下所示:
EXPLAINSELECTtt.TicketNumber,tt.TimeIn,
tt.ProjectReference,tt.EstimatedShipDate,
tt.ActualShipDate,tt.ClientID,
tt.ServiceCodes,tt.RepetitiveID,
tt.CurrentProcess,tt.CurrentDPPerson,
tt.RecordVolume,tt.DPPrinted,et.COUNTRY,
et_1.COUNTRY,do.CUSTNAME
FROMtt,et,etASet_1,do
WHEREtt.SubmitTimeISNULL
ANDtt.ActualPC=et.EMPLOYID
ANDtt.AssignedPC=et_1.EMPLOYID
ANDtt.ClientID=do.CUSTNMBR;
SELECT命令中出现的表定义如下:
※表定义
表列列类型
ttActualPCCHAR(10)
ttAssignedPCCHAR(10)
ttClientIDCHAR(10)
etEMPLOYIDCHAR(15)
doCUSTNMBRCHAR(15)
※索引
表索引
ttActualPC
ttAssignedPC
ttClientID
etEMPLOYID(主键)
doCUSTNMBR(主键)
※tt.ActualPC值分布不均匀
在进行任何优化之前,EXPLAIN对SELECT执行分析的结果如下:
tabletypepossible_keyskeykey_lenrefrowsExtra
etALLPRIMARYNULLNULLNULL74
doALLPRIMARYNULLNULLNULL2135
et_1ALLPRIMARYNULLNULLNULL74
ttALLAssignedPC,ClientID,ActualPCNULLNULLNULL3872
rangecheckedforeachrecord(keymap:35)
每一个表的type都是ALL,它表明MySQL为每一个表进行了完全连接!这个操作是相当耗时的,因为待处理行的数量达到每一个表行数的乘积!即,这里的总处理行数为74*2135*74*3872=45,268,558,720。
这里的问题之一在于,如果数据库列的声明不同,MySQL(还)不能有效地运用列的索引。在这个问题上,VARCHAR和CHAR是一样的,除非它们声明的长度不同。由于tt.ActualPC声明为CHAR(10),而et.EMPLOYID声明为CHAR(15),因此这里存在列长度不匹配问题。
为了解决这两个列的长度不匹配问题,用ALTERTABLE命令把ActualPC列从10个字符扩展到15字符,如下所示:
mysql>ALTERTABLEttMODIFYActualPCVARCHAR(15);
现在tt.ActualPC和et.EMPLOYID都是VARCHAR(15)了,执行EXPLAIN进行分析得到的结果如下所示:
tabletypepossible_keyskeykey_lenrefrowsExtra
ttALLAssignedPC,ClientID,ActualPCNULLNULLNULL3872whereused
doALLPRIMARYNULLNULLNULL2135
rangecheckedforeachrecord(keymap:1)
et_1ALLPRIMARYNULLNULLNULL74
rangecheckedforeachrecord(keymap:1)
eteq_refPRIMARYPRIMARY15tt.ActualPC1
这还算不上完美,但已经好多了(行数的乘积现在少了一个系数74)。现在这个SQL命令执行大概需要数秒钟时间。
为了避免tt.AssignedPC=et_1.EMPLOYID以及tt.ClientID=do.CUSTNMBR比较中的列长度不匹配,我们可以进行如下改动:
mysql>ALTERTABLEttMODIFYAssignedPCVARCHAR(15),
MODIFYClientIDVARCHAR(15);
现在EXPLAIN显示的结果如下:
tabletypepossible_keyskeykey_lenrefrowsExtra
etALLPRIMARYNULLNULLNULL74
ttrefAssignedPC,ClientID,ActualPCActualPC15et.EMPLOYID52whereused
et_1eq_refPRIMARYPRIMARY15tt.AssignedPC1
doeq_refPRIMARYPRIMARY15tt.ClientID1
这个结果已经比较令人满意了。
余下的问题在于,默认情况下,MySQL假定tt.ActualPC列的值均匀分布,而事实上tt表的情况并非如此。幸而,我们可以很容易地让MySQL知道这一点:
shell>myisamchk--analyzePATH_TO_MYSQL_DATABASE/tt
shell>mysqladminrefresh
现在这个连接操作已经非常理想,EXPLAIN分析的结果如下:
tabletypepossible_keyskeykey_lenrefrowsExtra
ttALLAssignedPC,ClientID,ActualPCNULLNULLNULL3872whereused
eteq_refPRIMARYPRIMARY15tt.ActualPC1
et_1eq_refPRIMARYPRIMARY15tt.AssignedPC1
doeq_refPRIMARYPRIMARY15tt.ClientID1
▲OPTIMIZE
OPTIMIZE能够恢复和整理磁盘空间以及数据碎片,一旦对包含变长行的表进行了大量的更新或者删除,进行这个操作就非常有必要了。OPTIMIZE当前只能用于MyISAM和BDB表。
结束语:从编译数据库服务器开始、贯穿整个管理过程,能够改善MySQL性能的因素实在非常多,本文只涉及了其中很小的一部分。尽管如此,我们希望本文讨论的内容能够对你有所帮助。
//copy者注:
时间不够,所以格式上有点问题~~,请大家看详细的英文原文:http://www.devshed.com/Server_Side/MySQL/Optimize/
或者看看chinabyte的文章好了:
http://www.chinabyte.com/builder/detail.shtm?buiid=1012&parid=1
哈哈~从这点能不能看出来我是全心全意为大家服务的