编辑推荐
沃趣团队凭借着多年的运维经验,为行业客户提供专业数据库、系统相关的服务和产品。《千金良方——MySQL性能优化金字塔法则》是其核心团队的呕心力作,全书细致地介绍MySQL的基本原理,以及性能优化的实际案例。
无论你是MySQL初学者,还是专门从事MySQL工作的开发人员和运维人员,或者是资深的MySQL DBA,都值得一读!
 ;
内容简介
本书一共分为3篇:基础篇、案例篇和工具篇。“基础篇”从理论基础和基本原理层面介绍了MySQL的安装与配置、升级和体系结构,information_schema、sys_schema、performance_schema和mysql_schema,MySQL复制,MySQL事务,SQL语句优化及架构设计基础知识。“案例篇”从硬件和系统、MySQL架构等方面给出了性能优化的十几个案例,包括:性能测试的基本优化思路和*需要关注的性能指标解释、对日常SQL语句执行慢的基本定位、避免x86可用性的一般性方法、节能模式会怎样影响性能、I/O存储作为数据库*重要的依赖是如何影响数据库性能的、主备复制不一致可能有哪些原因、字符集不一致会造成哪些性能问题、在实际场景中锁的争用是怎样的。“工具篇”介绍了在MySQL性能优化过程中需要用到的各种工具,包括:dmidecode、top、dstat等硬件和系统排查工具;FIO、sysbench、HammerDB等压力测试工具;mysqldump、XtraBackup等备份工具;Percona、innotop、Prometheus等监控工具。
作者简介
李春:原阿里巴巴MySQL DBA团队技术Leader,全程参与阿里数据库架构从Oracle迁移到MySQL的过程,参与分布式中间件Cobar设计。现为沃趣科技联合创始人&;首席架构师,负责MySQL、基础软件及部分关键组件的技术选型、风险评估等。罗小波:沃趣科技高级数据库工程师,主要负责MySQL产品的数据库支撑与售后二线支撑。曾参与版本发布系统、轻量级监控系统、运维管理平台、数据库管理平台的设计与编写,熟悉MySQL体系结构,Innodb存储引擎,喜好专研开源技术,多次在公开场合做过线下线上数据库专题分享,发表过多篇与数据库相关的研究文章。董红禹:沃趣科技MySQL DBA , 为过多家大型企业进行过故障解决、架构设计、性能优化,例如中信证券、浙江农信、陕西农信、邮储银行等。规划并实施了浙江农信互联网核心金融平台。
目录
目录
基 础 篇
第1章 MYSQL初始化安装、简单安全加固 3
1.1 背景 3
1.2 初始化安装 3
1.2.1 下载二进制安装文件 3
1.2.2 创建MYSQL用户 3
1.2.3 创建程序、数据存放目录 4
1.2.4 解压缩二进制安装文件并设置目录权限 4
1.2.5 软链接程序路径,并设置MYSQL命令环境变量 5
1.2.6 配置MY.CNF文件参数 5
1.2.7 初始化MYSQL 6
1.2.8 启动MYSQL 7
1.3 简单安全加固 8
1.3.1 登录MYSQL 8
1.3.2 删除非ROOT或非LOCALHOST的用户并修改ROOT密码 9
1.3.3 删除TEST库,清理MYSQL.DB表 10
1.4 创建用户、库、表、数据 12
1.4.1 创建管理用户并授权 12
1.4.2 创建库、表、程序账号 13
1.4.3 插入数据 14
1.5 MYSQL参数模板 16
第2章 MYSQL常用的两种升级方法 21
2.1 背景 21
2.2 MYSQL 5.5.54的安装 21
2.3 升级MYSQL 5.5.54到MYSQL 5.6.35 21
2.3.1 使用MYSQL_UPGRADE直接升级数据字典库 21
2.3.2 使用MYSQLDUMP逻辑备份数据 30
2.4 升级注意事项 38
第3章 MYSQL体系结构 41
3.1 快速安装MYSQL 41
3.2 数据目录结构 43
3.3 MYSQL SERVER体系结构 46
3.4 MYSQL中的存储引擎 48
3.5 INNODB存储引擎体系结构 48
3.6 INNODB存储引擎后台线程 52
3.7 MYSQL前台线程 54
第4章 PERFORMANCE_SCHEMA初相识 56
4.1 什么是PERFORMANCE_SCHEMA 56
4.2 PERFORMANCE_SCHEMA使用快速入门 57
4.2.1 检查当前数据库版本是否支持 57
4.2.2 启用PERFORMANCE_SCHEMA 58
4.2.3 PERFORMANCE_SCHEMA表的分类 59
4.2.4 PERFORMANCE_SCHEMA简单配置与使用 62
第5章 PERFORMANCE_SCHEMA配置详解 66
5.1 编译时配置 66
5.2 启动时配置 67
5.2.1 启动选项 67
5.2.2 SYSTEM VARIABLES 69
5.3 运行时配置 71
5.3.1 PERFORMANCE_TIMERS表 71
5.3.2 SETUP_TIMERS表 72
5.3.3 SETUP_CONSUMERS表 73
5.3.4 SETUP_INSTRUMENTS表 76
5.3.5 SETUP_ACTORS表 82
5.3.6 SETUP_OBJECTS表 85
5.3.7 THREADS表 87
第6章 PERFORMANCE_SCHEMA应用示例荟萃 93
6.1 利用等待事件排查MYSQL性能问题 93
6.2 锁问题排查 97
6.2.1 找出谁持有全局读锁 97
6.2.2 找出谁持有MDL锁 100
6.2.3 找出谁持有表级锁 104
6.2.4 找出谁持有行级锁 107
6.3 查看最近的SQL语句执行信息 112
6.3.1 查看最近的TOP SQL语句 112
6.3.2 查看最近执行失败的SQL语句 114
6.4 查看SQL语句执行阶段和进度信息 117
6.4.1 查看SQL语句执行阶段信息 117
6.4.2 查看SQL语句执行进度信息 120
6.5 查看最近的事务执行信息 121
6.6 查看多线程复制报错详情 123
第7章 SYS系统库初相识 126
7.1 SYS系统库使用基础环境 126
7.2 SYS系统库初体验 127
7.3 SYS系统库的进度报告功能 129
第8章 SYS系统库配置表 132
8.1 SYS_CONFIG表 132
8.2 SYS_CONFIG_INSERT_SET_USER触发器 136
8.3 SYS_CONFIG_UPDATE_SET_USER触发器 136
第9章 SYS系统库应用示例荟萃 138
9.1 查看慢SQL语句慢在哪里 138
9.2 查看是否有事务锁等待 140
9.3 查看是否有MDL锁等待 141
9.4 查看INNODB缓冲池中的热点数据有哪些 143
9.5 查看冗余索引 144
9.6 查看未使用的索引 145
9.7 查询表的增、删、改、查数据量和I/O耗时统计信息 145
9.8 查看MYSQL磁盘文件产生的磁盘流量与读写比例 146
9.9 查看哪些语句使用了全表扫描 147
9.10 查看哪些语句使用了文件排序 148
9.11 查看哪些语句使用了临时表 149
第10章 INFORMATION_SCHEMA初相识 151
10.1 什么是INFORMATION_SCHEMA 151
10.2 INFORMATION_SCHEMA组成对象 153
10.2.1 SERVER层的统计信息字典表 153
10.2.2 SERVER层的表级别对象字典表 154
10.2.3 SERVER层的混杂信息字典表 155
10.2.4 INNODB层的系统字典表 156
10.2.5 INNODB层的锁、事务、统计信息字典表 157
10.2.6 INNODB层的全文索引字典表 158
10.2.7 INNODB层的压缩相关字典表 160
第11章 INFORMATION_SCHEMA应用示例荟萃 161
11.1 使用SERVER层的字典表查询相关的元数据信息 161
11.1.1 查看数据库中是否使用了外键 161
11.1.2 查看INNODB表空间文件信息 162
11.1.3 查看索引的统计信息 165
11.1.4 查看表的字段相关信息 166
11.1.5 查看数据库中是否使用了存储程序 167
11.1.6 查看数据库中的分区表信息 168
11.1.7 查看数据库中的触发器 169
11.1.8 查看数据库中的计划任务 170
11.1.9 查看客户端会话的状态信息 172
11.2 使用INNODB层的字典表查询相关的元数据信息 173
11.2.1 查看索引列的信息 173
11.2.2 查看表的字段相关信息 175
11.2.3 查看事务锁等待信息 176
11.2.4 查看INNODB缓冲池中的热点数据有哪些 176
第12章 MYSQL系统库之权限系统表 177
12.1 USER 177
12.2 DB 179
12.3 TABLES_PRIV 180
12.4 COLUMNS_PRIV 181
12.5 PROCS_PRIV 182
12.6 PROXIES_PRIV 182
第13章 MYSQL系统库之访问权限控制系统 184
13.1 访问权限控制系统概述 184
13.2 MYSQL提供了哪些权限 185
13.3 MYSQL账号命名规则 191
13.4 MYSQL账号访问控制两阶段 192
13.4.1 第一阶段(账号和密码认证) 192
13.4.2 第二阶段(权限检查) 196
13.5 权限变更的影响 197
13.6 MYSQL常见连接问题 198
第14章 MYSQL系统库之统计信息表 200
14.1 统计信息概述 200
14.2 统计信息表详解 203
14.2.1 INNODB_TABLE_STATS 203
14.2.2 INNODB_INDEX_STATS 204
第15章 MYSQL系统库之复制信息表 206
15.1 复制信息表概述 206
15.2 复制信息表详解 207
15.2.1 SLAVE_MASTER_INFO 207
15.2.2 SLAVE_RELAY_LOG_INFO 209
15.2.3 SLAVE_WORKER_INFO 211
15.2.4 GTID_EXECUTED 215
15.2.5 NDB_BINLOG_INDEX 217
第16章 MYSQL系统库之日志记录表 218
16.1 日志信息概述 218
16.2 日志表详解 220
16.2.1 GENERAL_LOG 220
16.2.2 SLOW_LOG 223
第17章 MYSQL系统库应用示例荟萃 228
17.1 查看用户不同作用域的权限 228
17.1.1 查看全局权限 228
17.1.2 查看库级别权限 230
17.1.3 查看表级别权限 232
17.1.4 查看字段级别权限 234
17.2 查看统计信息 236
17.2.1 查看表统计信息 236
17.2.2 查看索引统计信息 236
17.3 查看SQL日志信息 237
第18章 复制技术的演进 245
18.1 复制格式概述 245
18.2 基于数据安全的复制技术演进 246
18.2.1 异步复制 246
18.2.2 半同步复制 247
18.2.3 增强半同步复制 249
18.2.4 组复制 250
18.2.5 GTID复制 253
18.3 基于复制效率的复制技术演进 255
18.3.1 单线程复制 255
18.3.2 DATABASE 并行复制 256
18.3.3 LOGICAL_CLOCK 并行复制 258
18.3.4 WRITESET并行复制 260
第19章 事务概念基础 263
19.1 4种事务隔离级别和3种异常现象 263
19.1.1 标准的事务隔离级别 263
19.1.2 调整事务隔离级别 264
19.2 从事务提交谈起 265
19.2.1 事务管理 265
19.2.2 数据库中的文件 266
19.2.3 WAL日志先写 266
19.3 MYSQL中的REDO日志 267
19.3.1 REDO日志落盘时间点 267
19.3.2 REDO日志格式 267
19.3.3 相关参数及概念 269
19.3.4 CHECKPOINT概念 269
19.3.5 REDO日志的设置 271
19.3.6 REDO日志与BINLOG协调工作 273
19.4 MVCC介绍 274
19.4.1 MVCC原理 274
19.4.2 具体代码 276
第20章 INNODB锁 280
20.1 INNODB锁概述 280
20.1.1 INNODB锁分类 280
20.1.2 行锁 280
20.1.3 表锁 281
20.1.4 锁模式对应的含义 282
20.2 加锁验证 282
20.2.1 REPEATABLE-READ隔离级别 表无显式主键和索引 283
20.2.2 REPEATABLE-READ隔离级别 表有显式主键但无索引 286
20.2.3 REPEATABLE-READ隔离级别 表无显式主键但有索引 288
20.2.4 REPEATABLE-READ隔离级别 表有显示主键和索引 291
20.2.5 READ-COMMITTED隔离级别 表无显式主键和索引 293
20.2.6 READ-COMMITTED隔离级别 表有显式主键无索引 295
20.2.7 READ-COMMITTED隔离级别 表无显式主键有索引 295
20.2.8 READ-COMMITTED隔离级别 表有显式主键和索引 296
第21章 SQL优化 299
21.1 SQL优化基础概念 299
21.2 MYSQL中的JOIN算法 303
21.3 MYSQL中的优化特性 305
第22章 MYSQL读写扩展 308
22.1 分布式架构概述 308
22.2 分库分表两种方式 309
22.2.1 中间件方式 309
22.2.2 客户端方式 309
22.2.3 客户端方式与中间件方式不同 310
22.2.4 分库与分表 310
22.3 中间件工作方式及原理 310
22.4 架构设计及业务场景 312
22.4.1 读写扩展案例 312
22.5 关于中间件的一些限制解释 314
22.5.1 跨库查询、复杂的SQL语句支持 314
22.5.2 分布式事务 314
案 例 篇
第23章 性能测试指标和相关术语 317
23.1 测试目标分类 317
23.1.1 已知故障信息采集 317
23.1.2 预估压力评测 317
23.2 性能测试指标 318
23.2.1 数据库性能通用“切口” 318
23.2.2 测试
媒体评论
推荐序1
本书作者李春是阿里巴巴较为早期的DBA之一,罗小波和董红禹则都是知数堂的优秀校友。有一次我偶然知道了罗小波的经历,非常令人赞叹,这么努力的人理应获得如此成就。
*次注意到罗小波是因为他的投稿文章“MySQL排序内部原理探秘”,该文章真的是从头到尾、从上到下全方位解读了MySQL内部排序的方方面面。再后来,又关注到罗小波推出PFS和sys schema系列连载文章,更是对其静心深入学习的能力表示钦佩,整个系列文章翔实、细致、到位。另外,董红禹的功底也非常深厚,他对除MySQL外的其他数据库也有较多了解。二位同学曾多次被知数堂邀请做公开课分享。
除此之外,我曾感叹沃趣培养出了不少好工程师,其人才体系肯定有很多可学之处,于是也邀请了李春来知数堂做公开课分享,就是希望能把他们的人才培养机制分享给业界。
拿到本书书稿,我快速浏览了“案例篇”的全部内容,发现几乎都是精华,里面涉及了相当多的经典案例解析,如果能从这些案例中吸收解决问题的思路,那么相信读者以后若遇到其他问题,基本上都可以解决。
本书既有涉及体系结构、PFS、I_S、统计信息、复制、锁、InnoDB等基础知识的铺垫(其实并不基础),又有众多案例详解,内容丰富、翔实,是难得一见的MySQL性能优化参考书,建议每位DBA以及从事MySQL相关应用开发的读者都读一读。
*后,说一个段子。我曾经开玩笑地说,大家以后要买书的话,记得先看有没有我给写的推荐序,如果有的话,那就放心买,如果没有的话,那就要谨慎点了。本书我是推荐的,所以大家可以放心大胆买。嘿嘿。
叶金荣
推荐序2
小学课本告诉我们,蒸汽机是瓦特看到水壶被水蒸气顶起来以后冥思苦想发明出来的。但实际情况其实是,17世纪末期,托马斯•纽克曼(Thomas Newcomen)发明了体积庞大的“蒸汽机”,利用蒸汽的力量把煤矿里的水抽出来,避免了矿井透水、积水的问题。1765年,詹姆士•瓦特(James Watt)发明了分离式冷凝器,改进了纽克曼蒸汽机,使得蒸汽机的效率提升了4倍。当然,纽克曼蒸汽机也不是凭空出现的,纽克曼蒸汽机是基于Thomas Savery发明的Savery蒸汽泵的,继续往前追溯,可以追溯到公元1世纪古希腊力学家希罗(Heron of Alexandria)发明的汽转球。
我并不否认瓦特的贡献,正是有了他对蒸汽机做功效率的改变,才提升了煤炭、钢铁的产量,促进了轮船、火车的产生,才有了工业革命。我这里想说的是人们很早就发现了蒸汽做功的理论,但是把它利用起来,把它真正用于我们的生产生活中来提高生产效率的过程是曲折而漫长的,理论和原理的发明是耀眼的明星,工程化实践和持续不断的改进却像星光传到我们的眼睛一样,需要经过漫长的过程,凝聚着很多“无名”科学家和工程师的努力与心血。
MySQL之父Monty(Michael Widenius)在1981年写了MySQL的*行代码以后,在开源的帮助下MySQL成长为目前*流行的开源数据库,同样其也凝聚了非常多的开发者、DBA、工程师的心血。2009年,在MySQL被Oracle收购以后,47岁的Monty开发了MariaDB分支,到现在MariaDB也已经10年了,他仍然亲自参与写代码,并且负责大部分代码的Review工作,我作为MariaDB基金会的中国成员在跟Monty一起Review代码时,经常会叹服老爷子对全局的把控能力和对细节的严谨态度。2016年当Monty在阿里巴巴交流分享时,我问Monty:“你怎么看阿里巴巴在MySQL方面的能力以及贡献?”他说:“你贡献的多源复制和闪回功能,对MariaDB很有用,因此我觉得你和你的团队是很有能力的,也希望能获得更多的来自各大厂商和社区的贡献。”
MySQL之所以能成为现在*流行的开源数据库,它跟它的开放性、包容性是分不开的。它的入门门槛低到用一条命令就能把MySQL安装起来,你能在程序开发的入门资料中很容易就找到MySQL的配套使用教程,你可以不用付任何费用就能在自己的环境中部署起来对外承载业务。我之前提交的代码补足了MySQL在某些方面的功能,是对它的贡献;苏普验证测试时发现MySQL 5.6的半同步Bug汇报给社区,是对它的贡献;李春他们撰写MySQL书籍,也是对它的贡献。我和阿里巴巴的其他同事翻译《高性能MySQL》时就体会到了出版一本书的艰辛,所以看到《千金良方:MySQL性能优化金字塔法则》这本沉甸甸的书时,完全能感受到三位作者在写书时的痛苦与艰辛。
MySQL从5.5版本开始引入performance_schema,从5.6版本开始把默认值设置为on,我个人认为从5.7版本(对应MariaDB 10.1)开始它才真正成熟起来。从某种程度上说,performance_schema的引入对MySQL来说可以类比于瓦特发明分离式冷凝器改进蒸汽机,使得开发人员或者DBA对MySQL的性能损耗能准确定位到源码层级,对MySQL的管控也可以更加精细化。这本书是我了解到的*本体系化介绍performance_schema的书,对MySQL性能优化有兴趣的读者可以参阅。
另外,本书“案例篇”也是我见过的相对比较系统化介绍性能优化方面的内容,从服务器、操作系统、MySQL、SQL和锁方面整体梳理了MySQL性能优化的方方面面,相关案例都具有代表性,很值得参考和验证,也希望读者能参考案例来验证和测试,并举一反三,结合自己环境的实际场景构建起性能改进的方法论。
蒸汽机的改进不是一蹴而就的,性能的改进也是贯穿整个MySQL发展史的,就像瓦特改进蒸汽机引发了工业革命一样,我希望本书的出版能进一步促进大家对MySQL/MariaDB性能优化的关注,能为*流行的开源数据库MySQL/MariaDB大厦添砖加瓦。
彭立勋
推荐序3
我先说一个笑话。这个笑话是我从万维钢的专栏里看到的。
三个逻辑学家走进酒吧,酒保问他们,三位都喝啤酒吗?
*个逻辑学家说,我不知道。
第二个逻辑学家说,我不知道。
第三个逻辑学家说,是的。
这个笑话有点冷,需要用一点逻辑才能欣赏。要想否定“三人都喝啤酒”,只要有一个人知道自己不喝就行了。前两个逻辑学家说不知道,就说明他们自己是想喝的,只是不知道别人喝不喝。而第三个人一看前两个人都说不知道,那就说明这两个人肯定都是要喝的,而他自己也想喝啤酒,所以他就可以判断三人都想喝啤酒。
他们的回答有点怪,但是非常准确。
为什么要讲这个故事呢?因为我的这三位同事李春、罗小波、董红禹在我头脑里的画像都是非常认真和讲究逻辑的人。这种认真和严谨,你在书中的每一页都能感受到。相信通过这本书的系统性训练,你也能感受到这种思维方式的美,*终也能获得这种思维方式。“授人以鱼,不如授之以渔。”具备优秀的思维能力才是在未来可以迁移的能力,如果只是学习一些命令,则很快会过时,思维能力和学习能力的提升才是不会变的东西。
说回到这本书。
对这本书的起心动念,我是有功劳的,所以李春邀请我来写序,也就很痛快地答应了。
一年前我们在想,我们有着业界一流的MySQL团队,为什么不能将这些知识和经验以一种更容易传播的方式贡献给大家呢?
沿着这个思路,想到了两种载体,一种是产品,这也是沃趣一直在做的,未来也会一直持续做;一种是书籍,书籍其实也是一种产品,因为它也是标准化的、极容易复制的。因此,团队中在MySQL技术上颇有追求和建树的几个人碰头一聊,大家一拍即合。
起心动念容易,甚至一度让我们很兴奋,但是落地难,尤其是在做了管理者带了团队之后,更能意识到这一点,提建议(起心动念)是没有成本的,但是具体做这件事、落地这件事的人是需要忍受寂寞、付出巨大努力的。
我在他们的写作群里,见证了写书过程中的所有艰辛。好在一年的时间,坚持下来了,成果就是各位手里拿到的这本书。
学知识,如果说有捷径,那就是选择几本靠谱的、高质量的书籍,站在巨人的肩膀上,这是高起点和借势。
这本书可以让你体验到原有知识从破碎到重建的过程,只有能打破你现有认知的书籍才是好书籍,打破之后,如果你能够重建起基于新认知的知识大厦,你就重生了。对于认知是如此,对于心智、对于各种成长莫不如此。格物致知,相信通过努力学习这本书,会带给你底层认知的提升。
在这里也要恭喜我的几位同事:李春、罗小波、董红禹,写书是大多数技术人员的梦想,人类从一开始就追求不朽,立言是一种极好的方式,儒家讲立德、立功、立言,写书就是立言的*好方式。此外,道家通过修炼达到肉身不死来实现不朽,佛教通过觉悟实现不朽,这两种方式不是我辈可以企及的。说了这么多,其实是想呼吁更多的人加入写书的队伍,授人玫瑰,手留余香。
*后,分享我很喜欢的一句话,“你的样子里,有你爱过的人,走过的路,看过的风景,读过的书”。相信通过对这本书的学习,一定可以让你的气质变得不一样!
魏兴华
前沿
前言
性能问题
这个世界是由问题组成的,理想的状态和实际状态之间的差异造成了问题。国家领导解决人民生活幸福的大问题,公司的总经理解决盈利的问题,而本书只想解决MySQL数据库性能这么一个“小问题”。
从某种程度来说,MySQL数据库性能优化的问题是一个并行的问题,归根结底是锁和资源争用的问题。举个例子:假设你要开一个餐饮店,你需要取好店名,到工商局领取开业登记注册证书,到卫生防疫站申请卫生许可,到物价局进行物价审核,如果要卖酒,则需要到工商部门办理酒类经营许可证,到税务局办理税务登记,到银行开户,还需要找厨师、找洗碗工、找采购人员、找门面、协调店面转让、进行店面装修、做广告牌,等等。
如果想尽快把餐饮店开起来,就需要同时做更多的事情,就像计算机一样,并行地去做更多的事情。但是当你真正去做这些事情的时候,会发现:
? 总有一两件事情耗费的时间特别长,会最大程度地影响餐饮店什么时候能开起来。比如找到合适的店面或者合适的厨师。
? 有些事情是相互依赖的,一件事情必须依赖于另一件事情的完成。比如工商登记就取决于你要准备好店名,店面装修依赖于门面已经租好了,等等。
? 有些事情特别重要,它决定了这个餐饮店是否能长期经营下去。例如厨师做的菜是否足够好、足够快,运营的成本是否足够低而能产生足够的利润支撑餐饮店继续运营。
其实性能优化要做的就是以下事情:
? 了解基本原理。找到事情的因果关系和依赖关系,让尽量不相关的事情能并行做起来。
? 要事第一。找到当前最重要、最需要优化的地方,投入时间和精力,不断去改进它、优化它。
? 切中要害。找到耗费时间最长的地方,想方设法缩短它的时间。
本书的作者尝试通过上述方法论来找到MySQL性能优化的办法并呈现给读者。
数据库的性能提升
从计算机出现的第一天起,性能作为鞭策者就不断地促进计算机及系统的演进。从最开始的人工输入命令等待计算机执行,到利用批处理任务提升利用率,再到通过多进程和多线程并发来进一步提升效率,性能其实一直是计算机工程师想要努力去解决和改善的重要难题。
上面说的都是对已有系统的性能优化,数据库的性能优化其实可以在做设计之前就开始。
数据库的性能优化首先是计算机系统的优化。数据库程序是运行在计算机系统上的应用程序,需要先优化的就是计算机系统。也就是说,让硬件尽量均衡,操作系统充分发挥硬件的全部性能,而数据库充分利用操作系统和文件系统提供的便利发挥全部性能,而且避免资源的相互竞争。
数据库的性能优化其次是SQL语句的优化。上层应用都通过SQL语句与数据库打交道,一条SQL语句为了获取数据可以有几十甚至上百种执行计划,数据库会通过优化器选择更优的SQL执行计划,但是MySQL在执行计划上远远落后于商业数据库,甚至在一些方面相比PostgreSQL也差很多,那么怎么写出正确的SQL语句,避免MySQL选择错误的执行计划,以及怎样通过增加索引、设置参数让MySQL的执行计划更优,这就是优化SQL语句需要关心的事情。
最后,数据库的性能优化最有效的是架构的优化。对于读多写少的应用程序,可以设计为读写分离,把允许延迟的读请求主动分发到备库;对于秒杀型的业务,可以先在内存型key-value存储系统筛选再发往数据库持久化,避免对数据库的冲击;对于汇总、聚合类的应用,可以采用列式存储引擎或者专门的大数据平台;对于监控类的应用,可以采用时序数据库,等等。
以上三种优化思路贯穿本书,这也是本书名为《千金良方:MySQL性能优化金字塔法则》的缘由。
机械思维和大数据思维
看过吴军博士《智能时代:大数据与智能革命重新定义未来》的人可能会对本书嗤之以鼻,本书的性能优化方法论还是工业革命时代的机械思维,简而言之,就是寻找因果关系,大胆假设,小心求证。“现在都是信息时代了,了解过信息论没有?知道香农第一定律和第二定律吗?解决问题需要用大数据思维!”
笔者有两点理由使用机械思维来介绍数据库性能优化:
(1)大数据时代需要的数据量大、多纬度和完备性,目前对数据库的性能优化和性能诊断,笔者掌握的案例和相关信息远远达不到大数据的要求。我们可以期待亚马逊、阿里云或者腾讯云等厂商或者专业的数据库公司(如Oracle、MariaDB等)来有针对性地做一些大数据数据库性能优化的尝试。
(2)大数据的成本很高。目前我们遇到的大部分性能问题其实用因果关系和假设→推导→再假设→再推导的方法就可以解决,不需要用到大数据、人工智能这样的“大杀器”。
内容介绍
MySQL的火热程度有目共睹,如果需要了解MySQL的安装、启动、配置等基础知识,市面上相关的书籍已是汗牛充栋。本书则尽量深入细致地介绍MySQL的基本原理,以及性能优化的实际案例。
基本原理很枯燥,就像课堂上老师介绍数学定理和公式推导一样,有人可能会质疑,小学都在进行素质教育了,你这本书里怎么还有那么多基本原理的介绍?对于工作了两三年的技术人员来说,在实践上已经有了比较多的积累,解决过很多问题——可能通过sys schema查询事务锁等待解决了系统的并发问题,通过设置ulimit -n 扩大进程文件句柄数解决了MySQL的进程限制问题,通过设计读写分离架构扩展了应用的读性能线性扩展问题。但是作为求知欲强的技术人员,我们急切地希望知其所以然,了解MySQL到底是怎么设计的,以及为什么这样设计,sys schema到底还有哪些可以帮助我们分析解决问题的存储过程,Linux系统的资源限制除了ulimit还有哪些,读写分离架构适应的场景有哪些,什么时候建议用分库分表,等等。如果你也跟我们一样,你应该阅读本书。
本书一共分为3篇:基础篇、案例篇和工具篇。
信息论认为消除一件事情的不确定性就是获取足够多的信息。我们认为任何优化都可以从了解它的基本原理和设计思路开始。“基础篇”从理论基础和基本原理层面介绍了MySQL的安装与配置、升级和体系结构,information_schema、sys_schema、performance_schema和mysql_schema,MySQL复制,MySQL事务,SQL语句优化及架构设计基础知识。希望读者通过对这些内容的学习,能够深入细致地了解MySQL各方面的基础知识。
计算机是一种实验的科学,性能优化是实战的艺术。“案例篇”从硬件和系统、MySQL架构等方面给出了性能优化的十几个案例,包括:性能测试的基本优化思路和最需要关注的性能指标解释、对日常SQL语句执行慢的基本定位、避免x86可用性的一般性方法、节能模式会怎样影响性能、I/O存储作为数据库最重要的依赖是如何影响数据库性能的、主备复制不一致可能有哪些原因、字符集不一致会造成哪些性能问题、在实际场景中锁的争用是怎样的。希望读者通过这些案例,可以深入细致地理解“基础篇”中的各种概念,融会贯通,对MySQL有一个全面的、系统的掌握。
“工欲善其事,必先利其器。”我们日常需要借助一些工具来做性能优化。“工具篇”介绍了在MySQL性能优化过程中需要用到的各种工具,包括:dmidecode、top、dstat等硬件和系统排查工具;FIO、sysbench、HammerDB等压力测试工具;mysqldump、XtraBackup等备份工具;Percona、innotop、Prometheus等监控工具。希望读者可以借助更多自动化的方式去验证和评估性能优化解决方案,提升性能。
读者对象
(1)MySQL初学者。建议按照顺序从本书的“基础篇”开始阅读。“基础篇”介绍了从安装部署、基础配置到性能诊断等日常工作需要了解的内容。在熟悉了MySQL的基本概念和大致原理以后,在阅读“案例篇”时,对问题的定义和解决方案才能理解得更加透彻。最后在阅读“工具篇”时,也可以学习到MySQL DBA日常工作所需要工具的使用方法和应用场景。
(2)专门从事MySQL工作1~3年的开发人员和运维人员。对于有一些MySQL开发和运维经验的人员,建议先跳过“基础篇”,直接从“案例篇”开始阅读。在“案例篇”中了解了具体的问题现象、故障处理的过程和方法以后,联系案例中对应的“基础篇”和“工具篇”知识进行阅读,这样能帮助你把很多知识点串联起来,由点到面形成更为全面的MySQL知识体系。
(3)资深的MySQL DBA。本书可以作为案头书,在解决问题时,如果记不清某些概念或者细节比较模糊,则可以拿来参考。
致谢
首先,感谢我的叔叔李巍,从一个贫家子弟到自己创业成立公司,到成为上市公司CEO,再到成立基金公司,他让我看到一个人的能力可以改变环境,让更多的人发挥自己的价值,也是他的经历激励着我继续努力。
其次,感谢阿里巴巴平台,在实际的工作中,这些之前一起奋斗过和现在正在一起奋斗的战友都给了我极大的帮助,他们是简朝阳、彭立勋、胡中泉、陈良允、陈栋、张瑞、熊中哲、何登成、梅庆、童家旺、李建辉、罗春、胜通、天羽、苏普等(排名不分先后)。
再次,感谢沃趣科技技术中心的负责人魏兴华,因为他的鼓励才有了这本书,感谢产品团队的负责人张文件、MySQL团队的同事刘云和沈刚帮助校稿,感谢市场部的同事杨雄飞、钱怡晨协调出版相关事宜。还要感谢其他在沃趣团队工作中一起成长的同学们,人数太多,这里就不一一提及了。
最后,感谢电子工业出版社的符隆美编辑大力配合我们推动图书的出版事宜。
本书作者
本书由李春、罗小波、董红禹共同编写,其中,李春负责编写第23~33章、第42~44章,罗小波负责编写第1~18章、第40~41章、第45~51章,董红禹负责编写第19~22章、第34~39章。
读者服务
轻松注册成为博文视点社区用户(www.broadview.com.cn),扫码直达本书页面。
? 下载资源:本书提供资源文件,均可在 下载资源 处下载。
? 提交勘误:您对书中内容的修改意见可在 提交勘误 处提交,若被采纳,将获赠博文视点社区积分(在您购买电子书时,积分可用来抵扣相应金额)。
? 交流互动:在
千金良方——MySQL性能优化金字塔法则 pdf下载声明
本pdf资料下载仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版