如果没有备份,每台机器都使用多实例的模型

图片 5

原标题:MySQL运维经验

1. 概要

MySQL运维实践

mysql 主从复制

网易数据库 石勇

数据库的备份是极其重要的事情。如果没有备份,遇到下列情况就会抓狂:

图片 1


5.1-MySQL日志系统

提纲

  • 什么是主从复制
  • 主从复制的原理
  • 主从复制的用途
  • 主从复制的搭建
  • 主从复制的问题

  UPDATE or DELETE whitout where…

1. 概要

每台机器都使用多实例的模型。 每个机器放多个实例,每个实例放多个DB。

什么是日志

  • 日志(log)是一种顺序记录事件流水的文件
  • 记录计算机程序运行过程中发生了什么
  • 用途多样
  • 帮助分析程序问题
  • 分析服务请求的特征、流量等
  • 判断工作是否成功执行
  • ……

什么是主从复制

  • 数据拷贝
  • 准实时
  • 源-主节点;目的-从节点

  table was DROPPed accidentally…

每台机器都使用多实例的模型。 每个机器放多个实例,每个实例放多个DB。

一些信息可以参考: 

MySQL日志的分类

  • 服务器日志
    • 记录进程启动运行过程中的特殊事件,帮助分析MySQL服务遇到的问题
    • 根据需求抓取特定的SQL语句,追踪性能可能存在的问题的业务SQL
  • 事务日志
    • 记录应用程序对数据的所有更改
    • 可用于数据恢复
    • 可用于实例间数据同步
分类 日志名称
服务器日志 服务错误日志
服务器日志 慢查询日志
服务器日志 综合查询日志
事务日志 存储引擎事务日志
事务日志 二进制日志

主从复制的原理

master binary_log (I/O thread relay_log SQL thread)

  INNODB was corrupt…

多实例之间没有进行资源隔离,这么做是让每个实例都能发挥最大性能。

多实例之间没有进行资源隔离,这么做是让每个实例都能发挥最大性能。

服务错误日志

  • 记录实例启动运行过程中重要消息
  • 配置参数 log_error = /data/mysql_data/node-1/mysql.log
  • 内容并非全是错误消息
  • 如果mysqld进程无法正常启动首先查看错误日志

复制格式

  • SBR statement based replication
  • RBR Row based replication
  • MBR Mixed based replication
    show global variable like “binlog_format”;
    5.7之后 配置文件 默认为binlog_format =ROW

  entire datacenter loses power…

  从数据安全的角度来说,服务器磁盘都会做raid,MySQL本身也有主从、drbd等容灾机制,但它们都无法完全取代备份。容灾和高可用能帮我们有效的应对物理的、硬件的、机械的故障,而对我们犯下的逻辑错误却无能为力。每一种逻辑错误发生的概率都极低,但是当多种可能性叠加的时候,小概率事件就放大成很大的安全隐患,这时候备份的必要性就凸显了。那么在众多的MySQL备份方式中,哪一种才是适合我们的呢?

目前大部分核心业务已切换成MyRocks引擎,在机器硬件配置不变的情况,约可节省一半机器。

目前大部分核心业务已切换成MyRocks引擎,在机器硬件配置不变的情况,约可节省一半机器。

慢查询日志

  • 记录执行时间超过一定阈值的SQL语句
  • 配置参数

slow_query_log = 1
slow_query_log_file = /data/mysql_data/node-1/mysql-slow.log
long_query_time = 5
  • 用于分析系统中可能存在性能问题的SQL

主从复制的用途

  • 实时灾备,用于故障切换
  • 读写分离,提供查询服务
  • 备份,在从节点上备份
  • 此外,主从复制的一些模式
  • 一主一从
  • 主主复制
  • 一主多从
  • 多主一从
  • 联级复制

 常见的备份方式

  MySQL本身为我们提供了mysqldump、mysqlbinlog远程备份工具,percona也为我们提供了强大的Xtrabackup,加上开源的mydumper,还有基于主从同步的延迟备份、从库冷备等方式,以及基于文件系统快照的备份,其实选择已经多到眼花缭乱。而备份本身是为了恢复,所以能够让我们在出现故障后迅速、准确恢复的备份方式,就是最适合我们的,当然,同时能够省钱、省事,那就非常完美。下面就我理解的几种备份工具进行一些比较,探讨下它们各自的适用场景。

放在MyRocks上的核心业务主要有:Feed、Post、社交图谱等读写混合业务。

放在MyRocks上的核心业务主要有:Feed、Post、社交图谱等读写混合业务。

综合查询日志

  • 如果开启将会记录系统中所有SQL语句
  • 配置参数

general_log = 1
general_log_file = /data/mysql_data/node-1/mysql-slow.log
  • 偶尔用于帮助分析系统问题,对性能有影响

主从复制的搭建

主从部署必要条件

  • 主库开启binlog日志(设置log-bin参数)
  • 主从server-id不同
  • 从库服务器能连接主库
    主从复制的部署
  • 备份还原(mysqldump 或 xtrabackup)
  • 授权 (grant repliction slave on “.”)
  • 配置复制,并启动
  • 查看主从复制信息

show master status\G
show processlist\G

show slave status 
几组log
 * master——log_file
 * read_master_log_pos
 * relay_log_file
 * relay_log_pos

  1. mysqldump & mydumper

  mysqldump是最简单的逻辑备份方式。在备份myisam表的时候,如果要得到一致的数据,就需要锁表,简单而粗暴。而在备份innodb表的时候,加上–master-data=1
–single-transaction 选项,在事务开始时刻,记录下binlog
pos点,然后利用mvcc来获取一致的数据,由于是一个长事务,在写入和更新量很大的数据库上,将产生非常多的undo,显著影响性能,所以要慎用。

图片 2

  • 优点:简单,可针对单表备份,在全量导出表结构的时候尤其有用。
  • 缺点:简单粗暴,单线程,备份慢而且恢复慢,跨IDC有可能遇到时区问题。
    mydumper是mysqldump的加强版。相比mysqldump:
  • 内置支持压缩,可以节省2-4倍的存储空间。
  • 支持并行备份和恢复,因此速度比mysqldump快很多,但是由于是逻辑备份,仍不是很快。

MyRocks项目地址:

MyRocks项目地址:

查询日志的输出与文件切换

  • 日志输出参数

log_output={file|table|none}

  • 如果日志文件过大,可以定期截断并切换新文件

flush log;

主从复制的问题

存在的问题

  • 主库宕机,数据可能丢失
  • 从库只有一个sql thread ,主库写的压力大,复制很可能延时
    半同步复制 semi-sync
    并行复制:
  • 社区版5.6中新增
  • 并行复制是指从库多线程 apply binlog
  • 库级别并行应用binlog,同一个库数据更改还是串行的(5.7版并行复制基于事务组)
    *设置

set global slave_parallel_workers=10; #设置sql线程数为10

  2. 基于文件系统的快照

  基于文件系统的快照,是物理备份的一种。在备份前需要进行一些复杂的设置,在备份开始时刻获得快照并记录下binlog
pos点,然后采用类似copy-on-write的方式,把快照进行转储。转储快照本身会消耗一定的IO资源,而且在写入压力较大的实例上,保存被更改数据块的前印象也会消耗IO,最终表现为整体性能的下降。而且服务器还要为copy-on-write快照预留较多的磁盘空间,这本身对资源也是一种浪费。因此这种备份方式我们使用的不多。

图片 3

另外,MariaDB 10.2版本也即将整合MyRocks引擎。

另外,MariaDB 10.2版本也即将整合MyRocks引擎。

存储引擎事务日志

  • 部分存储引擎拥有重做日志(redo log)
  • 如InnoDB, TokuDB等WAL(Write Ahead Log)机制存储引擎
  • 日志随着事务commit优先持久化,确保异常恢复不丢数据
  • 日志顺序写性能较好

  3. Xtrabackup

  这或许是最为广泛的备份方式。percona之所以家喻户晓,Xtrabackup应该功不可没。它实际上是物理备份+逻辑备份的组合。在备份innodb表的时候,它拷贝ibd文件,并一刻不停的监视redo
log的变化,append到自己的事务日志文件。在拷贝ibd文件过程中,ibd文件本身可能被写”花”,这都不是问题,因为在拷贝完成后的第一个prepare阶段,Xtrabackup采用类似于innodb崩溃恢复的方法,把数据文件恢复到与日志文件一致的状态,并把未提交的事务回滚。如果同时需要备份myisam表以及innodb表结构等文件,那么就需要用flush
tables with
lock来获得全局锁,开始拷贝这些不再变化的文件,同时获得binlog位置,拷贝结束后释放锁,也停止对redo
log的监视。
它的工作原理如下:

图片 4

  由于mysql中不可避免的含有myisam表,同时innobackup并不备份表结构等文件,因此想要完整的备份mysql实例,就少不了要执行flush
tables with read
lock,而这个语句会被任何查询(包括select)阻塞,在阻塞过程中,它又反过来阻塞任何查询(包括select)。如果碰巧备份实例上有长查询先于flush
tables with read lock执行,数据库就会hang住。而当flush tables with read
lock获得全局锁后,虽然查询可以执行,但是仍会阻塞更新,所以,我们希望flush
tables with read lock从发起到结束,持续的时间越短越好。

  为了解决这个问题,有两种比较有效的方法:

2. 高可用机制

 

InnoDB事务日志重用机制

  • InnoDB事务日志采用两组文件交替重用

  1. 尽量不用myisam表。

采用基于GTID的一主多从结构,外加一个基于lossless
semi-sync机制的mysqlbinlog实现的binlog server(可以理解为MySQL 5.7的loss
zero replication)。

2. 高可用机制

二进制日志binlog

  • binlog (binary log)
  • 记录数据引起数据变化的SQL语句或数据逻辑变化的内容
  • MySQL服务层记录,无关存储引擎
  • binlog的主要作用:
    • 基于备份恢复数据
    • 数据库主从同步
    • 挖掘分析SQL语句

  2. Xtrabackup增加了–rsync选项,通过两次rsync来减少持有全局锁的时间。

  优化后的备份过程如下:

图片 5

  • 优点:在线热备,全备+增备+流备,支持限速,支持压缩,支持加密。
  • 缺点:需要获取全局锁,如果遇到长查询,等待时间将不可控,因此要做好监控,必要时杀死长查询或自杀;遇到超大的实例,备份过程较长,redo
    log太大会影响恢复速度,这种情况下最好采用延迟备份。

基于多数派实现自动选主。


开启binlog

  • 主要参数

log_bin = c:/tmp/mylog/mysql-bin
sql_log_bin = 1
sync_binlog = 1
  • 查看binlog

show binary logs;

  4. mysqlbinlog 5.6

  上述所有的备份方式,都只能把数据库恢复到备份的某个时间点:mysqldump和mydumper,以及snapshot是备份开始的时间点;Xtrabackup是备份结束的时间点。要想实现point
in time的恢复,还必须备份binlog。同时binlog也是实现增备的宝贵资源。

  幸运的是,mysql 5.6为我们提供了远程备份binlog的选项:

  mysqlbinlog –raw –read-from-remote-server –stop-never

  它会伪装成mysql从库,从远程获取binlog然后进行转储。这对线上主库容量不够无法保存较多binlog的场景非常有用。但是,它毕竟不像真正的mysql从库实例,状态监控和同步都需要单独部署。因此个人觉得采用blackhole来备份全量的binlog是更好的选择。笔者曾经实现过一个自动搭建blackhole从库的工具,稍加修改,就可以完美搭建出blackhole从库。一旦同步起来,基本一劳永逸,很少出问题,主从切换的时候跟着切了就行。

基于配置中心实现切换,未使用VIP。

采用基于GTID的一主多从结构,外加一个基于lossless
semi-sync机制的mysqlbinlog实现的binlog server(可以理解为MySQL 5.7的loss
zero replication)。

binlog管理

  • 主要参数

max_binlog_size = 100MB
expire_logs_days = 7
  • binlog始终生成新文件,不会重用

  • 手工清理binlog

purge binary logs to 'mysql-bin.000009';
purge binary logs before '2016-4-2 21:00:40'

  提示:

  • 不要小看binlog的备份。当5.6的多线程复制大规模使用后,从库追赶主库命令点的耗时将被极大缩短,这样我们把每天一次的全量备份改为每3天一次、甚至每周一次的全量备份,和持续的binlog增量备份。遇到故障需要恢复数据的时候,重放3、5天的binlog也是极快的。降低备份频率最直接的好处是,省钱、省事。
  • blackhole对于备份binlog是极好的。一方面可以长久的备份binlog用于恢复数据库,另一方面,在其上配置半同步复制,可以有效防止主库的binlog丢失。

在认为semi-sync复制可保证主从数据一致性的假设前提下,发生故障切换时,利用上述的binlog
server中的日志进行补全后再选新主、切换。

基于多数派实现自动选主。

查看binlog内容

  • 日志

show binlog events in 'mysql-bin.000011';
show binlog events in 'mysql-bin.000011' from 60 limit 3;
  • mysqlbinlog工具

mysqlbinlog c:/tmp/mylog/mysql-bin.000001
--start-datetime | --stop-datetime
--start-position | --stop-position

 总结

  备份方式各有千秋,而对我们来说,面对数千实例,选择合适的备份工具来实现统一配置、统一规划,构建智能调度的备份云平台才是王道。毕竟,多种备份方式共存的运维成本是不容忽视的。

  从使用经验来看,用Xtrabackup全备数据,用blackhole增备binlog,并定期对备份数据的有效性进行验证,是当下比较好的选择。

若个别情况下由于特殊原因,出现从库全部挂掉的情况,会将全部请求切到主库,由它扛起所有的业务服务压力。

基于配置中心实现切换,未使用VIP。

binlog格式

  • 主要参数

binlog_format = {ROW|STATEMENT|MIXED}

  • 查看row模式的binlog内容

mysqlbinlog --base64-output=decode-rows -v c:/tmp/mylpg/mysql-bin.000001

某个从库挂掉时,可以动态摘除。

在认为semi-sync复制可保证主从数据一致性的假设前提下,发生故障切换时,利用上述的binlog
server中的日志进行补全后再选新主、切换。

5.2-MySQL数据备份

3. 备份机制

若个别情况下由于特殊原因,出现从库全部挂掉的情况,会将全部请求切到主库,由它扛起所有的业务服务压力。

基本指数 – 备份用途

  • 数据备灾
    • 应对硬件故障数据丢失
    • 应对人为或程序bug导致数据删除
  • 制作镜像库以供服务
    • 需要将数据迁移、统计分析等用处
    • 需要为线上数据建立一个镜像

所有的备份都是基于mysqldump实现,之所以采用mysqldump逻辑备份好处有:

某个从库挂掉时,可以动态摘除。

基本知识 – 备份内容

  • 数据
    • 数据文件或文本格式数据
  • 操作日志(binlog)
    • 数据库变更日志
  • 无需备份索引,只备份数据;
  • 备份文件压缩比高,更节省磁盘空间;
  • 改进了mysqldump,备份过程中还进行额外压缩;

 

基本知识 – 冷备份与热备份

  • 冷备份
    • 关闭数据库服务,完整拷贝数据文件
  • 热备份
    • 在不影响数据库读写服务的情况下备份数据库

上面提到,因为采用多实例、多DB结构,备份时可以多DB并行备份。当然了,也会控制并行备份的数量,避免影响在线业务性能。

3. 备份机制

基本知识 – 物理备份与逻辑备份

  • 物理备份
    • 以数据页的形式拷贝数据
  • 逻辑备份
    • 导出为裸数据或者SQL(insert)语句

备份放在集中存储(HDFS)上, 据说已达EB级别容量。


基本知识 – 本地备份与远程备份

  • 本地备份
    • 在数据库服务器本地进行备份
  • 远程备份
    • 远程连接数据库进行备份