搭建MySQL MMM高可用_weixin_34124651的博客-程序员宝宝

搭建MMM:
1,安装
agent 节点执行
yum install -y mysql-mmm-agent
2, monitor 节点执行
yum install -y mysql-mmm-monitor
配置文件

1, /etc/init.d/mysql-mmm-agent start
perl: warning: Setting locale failed."的解决
vi /root/.bashrc
再最底部加上
export LC_ALL=C
或者直接运行
echo "export LC_ALL=C" >> /root/.bashrc
然后执行一下:
source /root/.bashrc

2,<host db1>
ip 192.168.60.166
mode master
peer centos_TP166
</host>
启动报错,Starting MMM Monitor Daemon: Config entry 'host->db2->peer'
修改错误 这个<host db1>的db1 改成centos_TP166
3,exec of /usr/libexec/mysql-mmm/monitor/checker reaped child 17439 with exit 65280
需要修改mmm_mon.conf的bin_path
4,配置/usr/sbin/mmm_control show 老是提示
ERROR: Can't connect to monitor daemon!
取消配置文件的 # 中文注释
5,配置好主主复制,和主从复制
6,/etc/init.d/mysql-mmm-monitor restart报错
Starting MMM Monitor Daemon: Can't run second copy of mmm_mond
原来是/etc/rc.d/init.d/mysql-mmm-monitor 的 MMMD_MON_PIDFILE="/var/run/mysql-mmm/mmm_mond_test_mmm.pid"
配置错误
7,MMM 一台mysqldown掉, 会将虚IP漂移到其他的机器,当重启mmm的monitor的监控时,会给其分配虚IP
INFO Moving role 'reader(192.168.60.60)' from host 'centos_TP168'to host 'centos_TP167'
8,mmm_control show 出现:
Warning: agent on host centos_TP167 is not reachable
在167机器上ps -ef|grep mm 出现多个 mmm_agentd, kill掉这些,在启动mmm_agentd就解决
9,执行命令后 mmm_control set_offline centos_TP166 166机器下线
但执行mmm_control show 就ERROR: Can't connect to monitor daemon!
执行mmm_control checks all也出现centos_TP166 rep_threads [last change: 2019/05/15 15:06:48] ERROR: Replication is broken
只有重新执行mmm_control set_online centos_TP166 再 checks才正常

2019年5月9日13:45:59
生产库上一般不建议设置过滤规则, 如果非要设置, 强烈建议从库使用通配符方式过滤某个库

2019年5月14日14:22:10
查mysql未提交事务
查询 正在执行的事务:
SELECT * FROM information_schema.INNODB_TRX

查看正在锁的事务
SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCKS;

查看等待锁的事务

SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCK_WAITS;

原文:https://blog.csdn.net/emoers/article/details/77971468

2019年5月16日15:12:23
手工 kill -9 mmm进程,查看/etc/init.d/mysql-mmm-monitor status
mmm_mond 已死,但 pid 文件仍存
如果
重启restart,提示 DEBUG Sending command 'GET_AGENT_STATUS()' to 167 (192.168.60.167)
一直不动,
查看167服务器的mysql-mmm-agent,手工kill -9 掉 mmm的进程,重启agent

关闭mysql-mmm-monitor ,要先关闭mysql-mmm-agent,再启动mysql-mmm-monitor


在CentOS 6.3 x86_64下安装php-mcrypt的时候出现了问题:Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again,需要安装epel源。

解决方法: 一句话:把/etc/yum.repos.d/epel.repo,文件第3行注释去掉,把第四行注释掉。具体如下:

打开/etc/yum.repos.d/epel.repo,将

[epel]
name=Extra Packages for Enterprise Linux 6 - $basearch
#baseurl=http://download.fedoraproject.org/pub/epel/6/$basearch
mirrorlist=https://mirrors.fedoraproject.org/metalink?repo=epel-6&arch=$basearch

修改为

[epel]
name=Extra Packages for Enterprise Linux 6 - $basearch
baseurl=http://download.fedoraproject.org/pub/epel/6/$basearch
#mirrorlist=https://mirrors.fedoraproject.org/metalink?repo=epel-6&arch=$basearch

再清理源,重新安装

yum clean all
yum install -y 需要的包

 

如果还是不行,修改DNS,到/etc/resolv.conf下添加一下:

nameserver 8.8.8.8
search localdomain

然后重启network服务:service network restart

配置文件:

 Monitor机器:   mmm_common.conf

active_master_role      writer

<host default>
    cluster_interface       eth0
    pid_path                /var/run/mysql-mmm/mmm_agentd.pid
    bin_path                /usr/libexec/mysql-mmm
    replication_user        sa
    replication_password    cc.123
    agent_user              sa
    agent_password          cc.123
    mysql_port              18602
</host>

<host centos_TP166>
    ip      192.168.60.166
    mode    master
    peer    centos_TP166
</host>

<host centos_TP167>
    ip      192.168.60.167
    mode    master
    peer    centos_TP167 
</host>

<host centos_TP168>
    ip      192.168.60.168
    mode    slave
</host>

<role writer>
    hosts   centos_TP167,centos_TP166 
    ips     192.168.60.40
    mode    exclusive
</role>

<role reader>
    hosts   centos_TP167,centos_TP168
    ips     192.168.60.60, 192.168.60.61
    mode    balanced
</role>

debug 0
View Code

 Monitor机器:   mmm_mon.conf

include mmm_common.conf

<monitor>
    ip               127.0.0.1
    port             9992
    pid_path         /var/run/mysql-mmm/mmm_mond_mmm.pid
    bin_path         /usr/libexec/mysql-mmm
    status_path      /var/lib/mysql-mmm/mmm_mond_test_mmm.status
    ping_ips         192.168.60.166, 192.168.60.167, 192.168.60.168
    auto_set_online  30                                           
</monitor>

<host default>
    monitor_user      sa       
    monitor_password  cc.123  
</host>

<check mysql>
    check_period      2       
    trap_period       4       
    max_backlog       900      
</check>
View Code

 agent 机器:   mmm_common.conf 

active_master_role      writer

<host default>
    cluster_interface       eth0
    pid_path                /var/run/mysql-mmm/mmm_agentd.pid
    bin_path                /usr/libexec/mysql-mmm/
    replication_user        sa
    replication_password    cc.123
    agent_user              sa
    agent_password          cc.123
    mysql_port              18602
</host>

<host centos_TP166>
    ip      192.168.60.166
    mode    master
    peer    centos_TP166
</host>

<host centos_TP167>
    ip      192.168.60.167
    mode    master
    peer    centos_TP167 
</host>

<host centos_TP168>
    ip      192.168.60.168
    mode    slave
</host>

<role writer>
    hosts   centos_TP167,centos_TP166 
    ips     192.168.60.40
    mode    exclusive
</role>

<role reader>
    hosts   centos_TP167,centos_TP168
    ips     192.168.60.60, 192.168.60.61
    mode    balanced
</role>
View Code

全部机器: /etc/hosts 新加:

192.168.60.165 centos_TP165
192.168.60.166 centos_TP166
192.168.60.167 centos_TP167
192.168.60.168 centos_TP168
View Code

 Monitor机器:  /etc/rc.d/init.d/mysql-mmm-monitor  启动MMM脚本

   检查 MMMD_MON_PIDFILE的pid文件 和  monitor的mmm_mon.conf配置的pid文件路径要一致

 

mysql-mmm故障处理机制中总结:

复制代码
 1.对外提供读写的虚拟IP是由monitor程序控制。如果monitor没有启动那么db服务器不会被分配虚拟ip,但是如果已经分配好了虚拟ip,当monitor程序关闭了原先分配的虚拟ip不会立即关闭外部程序还可以连接访问(只要不重启网络),这样的好处就是对于monitor的可靠性要求就会低一些,但是如果这个时候其中的某一个db服务器故障了就无法处理切换,也就是原先的虚拟ip还是维持不变,挂掉的那台DB的虚拟ip会变的不可访问。
 2.agent程序受monitor程序的控制处理write切换,从库切换等操作。如果monitor进程关闭了那么agent进程就起不到什么作用,它本身不能处理故障。
 3.monitor程序负责监控db服务器的状态,包括Mysql数据库、服务器是否运行、复制线程是否正常、主从延时等;它还用于控制agent程序处理故障。
 4.monitor会每隔几秒钟监控db服务器的状态,如果db服务器已经从故障变成了正常,那么monitor会自动在60s之后将其设置为online状态(默认是60s可以设为其它的值),有监控端的配置文件参数“auto_set_online”决定,群集服务器的状态有三种分别是:HARD_OFFLINE→AWAITING_RECOVERY→online
 5.默认monitor会控制mmm_agent会将writer db服务器read_only修改为OFF,其它的db服务器read_only修改为ON,所以为了严谨可以在所有的服务器的my.cnf文件中加入read_only=1由monitor控制来控制writer和read,root用户和复制用户不受read_only参数的影响。
复制代码

mysql-mmm架构总结:

(1)master-db2备选主节点宕机不影响集群的状态,就是移除了master-db2备选节点的读状态。
(2)master-db1主节点宕机,由master-db2备选主节点接管写角色,slave-db1,slave-db2指向新master2主库进行复制,slave-db1,slave-db2会自动change master到master2.
(3)如果master-db1主库宕机,master-db2复制应用又落后于master-db1时就变成了主可写状态,这时的数据主无法保证一致性。
   如果master-db2,slave-db1,slave-db2延迟于master-db1主,这个时master-db1宕机,slave-db1,slave-db2将会等待数据追上master-db1后,再重新指向新的主master-db2进行复制操作,这时的数据也无法保证同步的一致性。
(4)如果采用MMM高可用架构,主,主备选节点机器配置一样,而且开启半同步进一步提高安全性或采用MariaDB/mysql5.7进行多线程从复制,提高复制的性能。

转载于:https://www.cnblogs.com/zping/p/10840295.html

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_34124651/article/details/94468969

智能推荐

Ceph 客户端的 RPM 包升级问题_范桂飓的博客-程序员宝宝

问题最近想把一个现有的 Ceph 客户端升级为最新的 M 版:[[email protected] ~]# rpm -qa | grep cephpuppet-ceph-2.4.1-2.el7ost.noarchlibcephfs1-10.2.10-17.el7cp.x86_64ceph-base-10.2.10-17.el7cp.x86_64ceph-osd-10...

ParaView中的EvenlySpacedStreamlines2D filter,实现二维平面上流线的均匀分布__黄岛主_的博客-程序员宝宝_evenlyspacedstreamlines2d filter

通过之前的文章在 ParaView 中画截面上的流线是可以实现在二维平面上绘制流线的,绘制后的局部细节如下:可以看出上面的流线分布非常不均匀,有些地方密集,有些地方稀疏,如果想要使流线均匀的分布,可以使用EvenlySpacedStreamlines2D filter,在平面上应用后效果如下:可以看出流线的分布均匀了很多。...

三菱fx2n64mr说明书_FX2N-64MR-001手册三菱FX2N-64MR-001使用说明书 - 广州凌控_桃仁田七的博客-程序员宝宝

输入点数:32点。输出点数:32点。输出形式:晶体管。连接的可编程控制器:FX1NC、FX2NC、FX3UC。FX2NC用扩展模块可以直接连接在FX1NC、FX2NC、FX3UC PLC上的输入输出扩展三菱FX2N-64MR-001使用说明书。不需要连接电缆等,因此可进行紧凑型的扩展。将连接器转换为螺钉中继端子排FX2N-64MR-001转换模块的信号的动作显示灯亮。正极公共端用 带显示。三菱变频...

Linux__hadoop免密登录&JavaToJDFS_lhy857的博客-程序员宝宝

配置ssh免登陆生成ssh免登陆密钥cd ~,进入到我的home目录cd .ssh/ssh-keygen -t rsa (四个回车)执行完这个命令后,会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥)将公钥拷贝到要免登陆的机器上cat ~/.ssh/id_rsa.pub &gt;&gt; ~/.ssh/authorized_keys cat是查看或ssh-copy-id -i localhost关闭所有stop-all.sh开启所有start-all.shhadoo

大型网站架构改进历程:存储的瓶颈_dcj0913的博客-程序员宝宝

【编者按】本文转自博客园的 夏天的森林,在看这篇之前,大家可以移步看 大型网站架构改进历程:存储的瓶颈(一)、(二)、(三)、(四)。上文里我遗留了两个问题,一个问题是数据库做了水平拆分以后,如果我们对主键的设计采取一种均匀分布的策略,那么它对于被水平拆分出的表后续的查询操作将有何种影响,第二个问题就是水平拆分的扩容问题。这两个问题在深入下去,本系列就越来越技术化了,可能最终很多朋友读

青海这个不起眼的小镇,竟藏着一个千万千瓦级光伏发电基地_专注可视化的川妹子的博客-程序员宝宝

安装在办公楼顶的光伏发电板不仅能为园区内提供电能,还能隔热降温。

随便推点

JavaWeb使用websocket服务端向客户端发送消息_code monkey的博客-程序员宝宝

原文链接1原文链接2前端&lt;%@ page language="java" pageEncoding="UTF-8" %&gt;&lt;!DOCTYPE html&gt;&lt;html&gt;&lt;head&gt; &lt;title&gt;Java后端WebSocket的Tomcat实现&lt;/title&gt;&lt;/head&gt;&lt;body&gt;...

分享一组Rpg Marker人物行走,游戏素材图片,共6张图片_webrpg的博客-程序员宝宝

分享一组Rpg Marker人物行走,游戏素材图片,共6张图片 上面的下载地址链接是图片,无法直接复制哦!下载请直接点击: 游戏素材下载 或者复制以下链接:http://www.2gei.com/view/228.html...

[敏捷开发培训] Scrum Guide 2020与 Scrum Guide 2017版本的对比_梅森上校的博客-程序员宝宝

Scrum Guide 2020 翻译为:《2020年Scrum指南》Scrum相关的所有规则、工件(Artifacts)、事件和角色的指南在2020年11月18日再次更新,Jeff Sutherland和Ken Schwaber 已经发布了对Scrum Guide的实质性更新。上一次更新是在近三年前,也就是2017年。合著者表示,2020年Scrum指南将有助于通过软化或删除规定性语言,使Scrum回归到其最低框架性质。如果你是开发人员、Scrum Master、项目经理或业务所有者(Busi..

100+问说清放大器噪声那些事儿,超实用技巧_chooseboy的博客-程序员宝宝

噪声是电子设计中必须处理等信号之一,我们都知道放大器的噪声有两种类型:一种是外部噪声,来源于放大器外部;另一种是内部噪声,来源于器件本身,处理放大器的噪声对于提升电子产品的性能至关重要,这里我们以问答形式对放大器噪声原理进行阐述,并阐述一些如何处理放大器噪声等实用技巧。Q1 [问:]放大器的内部噪音如何进行精确测量?它和那些因素有关?在测试时需要注意那些问题?[答:] 对于放大器的...

idea翻译插件Translation无法翻译_噎翔的博客-程序员宝宝_translation不能翻译

错误提示:Too Many Requests.重新下载和更改设置和重启idea都无法恢复,重启电脑后一切恢复正常

VS插件CodeRush for Visual Studio发布v18.2.9|附下载_weixin_30376509的博客-程序员宝宝

CodeRush能帮助你以极高的效率创建和维护源代码。Consume-first 申明,强大的模板,智能的选择工具,智能代码分析和创新的导航以及一个无与伦比的重构集,在它们的帮助下能够大大的提高你效率。【CodeRush for Visual Studio v18.2.9最新版免费下载】支持Visual Studio 2019CodeRush现在可以在Visual Studio 201...