[MDEV-10703] SHOW SLAVE STATUS does not correctly reflect broken replication Created: 2016-08-30 Updated: 2016-11-30 Resolved: 2016-11-30 |
|
| Status: | Closed |
| Project: | MariaDB Server |
| Component/s: | Replication |
| Affects Version/s: | 10.1.16, 5.5 |
| Fix Version/s: | N/A |
| Type: | Bug | Priority: | Critical |
| Reporter: | Oli Sennhauser | Assignee: | Unassigned |
| Resolution: | Incomplete | Votes: | 0 |
| Labels: | need_feedback, replication | ||
| Environment: |
CentOS 7, Ubuntu 14.04 |
||
| Description |
|
We intentionally inserted some data on a slave which should arrive from the master at the same time. The following Query was running on Master all the time and twice on the Slave:
this was to show how replication will stop and how this will look like in SHOW SLAVE STATUS. Unfortunately SHOW SLAVE STATUS die NOT show this behaviour but was displaying:
But replication clearly stopped. No more rows were inserted on Slave in table test. After stopping and starting slave this state was also reflected in the SHOW SLAVE STATUS command.
Unfortunately we could not reproduce this behaviour nor create a reproducible test case. The steps we did on the Slave were as follows:
Table looks as follows:
|
| Comments |
| Comment by Oli Sennhauser [ 2016-08-30 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Customer reported, that this happens from time to time on his MariaDB replication farm. AND this is very dangerous because all replication monitoring solutions will not reflect proper replication state. You also have to watch SQL Thread pos constantly... | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Elena Stepanova [ 2016-08-30 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
oli,
After we clear it out, maybe we'll have a better picture of what's happening. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Oli Sennhauser [ 2016-08-31 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
This Morning we had a similar problem. Master was running over night. Slave was hybernated. After we woke up Slave it still shows SQL/IO Thread running but did not make any progress in processing the statements. After waiting for MORE than 2 minutes (tcp timeout) the situation was still the same. This was not the same master/slave system as before but was running more or less the same traffic.
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Oli Sennhauser [ 2016-08-31 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Hi Elena To your questions from yesterday:
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Elena Stepanova [ 2016-08-31 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
oli, Normally with a complaint like that, one would expect to see that the slave stopped executing events on whatever reason. But the slave status clearly shows that in fact the slave was not reading any events during this 10 second period, which a very different story. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Elena Stepanova [ 2016-11-02 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
oli, would you be able to provide the information as above? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Elena Stepanova [ 2016-11-30 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Please comment to re-open if you have new information on the issue. |