[MXS-2138] Fallback to the stalled slaves if the master down Created: 2018-11-05 Updated: 2022-09-08 Resolved: 2022-09-08 |
|
| Status: | Closed |
| Project: | MariaDB MaxScale |
| Component/s: | readwritesplit |
| Affects Version/s: | 2.2.15 |
| Fix Version/s: | N/A |
| Type: | New Feature | Priority: | Major |
| Reporter: | Alexander Sheiko | Assignee: | Todd Stoffel (Inactive) |
| Resolution: | Won't Do | Votes: | 0 |
| Labels: | None | ||
| Epic Link: | Failover / Recovery Improvements |
| Description |
|
There is a case when the slaves with a large lag are disabled due to max_slave_replication_lag and the entire load went to the master and it collapsed ...
We really need the setting that allows MaxScale to use working, but not quite relevant, slaves only for reading (like router_options = running in readconnroute) |
| Comments |
| Comment by markus makela [ 2018-11-05 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Which version of MaxScale were you using? | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Alexander Sheiko [ 2018-11-05 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
2.2.15 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by markus makela [ 2019-06-18 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Can you try with the latest 2.3 release? | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Alexander Sheiko [ 2019-06-18 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
MaxScale 2.3.4 after the down of the master server automatically assigns a new one, contrary to `auto_failover=false`
This is normal??!
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by markus makela [ 2019-06-18 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Can you try with a more recent 2.3 version? If you can, the output of list servers before and after would help as well as the MaxScale logs. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Alexander Sheiko [ 2019-06-18 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
For the test lab, I used the last docker image of mariadb/maxscale:latest ... | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Alexander Sheiko [ 2019-06-18 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
The behavior is the same
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by markus makela [ 2019-06-18 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Can you post the full configuration logs? We think that the value of the master-retry-count might be too low and the slaves stop even trying to connect to the master which in turn causes them to stop being treated as slaves. Make sure the master-retry-count is set to a reasonably high value. The default of 86400 should be adequate for most purposes. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Alexander Sheiko [ 2019-06-18 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
The rest are default values. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Alexander Sheiko [ 2019-06-18 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
I also started on the slaves | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by markus makela [ 2019-06-18 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
OK, that might cause it. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by markus makela [ 2019-09-05 ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
We can use a mechanism similar to the rank mechanism added in 2.4 to prioritize servers that aren't lagging and allow use of lagging servers if nothing else is available. |