[MDEV-33274] The test encryption.innodb-redo-nokeys often fails Created: 2024-01-18 Updated: 2024-02-08 Resolved: 2024-02-08 |
|
| Status: | Closed |
| Project: | MariaDB Server |
| Component/s: | Encryption, Storage Engine - InnoDB, Tests |
| Affects Version/s: | 10.5, 10.6, 10.11, 11.0, 11.1, 11.2, 11.3, 11.4 |
| Fix Version/s: | 11.3.2, 10.5.25, 10.6.18, 10.11.8, 11.0.6, 11.1.5, 11.2.4 |
| Type: | Bug | Priority: | Major |
| Reporter: | Marko Mäkelä | Assignee: | Debarun Banerjee |
| Resolution: | Fixed | Votes: | 0 |
| Labels: | recovery | ||
| Issue Links: |
|
||||||||
| Description |
|
The test encryption.innodb-redo-nokeys often fails in various ways on 10.5 and later versions. On 10.4 I found a shutdown hang as well as SAFEMALLOC warnings on memory leaks, but nothing like this. Here are a few examples:
The redo logging and recovery was rewritten in These failures need to be analyzed to determine the reason of the failure. Possibly we will need to improve the control of background writes, page flushing and the checkpoint activity, like we have done in the test innodb.doublewrite ( |
| Comments |
| Comment by Debarun Banerjee [ 2024-01-30 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
10.11: Could reproduce all the symptoms. The intermittent behaviour is caused by the page flush and intermittent checkpoint. 1. [ERROR] InnoDB: Missing FILE_CHECKPOINT(72379) at 1561912 2. [ERROR] InnoDB: Log scan aborted at LSN 1561912
3. -FOUND 1 /[ERROR] InnoDB: Encryption key is not found for .*test.t1.ibd/ in mysqld.1.err
All 3 cases can be repeated by forcing intermediate flush and checkpoint.
Fix (10.11):
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Debarun Banerjee [ 2024-01-30 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
10.6: Two issues from 10.11 are relevant. The reason is same. 1. [ERROR] InnoDB: Missing FILE_CHECKPOINT(72379) at 1561912 Can be repeated with following change in test in debug mode.
Fix 10.6
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Debarun Banerjee [ 2024-01-30 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Only one issue is relevant for 10.5. The reason is same. 1. [ERROR] InnoDB: Missing FILE_CHECKPOINT(72379) at 1561912 Fix 10.5
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Debarun Banerjee [ 2024-01-30 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Created 3 pull requests for 10.5, 10.6 & 10.11 as the patches vary. 10.5: https://github.com/MariaDB/server/pull/3031 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Debarun Banerjee [ 2024-01-30 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Hi, | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Marko Mäkelä [ 2024-02-02 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Great work! Unrelated to your improvements, I noticed that the 10.6 and 10.11 versions of the test are being skipped very easily on my system, and also on buildbot. It could be useful to ensure that a log checkpoint is executed right before the no_checkpoint_start.inc. We can’t use the debug setting SET GLOBAL innodb_buf_flush_list_now = 1; to achieve that, because this test is targeting all builds. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Comment by Debarun Banerjee [ 2024-02-08 ] | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
The fix is pushed to 10.5 The merge to 10.6 and 10.11 is non-trivial. We need to use the following patches while merging. 10.6: https://github.com/MariaDB/server/pull/3032 |