fix: update reorg tests to set ranges_complete=True for proper state tracking

incrypto32 · incrypto32 · commit 04e4f90444f9 · 2026-01-07T16:34:41.000+04:00
The recent microbatch processing changes require ranges_complete=True for
batches to be tracked in the state store. This fixes all reorg handling
tests by ensuring test batches are properly marked as complete, allowing
the reorg deletion logic to find and remove the appropriate data.

- Updated 16 reorg-related tests across 4 loader implementations
- All test batches now set ranges_complete=True in BatchMetadata
- Ensures accurate testing of real-world reorg handling behavior
diff --git a/tests/integration/test_deltalake_loader.py b/tests/integration/test_deltalake_loader.py
@@ -586,15 +586,24 @@ def test_handle_reorg_single_network(self, delta_temp_config):
             # Create response batches with hashes
             response1 = ResponseBatch.data_batch(
                 data=batch1,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xabc')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xabc')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response2 = ResponseBatch.data_batch(
                 data=batch2,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xdef')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xdef')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response3 = ResponseBatch.data_batch(
                 data=batch3,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=200, end=210, hash='0x123')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=200, end=210, hash='0x123')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
 
             # Load via streaming API
@@ -637,19 +646,31 @@ def test_handle_reorg_multi_network(self, delta_temp_config):
             # Create response batches with network-specific ranges
             response1 = ResponseBatch.data_batch(
                 data=batch1,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xaaa')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xaaa')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response2 = ResponseBatch.data_batch(
                 data=batch2,
-                metadata=BatchMetadata(ranges=[BlockRange(network='polygon', start=100, end=110, hash='0xbbb')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='polygon', start=100, end=110, hash='0xbbb')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response3 = ResponseBatch.data_batch(
                 data=batch3,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xccc')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xccc')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response4 = ResponseBatch.data_batch(
                 data=batch4,
-                metadata=BatchMetadata(ranges=[BlockRange(network='polygon', start=150, end=160, hash='0xddd')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='polygon', start=150, end=160, hash='0xddd')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
 
             # Load via streaming API
@@ -689,15 +710,24 @@ def test_handle_reorg_overlapping_ranges(self, delta_temp_config):
             # Batch 3: 170-190 (after reorg, but should be deleted as 170 >= 150)
             response1 = ResponseBatch.data_batch(
                 data=batch1,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=90, end=110, hash='0xaaa')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=90, end=110, hash='0xaaa')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response2 = ResponseBatch.data_batch(
                 data=batch2,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=140, end=160, hash='0xbbb')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=140, end=160, hash='0xbbb')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response3 = ResponseBatch.data_batch(
                 data=batch3,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=170, end=190, hash='0xccc')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=170, end=190, hash='0xccc')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
 
             # Load via streaming API
@@ -733,15 +763,24 @@ def test_handle_reorg_version_history(self, delta_temp_config):
 
             response1 = ResponseBatch.data_batch(
                 data=batch1,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=0, end=10, hash='0xaaa')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=0, end=10, hash='0xaaa')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response2 = ResponseBatch.data_batch(
                 data=batch2,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=50, end=60, hash='0xbbb')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=50, end=60, hash='0xbbb')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response3 = ResponseBatch.data_batch(
                 data=batch3,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xccc')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xccc')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
 
             # Load via streaming API
@@ -792,12 +831,18 @@ def test_streaming_with_reorg(self, delta_temp_config):
             # Create response batches using factory methods (with hashes for proper state management)
             response1 = ResponseBatch.data_batch(
                 data=data1,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xabc123')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xabc123')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
 
             response2 = ResponseBatch.data_batch(
                 data=data2,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xdef456')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xdef456')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
 
             # Simulate reorg event using factory method
diff --git a/tests/integration/test_lmdb_loader.py b/tests/integration/test_lmdb_loader.py
@@ -411,15 +411,24 @@ def test_handle_reorg_single_network(self, lmdb_config):
         # Create response batches with hashes
         response1 = ResponseBatch.data_batch(
             data=batch1,
-            metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xabc')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xabc')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
         response2 = ResponseBatch.data_batch(
             data=batch2,
-            metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xdef')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xdef')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
         response3 = ResponseBatch.data_batch(
             data=batch3,
-            metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=200, end=210, hash='0x123')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='ethereum', start=200, end=210, hash='0x123')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
 
         # Load via streaming API
@@ -468,19 +477,31 @@ def test_handle_reorg_multi_network(self, lmdb_config):
         # Create response batches with network-specific ranges
         response1 = ResponseBatch.data_batch(
             data=batch1,
-            metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xaaa')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xaaa')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
         response2 = ResponseBatch.data_batch(
             data=batch2,
-            metadata=BatchMetadata(ranges=[BlockRange(network='polygon', start=100, end=110, hash='0xbbb')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='polygon', start=100, end=110, hash='0xbbb')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
         response3 = ResponseBatch.data_batch(
             data=batch3,
-            metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xccc')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xccc')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
         response4 = ResponseBatch.data_batch(
             data=batch4,
-            metadata=BatchMetadata(ranges=[BlockRange(network='polygon', start=150, end=160, hash='0xddd')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='polygon', start=150, end=160, hash='0xddd')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
 
         # Load via streaming API
@@ -524,15 +545,24 @@ def test_handle_reorg_overlapping_ranges(self, lmdb_config):
         # Batch 3: 170-190 (after reorg, but should be deleted as 170 >= 150)
         response1 = ResponseBatch.data_batch(
             data=batch1,
-            metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=90, end=110, hash='0xaaa')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='ethereum', start=90, end=110, hash='0xaaa')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
         response2 = ResponseBatch.data_batch(
             data=batch2,
-            metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=140, end=160, hash='0xbbb')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='ethereum', start=140, end=160, hash='0xbbb')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
         response3 = ResponseBatch.data_batch(
             data=batch3,
-            metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=170, end=190, hash='0xccc')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='ethereum', start=170, end=190, hash='0xccc')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
 
         # Load via streaming API
@@ -577,12 +607,18 @@ def test_streaming_with_reorg(self, lmdb_config):
         # Create response batches using factory methods (with hashes for proper state management)
         response1 = ResponseBatch.data_batch(
             data=data1,
-            metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xabc123')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='ethereum', start=100, end=110, hash='0xabc123')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
 
         response2 = ResponseBatch.data_batch(
             data=data2,
-            metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xdef456')]),
+            metadata=BatchMetadata(
+                ranges=[BlockRange(network='ethereum', start=150, end=160, hash='0xdef456')],
+                ranges_complete=True,  # Mark as complete so it gets tracked in state store
+            ),
         )
 
         # Simulate reorg event using factory method
diff --git a/tests/integration/test_postgresql_loader.py b/tests/integration/test_postgresql_loader.py
@@ -541,19 +541,31 @@ def test_handle_reorg_deletion(self, postgresql_test_config, test_table_name, cl
             # Create response batches with hashes
             response1 = ResponseBatch.data_batch(
                 data=batch1,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=100, end=102, hash='0xaaa')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=100, end=102, hash='0xaaa')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response2 = ResponseBatch.data_batch(
                 data=batch2,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=103, end=104, hash='0xbbb')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=103, end=104, hash='0xbbb')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response3 = ResponseBatch.data_batch(
                 data=batch3,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=105, end=106, hash='0xccc')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=105, end=106, hash='0xccc')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response4 = ResponseBatch.data_batch(
                 data=batch4,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=107, end=108, hash='0xddd')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=107, end=108, hash='0xddd')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
 
             # Load via streaming API
@@ -605,7 +617,10 @@ def test_reorg_with_overlapping_ranges(self, postgresql_test_config, test_table_
 
             response = ResponseBatch.data_batch(
                 data=batch,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=150, end=175, hash='0xaaa')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=150, end=175, hash='0xaaa')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
 
             # Load via streaming API
@@ -658,11 +673,17 @@ def test_reorg_preserves_different_networks(self, postgresql_test_config, test_t
 
             response_eth = ResponseBatch.data_batch(
                 data=batch_eth,
-                metadata=BatchMetadata(ranges=[BlockRange(network='ethereum', start=100, end=100, hash='0xaaa')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='ethereum', start=100, end=100, hash='0xaaa')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
             response_poly = ResponseBatch.data_batch(
                 data=batch_poly,
-                metadata=BatchMetadata(ranges=[BlockRange(network='polygon', start=100, end=100, hash='0xbbb')]),
+                metadata=BatchMetadata(
+                    ranges=[BlockRange(network='polygon', start=100, end=100, hash='0xbbb')],
+                    ranges_complete=True,  # Mark as complete so it gets tracked in state store
+                ),
             )
 
             # Load both batches via streaming API
diff --git a/tests/integration/test_redis_loader.py b/tests/integration/test_redis_loader.py