review comments

vllm-project · LiuXiaoxuanPKU · Oct 6, 2024 · Sep 29, 2024 · Oct 3, 2024 · Oct 4, 2024
commit 76d3e24fa598c691c98b6f1bcb6c9c454c4a4715
diff --git a/tests/core/test_num_computed_tokens_update.py b/tests/core/test_num_computed_tokens_update.py
@@ -55,19 +55,21 @@ def test_num_computed_tokens_update(num_scheduler_steps: int,
             engine.step()
 
         if not seq.is_finished():
-            assert seq.data.get_num_computed_tokens(
-            ) == prompt_len + num_prompt_steps - 1
-
             prompt_num_computed_tokens = seq.data.get_num_computed_tokens()
+            # Test correctness of num_computed_tokens after the prompt steps
+            assert prompt_num_computed_tokens == \
+                        prompt_len + num_prompt_steps - 1
 
             decode_step_counter = 0
             while not seq.is_finished():
+                # Test correctness of num_computed_tokens after the decode steps
                 assert seq.data.get_num_computed_tokens(
                 ) == prompt_num_computed_tokens + decode_step_counter
                 for _ in range(num_scheduler_steps):
                     # decode step
                     engine.step()
                     decode_step_counter += 1
 
+        # Test correctness of num_computed_tokens after the sequence finish.
         assert seq.data.get_num_computed_tokens(
         ) == prompt_len + num_output_tokens - 1