minor improvement

yeqcharlotte · yeqcharlotte · commit eb6cbdd5bf16 · 2025-06-09T01:04:11.000-07:00
Signed-off-by: Ye (Charlotte) Qi &lt;yeq@meta.com&gt;
diff --git a/vllm/utils.py b/vllm/utils.py
@@ -2329,11 +2329,13 @@ class MemoryProfilingResult:
 
     def __repr__(self) -> str:
         return (f"Memory profiling takes {self.profile_time:.2f} seconds. "
-                f"Weights memory: {(self.weights_memory / GiB_bytes):.2f}GiB; "
+                f"Total non KV cache memory: "
+                f"{(self.non_kv_cache_memory / GiB_bytes):.2f}GiB; "
+                f"torch peak memory increase: "
+                f"{(self.torch_peak_increase / GiB_bytes):.2f}GiB; "
                 f"non-torch forward increase memory: "
                 f"{(self.non_torch_increase / GiB_bytes):.2f}GiB; "
-                f"torch peak memory: "
-                f"{(self.torch_peak_increase / GiB_bytes):.2f}GiB.")
+                f"weights memory: {(self.weights_memory / GiB_bytes):.2f}GiB.")
 
 
 @contextlib.contextmanager
diff --git a/vllm/v1/worker/gpu_worker.py b/vllm/v1/worker/gpu_worker.py
@@ -218,8 +218,9 @@ def determine_available_memory(self) -> int:
 
         logger.debug(
             "Initial free memory: %.2f GiB, free memory: %.2f GiB, "
-            "total GPU memory: %.2f GiB", GiB(self.init_snapshot.free_memory),
-            GiB(free_gpu_memory), GiB(self.init_snapshot.total_memory))
+            "requested GPU memory: %.2f GiB",
+            GiB(self.init_snapshot.free_memory), GiB(free_gpu_memory),
+            GiB(self.requested_memory))
         logger.debug(profile_result)
         logger.info("Available KV cache memory: %.2f GiB",
                     GiB(available_kv_cache_memory))