[Bugfix] Fix TP > 1 for new granite (vllm-project#8544)

joerunde · LeiWang1999 · commit c92000a18ce1 · 2025-03-26T10:14:33.000Z
Signed-off-by: Joe Runde &lt;Joseph.Runde@ibm.com&gt;
Signed-off-by: LeiWang1999 &lt;leiwang1999@outlook.com&gt;
diff --git a/vllm/model_executor/models/granite.py b/vllm/model_executor/models/granite.py
@@ -428,7 +428,8 @@ def compute_logits(
             sampling_metadata: SamplingMetadata) -> Optional[torch.Tensor]:
         logits = self.logits_processor(self.lm_head, hidden_states,
                                        sampling_metadata)
-        logits /= self.config.logits_scaling
+        if logits is not None:
+            logits /= self.config.logits_scaling
         return logits
 
     def sample(