Applying log_softmax in generate

flowersteam · ClementRomac · Feb 21, 2024 · Feb 21, 2024 · Feb 21, 2024 · Feb 21, 2024
commit 042765e699ac0151e002918f219bd16c12e67481
diff --git a/lamorel/src/lamorel/server/llms/hf_llm.py b/lamorel/src/lamorel/server/llms/hf_llm.py
@@ -1,5 +1,5 @@
 import torch
-from math import ceil
+from torch.nn.functional import log_softmax
 
 import logging
 lamorel_logger = logging.getLogger('lamorel_logger')
@@ -214,20 +214,24 @@ def generate(self, contexts, return_logprobs=False, **kwargs):
 
             _generated_texts = self._LLM_tokenizer.batch_decode(generated_sequences, skip_special_tokens=True)
             if return_logprobs:
-                logp = torch.stack(results.scores, dim=1)
-                texts_logp = torch.gather(logp, 2, generated_sequences[:, :, None]).squeeze(-1)
-                _scores = texts_logp.sum(-1)
+                logp = log_softmax(torch.stack(results.scores, dim=1), dim=-1)
+                scores = torch.gather(logp, 2, generated_sequences[:, :, None]).squeeze(-1)
+                aggregated_scores = scores.sum(-1)
             else:
                 probabilities = torch.stack(results.scores, dim=1).softmax(-1)
-                texts_probabilities = torch.gather(probabilities, 2, generated_sequences[:, :, None]).squeeze(-1)
-                _scores = texts_probabilities.prod(-1)
+                scores = torch.gather(probabilities, 2, generated_sequences[:, :, None]).squeeze(-1)
+                aggregated_scores = scores.prod(-1)
 
             generations.append([
                 {
                     "text": _text,
                     "score": _score.detach().cpu().numpy()
+                    "text_probability" if not return_logprobs else "text_logprob": _agg_score.detach().cpu().numpy(),
+                    "tokens_probability" if not return_logprobs else "tokens_logprob": _scores.detach().cpu().numpy()
                 }
                 for _text, _score in zip(_generated_texts, _scores)
+                for _text, _tokens, _scores, _agg_score in
+                zip(_generated_texts, generated_sequences, scores, aggregated_scores)
             ])
 
             if "sequences_scores" in results: # Useful for Beam search