Merge pull request #13868 from kankute-sameer/litellm_feat_voyage_context_3_embedding_model

krrishdholakia · web-flow · commit 9c4a86e98e78 · 2025-08-21T23:18:20.000-07:00
[Feat] Add support for voyage-context-3 embedding model
diff --git a/litellm/__init__.py b/litellm/__init__.py
@@ -1147,6 +1147,7 @@ def add_known_models():
 from litellm.llms.openai.completion.transformation import OpenAITextCompletionConfig
 from .llms.groq.chat.transformation import GroqChatConfig
 from .llms.voyage.embedding.transformation import VoyageEmbeddingConfig
+from .llms.voyage.embedding.transformation_contextual import VoyageContextualEmbeddingConfig
 from .llms.infinity.embedding.transformation import InfinityEmbeddingConfig
 from .llms.azure_ai.chat.transformation import AzureAIStudioConfig
 from .llms.mistral.chat.transformation import MistralConfig
diff --git a/litellm/llms/voyage/embedding/transformation_contextual.py b/litellm/llms/voyage/embedding/transformation_contextual.py
@@ -0,0 +1,153 @@
+"""
+This module is used to transform the request and response for the Voyage contextualized embeddings API. 
+This would be used for all the contextualized embeddings models in Voyage. 
+"""
+from typing import List, Optional, Union
+
+import httpx
+
+from litellm.litellm_core_utils.litellm_logging import Logging as LiteLLMLoggingObj
+from litellm.llms.base_llm.chat.transformation import BaseLLMException
+from litellm.llms.base_llm.embedding.transformation import BaseEmbeddingConfig
+from litellm.secret_managers.main import get_secret_str
+from litellm.types.llms.openai import AllEmbeddingInputValues, AllMessageValues
+from litellm.types.utils import EmbeddingResponse, Usage
+
+
+class VoyageError(BaseLLMException):
+    def __init__(
+        self,
+        status_code: int,
+        message: str,
+        headers: Union[dict, httpx.Headers] = {},
+    ):
+        self.status_code = status_code
+        self.message = message
+        self.request = httpx.Request(
+            method="POST", url="https://api.voyageai.com/v1/contextualizedembeddings"
+        )
+        self.response = httpx.Response(status_code=status_code, request=self.request)
+        super().__init__(
+            status_code=status_code,
+            message=message,
+            headers=headers,
+        )
+
+
+class VoyageContextualEmbeddingConfig(BaseEmbeddingConfig):
+    """
+    Reference: https://docs.voyageai.com/reference/embeddings-api
+    """
+
+    def __init__(self) -> None:
+        pass
+
+    def get_complete_url(
+        self,
+        api_base: Optional[str],
+        api_key: Optional[str],
+        model: str,
+        optional_params: dict,
+        litellm_params: dict,
+        stream: Optional[bool] = None,
+    ) -> str:
+        if api_base:
+            if not api_base.endswith("/contextualizedembeddings"):
+                api_base = f"{api_base}/contextualizedembeddings"
+            return api_base
+        return "https://api.voyageai.com/v1/contextualizedembeddings"
+
+    def get_supported_openai_params(self, model: str) -> list:
+        return ["encoding_format", "dimensions"]
+
+    def map_openai_params(
+        self,
+        non_default_params: dict,
+        optional_params: dict,
+        model: str,
+        drop_params: bool,
+    ) -> dict:
+        """
+        Map OpenAI params to Voyage params
+
+        Reference: https://docs.voyageai.com/reference/contextualized-embeddings-api
+        """
+        if "encoding_format" in non_default_params:
+            optional_params["encoding_format"] = non_default_params["encoding_format"]
+        if "dimensions" in non_default_params:
+            optional_params["output_dimension"] = non_default_params["dimensions"]
+        return optional_params
+
+    def validate_environment(
+        self,
+        headers: dict,
+        model: str,
+        messages: List[AllMessageValues],
+        optional_params: dict,
+        litellm_params: dict,
+        api_key: Optional[str] = None,
+        api_base: Optional[str] = None,
+    ) -> dict:
+        if api_key is None:
+            api_key = (
+                get_secret_str("VOYAGE_API_KEY")
+                or get_secret_str("VOYAGE_AI_API_KEY")
+                or get_secret_str("VOYAGE_AI_TOKEN")
+            )
+        return {
+            "Authorization": f"Bearer {api_key}",
+        }
+
+    def transform_embedding_request(
+        self,
+        model: str,
+        input: Union[AllEmbeddingInputValues, List[List[str]]],
+        optional_params: dict,
+        headers: dict,
+    ) -> dict:
+        return {
+            "inputs": input,
+            "model": model,
+            **optional_params,
+        }
+
+    def transform_embedding_response(
+        self,
+        model: str,
+        raw_response: httpx.Response,
+        model_response: EmbeddingResponse,
+        logging_obj: LiteLLMLoggingObj,
+        api_key: Optional[str] = None,
+        request_data: dict = {},
+        optional_params: dict = {},
+        litellm_params: dict = {},
+    ) -> EmbeddingResponse:
+        try:
+            raw_response_json = raw_response.json()
+        except Exception:
+            raise VoyageError(
+                message=raw_response.text, status_code=raw_response.status_code
+            )
+
+        # model_response.usage
+        model_response.model = raw_response_json.get("model")
+        model_response.data = raw_response_json.get("data")
+        model_response.object = raw_response_json.get("object")
+
+        usage = Usage(
+            prompt_tokens=raw_response_json.get("usage", {}).get("total_tokens", 0),
+            total_tokens=raw_response_json.get("usage", {}).get("total_tokens", 0),
+        )
+        model_response.usage = usage
+        return model_response
+
+    def get_error_class(
+        self, error_message: str, status_code: int, headers: Union[dict, httpx.Headers]
+    ) -> BaseLLMException:
+        return VoyageError(
+            message=error_message, status_code=status_code, headers=headers
+        )
+
+    @staticmethod
+    def is_contextualized_embeddings(model: str) -> bool:
+        return "context" in model.lower()
diff --git a/litellm/model_prices_and_context_window_backup.json b/litellm/model_prices_and_context_window_backup.json
@@ -16710,6 +16710,14 @@
         "litellm_provider": "voyage",
         "mode": "embedding"
     },
+    "voyage/voyage-context-3": {
+        "max_tokens": 120000,
+        "max_input_tokens": 120000,
+        "input_cost_per_token": 1.8e-07,
+        "output_cost_per_token": 0.0,
+        "litellm_provider": "voyage",
+        "mode": "embedding"
+    },
     "voyage/rerank-2": {
         "max_tokens": 16000,
         "max_input_tokens": 16000,
diff --git a/litellm/utils.py b/litellm/utils.py
@@ -2802,12 +2802,22 @@ def _check_valid_arg(supported_params: Optional[list]):
             request_type="embeddings",
         )
         _check_valid_arg(supported_params=supported_params)
-        optional_params = litellm.VoyageEmbeddingConfig().map_openai_params(
-            non_default_params=non_default_params,
-            optional_params={},
-            model=model,
-            drop_params=drop_params if drop_params is not None else False,
-        )
+        if litellm.VoyageContextualEmbeddingConfig.is_contextualized_embeddings(model):
+            optional_params = (
+                litellm.VoyageContextualEmbeddingConfig().map_openai_params(
+                    non_default_params=non_default_params,
+                    optional_params={},
+                    model=model,
+                    drop_params=drop_params if drop_params is not None else False,
+                )
+            )
+        else:
+            optional_params = litellm.VoyageEmbeddingConfig().map_openai_params(
+                non_default_params=non_default_params,
+                optional_params={},
+                model=model,
+                drop_params=drop_params if drop_params is not None else False,
+            )
     elif custom_llm_provider == "infinity":
         supported_params = get_supported_openai_params(
             model=model,
@@ -7020,7 +7030,14 @@ def get_provider_embedding_config(
         model: str,
         provider: LlmProviders,
     ) -> Optional[BaseEmbeddingConfig]:
-        if litellm.LlmProviders.VOYAGE == provider:
+        if (
+            litellm.LlmProviders.VOYAGE == provider
+            and litellm.VoyageContextualEmbeddingConfig.is_contextualized_embeddings(
+                model
+            )
+        ):
+            return litellm.VoyageContextualEmbeddingConfig()
+        elif litellm.LlmProviders.VOYAGE == provider:
             return litellm.VoyageEmbeddingConfig()
         elif litellm.LlmProviders.TRITON == provider:
             return litellm.TritonEmbeddingConfig()
diff --git a/model_prices_and_context_window.json b/model_prices_and_context_window.json
@@ -17611,6 +17611,14 @@
         "litellm_provider": "voyage",
         "mode": "embedding"
     },
+    "voyage/voyage-context-3": {
+        "max_tokens": 120000,
+        "max_input_tokens": 120000,
+        "input_cost_per_token": 1.8e-07,
+        "output_cost_per_token": 0.0,
+        "litellm_provider": "voyage",
+        "mode": "embedding"
+    },
     "voyage/rerank-2": {
         "max_tokens": 16000,
         "max_input_tokens": 16000,
diff --git a/tests/llm_translation/test_voyage_ai.py b/tests/llm_translation/test_voyage_ai.py