pydantic ai model

CTY-git · CTY-git · commit 070fce1b1473 · 2025-02-12T21:37:53.000+08:00
diff --git a/patchwork/common/client/llm/aio.py b/patchwork/common/client/llm/aio.py
@@ -9,8 +9,11 @@
     ChatCompletionToolParam,
     completion_create_params,
 )
-from typing_extensions import Dict, Iterable, List, Optional, Union
-
+from typing_extensions import Dict, Iterable, List, Optional, Union, AsyncIterator
+from pydantic_ai.messages import ModelMessage, ModelResponse
+from pydantic_ai.models import ModelRequestParameters, StreamedResponse, Model
+from pydantic_ai.settings import ModelSettings
+from pydantic_ai.usage import Usage
 from patchwork.common.client.llm.anthropic import AnthropicLlmClient
 from patchwork.common.client.llm.google import GoogleLlmClient
 from patchwork.common.client.llm.openai_ import OpenAiLlmClient
@@ -31,6 +34,64 @@ def __init__(self, *clients: LlmClient):
             except Exception:
                 pass
 
+    def __get_model(self, model_settings: ModelSettings | None) -> None:
+        if model_settings is None:
+            raise ValueError("Model settings cannot be None")
+        model_name = model_settings.get("model")
+        if model_name is None:
+            raise ValueError("Model must be set cannot be None")
+
+        return model_name
+
+    async def request(
+            self,
+            messages: list[ModelMessage],
+            model_settings: ModelSettings | None,
+            model_request_parameters: ModelRequestParameters,
+    ) -> tuple[ModelResponse, Usage]:
+        model = self.__get_model(model_settings)
+        if model is None:
+            raise ValueError("Model cannot be unset")
+
+        for client in self.__clients:
+            if client.is_model_supported(model):
+                return await client.request(messages, model_settings, model_request_parameters)
+
+        client_names = [client.__class__.__name__ for client in self.__original_clients]
+        raise ValueError(
+            f"Model {model} is not supported by {client_names} clients. "
+            f"Please ensure that the respective API keys are correct."
+        )
+
+    async def request_stream(
+            self,
+            messages: list[ModelMessage],
+            model_settings: ModelSettings | None,
+            model_request_parameters: ModelRequestParameters,
+    ) -> AsyncIterator[StreamedResponse]:
+        model = self.__get_model(model_settings)
+        if model is None:
+            raise ValueError("Model cannot be unset")
+
+        for client in self.__clients:
+            if client.is_model_supported(model):
+                yield client.request(messages, model_settings, model_request_parameters)
+                return
+
+        client_names = [client.__class__.__name__ for client in self.__original_clients]
+        raise ValueError(
+            f"Model {model} is not supported by {client_names} clients. "
+            f"Please ensure that the respective API keys are correct."
+        )
+
+    @property
+    def model_name(self) -> str:
+        return "Undetermined"
+
+    @property
+    def system(self) -> str:
+        return next(iter(self.__clients)).system
+
     def get_models(self) -> set[str]:
         return self.__supported_models
 
diff --git a/patchwork/common/client/llm/anthropic.py b/patchwork/common/client/llm/anthropic.py
@@ -2,7 +2,7 @@
 
 import json
 import time
-from functools import lru_cache
+from functools import lru_cache, cached_property
 
 from anthropic import Anthropic
 from anthropic.types import Message, MessageParam, TextBlockParam
@@ -14,13 +14,18 @@
     ChatCompletionToolParam,
     completion_create_params,
 )
+from pydantic_ai.messages import ModelMessage, ModelResponse
+from pydantic_ai.models import ModelRequestParameters, StreamedResponse, Model
+from pydantic_ai.settings import ModelSettings
+from pydantic_ai.usage import Usage
+from pydantic_ai.models.anthropic import AnthropicModel
 from openai.types.chat.chat_completion import Choice, CompletionUsage
 from openai.types.chat.chat_completion_message_tool_call import (
     ChatCompletionMessageToolCall,
     Function,
 )
 from openai.types.completion_usage import CompletionUsage
-from typing_extensions import Dict, Iterable, List, Optional, Union
+from typing_extensions import Dict, Iterable, List, Optional, Union, AsyncIterator
 
 from patchwork.common.client.llm.protocol import NOT_GIVEN, LlmClient, NotGiven
 
@@ -73,7 +78,46 @@ class AnthropicLlmClient(LlmClient):
     __100k_models = {"claude-2.0", "claude-instant-1.2"}
 
     def __init__(self, api_key: str):
-        self.client = Anthropic(api_key=api_key)
+        self.__api_key = api_key
+
+    @cached_property
+    def __client(self):
+        return Anthropic(api_key=self.__api_key)
+
+    def __get_pydantic_model(self, model_settings: ModelSettings | None) -> Model:
+        if model_settings is None:
+            raise ValueError("Model settings cannot be None")
+        model_name = model_settings.get("model")
+        if model_name is None:
+            raise ValueError("Model must be set cannot be None")
+
+        return AnthropicModel(model_name, api_key=self.__api_key)
+
+    async def request(
+            self,
+            messages: list[ModelMessage],
+            model_settings: ModelSettings | None,
+            model_request_parameters: ModelRequestParameters,
+    ) -> tuple[ModelResponse, Usage]:
+        model = self.__get_pydantic_model(model_settings)
+        return await model.request(messages, model_settings, model_request_parameters)
+
+    async def request_stream(
+            self,
+            messages: list[ModelMessage],
+            model_settings: ModelSettings | None,
+            model_request_parameters: ModelRequestParameters,
+    ) -> AsyncIterator[StreamedResponse]:
+        model = self.__get_pydantic_model(model_settings)
+        yield model.request_stream(messages, model_settings, model_request_parameters)
+
+    @property
+    def model_name(self) -> str:
+        return "Undetermined"
+
+    @property
+    def system(self) -> str:
+        return "anthropic"
 
     def __get_model_limit(self, model: str) -> int:
         # it is observed that the count tokens is not accurate, so we are using a safety margin
@@ -248,7 +292,7 @@ def is_prompt_supported(
             for k, v in input_kwargs.items()
             if k in {"messages", "model", "system", "tool_choice", "tools", "beta"}
         }
-        message_token_count = self.client.beta.messages.count_tokens(**count_token_input_kwargs)
+        message_token_count = self.__client.beta.messages.count_tokens(**count_token_input_kwargs)
         return model_limit - message_token_count.input_tokens
 
     def truncate_messages(
@@ -292,5 +336,5 @@ def chat_completion(
             top_p=top_p,
         )
 
-        response = self.client.messages.create(**input_kwargs)
+        response = self.__client.messages.create(**input_kwargs)
         return _anthropic_to_openai_response(model, response)
diff --git a/patchwork/common/client/llm/google.py b/patchwork/common/client/llm/google.py
@@ -20,8 +20,13 @@
     ChatCompletionToolParam,
     completion_create_params,
 )
+from pydantic_ai.messages import ModelMessage, ModelResponse
+from pydantic_ai.models import ModelRequestParameters, StreamedResponse, Model
+from pydantic_ai.settings import ModelSettings
+from pydantic_ai.usage import Usage
+from pydantic_ai.models.gemini import GeminiModel
 from openai.types.chat.chat_completion import ChatCompletion, Choice
-from typing_extensions import Any, Dict, Iterable, List, Optional, Union
+from typing_extensions import Any, Dict, Iterable, List, Optional, Union, AsyncIterator
 
 from patchwork.common.client.llm.protocol import NOT_GIVEN, LlmClient, NotGiven
 from patchwork.common.client.llm.utils import json_schema_to_model
@@ -45,6 +50,41 @@ def __init__(self, api_key: str):
         self.__api_key = api_key
         generativeai.configure(api_key=api_key)
 
+    def __get_pydantic_model(self, model_settings: ModelSettings | None) -> Model:
+        if model_settings is None:
+            raise ValueError("Model settings cannot be None")
+        model_name = model_settings.get("model")
+        if model_name is None:
+            raise ValueError("Model must be set cannot be None")
+
+        return GeminiModel(model_name, api_key=self.__api_key)
+
+    async def request(
+            self,
+            messages: list[ModelMessage],
+            model_settings: ModelSettings | None,
+            model_request_parameters: ModelRequestParameters,
+    ) -> tuple[ModelResponse, Usage]:
+        model = self.__get_pydantic_model(model_settings)
+        return await model.request(messages, model_settings, model_request_parameters)
+
+    async def request_stream(
+            self,
+            messages: list[ModelMessage],
+            model_settings: ModelSettings | None,
+            model_request_parameters: ModelRequestParameters,
+    ) -> AsyncIterator[StreamedResponse]:
+        model = self.__get_pydantic_model(model_settings)
+        yield model.request_stream(messages, model_settings, model_request_parameters)
+
+    @property
+    def model_name(self) -> str:
+        return "Undetermined"
+
+    @property
+    def system(self) -> str:
+        return "google-gla"
+
     def __get_model_limits(self, model: str) -> int:
         for model_info in _cached_list_model_from_google():
             if model_info.name == f"{self.__MODEL_PREFIX}{model}":
diff --git a/patchwork/common/client/llm/openai_.py b/patchwork/common/client/llm/openai_.py
@@ -1,6 +1,7 @@
 from __future__ import annotations
 
 import functools
+from functools import cached_property
 
 import tiktoken
 from openai import OpenAI
@@ -11,7 +12,12 @@
     ChatCompletionToolParam,
     completion_create_params,
 )
-from typing_extensions import Dict, Iterable, List, Optional, Union
+from pydantic_ai.messages import ModelMessage, ModelResponse
+from pydantic_ai.models import ModelRequestParameters, StreamedResponse, Model
+from pydantic_ai.settings import ModelSettings
+from pydantic_ai.usage import Usage
+from pydantic_ai.models.openai import OpenAIModel
+from typing_extensions import Dict, Iterable, List, Optional, Union, AsyncIterator
 
 from patchwork.common.client.llm.protocol import NOT_GIVEN, LlmClient, NotGiven
 from patchwork.logger import logger
@@ -41,20 +47,59 @@ class OpenAiLlmClient(LlmClient):
     }
 
     def __init__(self, api_key: str, base_url=None, **kwargs):
-        self.api_key = api_key
-        self.base_url = base_url
-        self.client = OpenAI(api_key=api_key, base_url=base_url, **kwargs)
+        self.__api_key = api_key
+        self.__base_url = base_url
+        self.__kwargs = kwargs
+
+    @cached_property
+    def __client(self) -> OpenAI:
+        return OpenAI(api_key=self.__api_key, base_url=self.__base_url, **self.__kwargs)
+
+    def __get_pydantic_model(self, model_settings: ModelSettings | None) -> Model:
+        if model_settings is None:
+            raise ValueError("Model settings cannot be None")
+        model_name = model_settings.get("model")
+        if model_name is None:
+            raise ValueError("Model must be set cannot be None")
+
+        return OpenAIModel(model_name, base_url=self.__base_url, api_key=self.__api_key)
+
+    async def request(
+            self,
+            messages: list[ModelMessage],
+            model_settings: ModelSettings | None,
+            model_request_parameters: ModelRequestParameters,
+    ) -> tuple[ModelResponse, Usage]:
+        model = self.__get_pydantic_model(model_settings)
+        return await model.request(messages, model_settings, model_request_parameters)
+
+    async def request_stream(
+            self,
+            messages: list[ModelMessage],
+            model_settings: ModelSettings | None,
+            model_request_parameters: ModelRequestParameters,
+    ) -> AsyncIterator[StreamedResponse]:
+        model = self.__get_pydantic_model(model_settings)
+        yield model.request_stream(messages, model_settings, model_request_parameters)
+
+    @property
+    def model_name(self) -> str:
+        return "Undetermined"
+
+    @property
+    def system(self) -> str | None:
+        return "openai"
 
     def __is_not_openai_url(self):
         # Some providers/apis only implement the chat completion endpoint.
         # We mainly use this to skip using the model endpoints.
-        return self.base_url is not None and self.base_url != "https://api.openai.com/v1"
+        return self.__base_url is not None and self.__base_url != "https://api.openai.com/v1"
 
     def get_models(self) -> set[str]:
         if self.__is_not_openai_url():
             return set()
 
-        return _cached_list_models_from_openai(self.api_key)
+        return _cached_list_models_from_openai(self.__api_key)
 
     def is_model_supported(self, model: str) -> bool:
         # might not implement model endpoint
@@ -144,4 +189,4 @@ def chat_completion(
             top_p=top_p,
         )
 
-        return self.client.chat.completions.create(**NotGiven.remove_not_given(input_kwargs))
+        return self.__client.chat.completions.create(**NotGiven.remove_not_given(input_kwargs))
diff --git a/patchwork/common/client/llm/protocol.py b/patchwork/common/client/llm/protocol.py
@@ -1,20 +1,25 @@
 from __future__ import annotations
 
+from abc import abstractmethod
+from typing import Dict, Any, List
+
+from pydantic_ai.models import Model
+
 from openai.types.chat import (
     ChatCompletion,
     ChatCompletionMessageParam,
     ChatCompletionToolChoiceOptionParam,
     ChatCompletionToolParam,
     completion_create_params,
 )
-from typing_extensions import Any, Dict, Iterable, List, Optional, Protocol, Union
+from typing_extensions import Any, Dict, Iterable, List, Optional, Union
 
 
 class NotGiven:
     ...
 
     @staticmethod
-    def remove_not_given(obj: Any) -> Any:
+    def remove_not_given(obj: Any) -> Union[None, dict[Any, Any], list[Any], Any]:
         if isinstance(obj, NotGiven):
             return None
         if isinstance(obj, dict):
@@ -27,13 +32,16 @@ def remove_not_given(obj: Any) -> Any:
 NOT_GIVEN = NotGiven()
 
 
-class LlmClient(Protocol):
+class LlmClient(Model):
+    @abstractmethod
     def get_models(self) -> set[str]:
         ...
 
+    @abstractmethod
     def is_model_supported(self, model: str) -> bool:
         ...
 
+    @abstractmethod
     def is_prompt_supported(
         self,
         messages: Iterable[ChatCompletionMessageParam],
@@ -54,6 +62,7 @@ def is_prompt_supported(
     ) -> int:
         ...
 
+    @abstractmethod
     def truncate_messages(
         self, messages: Iterable[ChatCompletionMessageParam], model: str
     ) -> Iterable[ChatCompletionMessageParam]:
@@ -118,6 +127,7 @@ def __truncate_message(message, direction_callback, min_guess, max_guess):
 
         return LlmClient.__truncate_message(message, direction_callback, min_guess, max_guess)
 
+    @abstractmethod
     def chat_completion(
         self,
         messages: Iterable[ChatCompletionMessageParam],
@@ -137,3 +147,4 @@ def chat_completion(
         top_p: Optional[float] | NotGiven = NOT_GIVEN,
     ) -> ChatCompletion:
         ...
+