发布0.6.2

shell-nlp · shell-nlp · commit 395a745c8279 · 2025-09-07T21:14:03.000+08:00
diff --git a/.github/workflows/docker-image.yml b/.github/workflows/docker-image.yml
@@ -33,7 +33,7 @@ jobs:
       # 构建 Docker 镜像
       - name: Build Docker image
         run: |
-          docker build -t ${{ secrets.DOCKER_USERNAME }}/gpt_server:${{ env.VERSION }} .
+          docker build -f Dockerfile -t ${{ secrets.DOCKER_USERNAME }}/gpt_server:${{ env.VERSION }} .
           # docker tag ${{ secrets.DOCKER_USERNAME }}/gpt_server:${{ env.VERSION }} ${{ secrets.DOCKER_USERNAME }}/gpt_server:latest
       # 推送镜像到 Docker Hub
       - name: Push Docker image
diff --git a/Dockerfile b/Dockerfile
@@ -7,7 +7,9 @@ COPY ./ /gpt_server
 WORKDIR /gpt_server
 # RUN uv sync && uv cache clean
 ENV UV_HTTP_TIMEOUT=120 CUDA_HOME=/usr/local/cuda-12.2
-RUN uv venv --seed && uv sync && uv cache clean && \
+ENV PATH=$CUDA_HOME/bin:$PATH 
+ENV LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH
+RUN uv venv --seed && uv sync -v && uv cache clean && \
     echo '[[ -f .venv/bin/activate ]] && source .venv/bin/activate' >> ~/.bashrc
 ENV PATH=/gpt_server/.venv/bin:$PATH
 
diff --git a/README.md b/README.md
@@ -126,6 +126,7 @@
 * [X] 可视化启动界面(不稳定,对开发人员来说比较鸡肋，后期将弃用！)
 * [X] 并行的function call功能（tools）
 * [X] 支持 文生图 模型
+* [X] 支持 图片编辑 模型
 * [ ] 支持 pip install 方式进行安装
 
 
diff --git a/gpt_server/script/config_example.yaml b/gpt_server/script/config_example.yaml
@@ -174,7 +174,7 @@ models:
       - 6
 
 - flux:
-    #文生图模型
+    # 文生图模型
     alias: null
     enable: true
     model_config:
@@ -185,3 +185,16 @@ models:
     workers:
     - gpus:
       - 7
+
+- image-edit: 
+  # 图片编辑模型
+    alias: null
+    enable: true
+    model_config:
+      model_name_or_path: /home/dev/model/Qwen/Qwen-Image-Edit/
+    model_type: qwen_image_edit
+    work_mode: hf
+    device: gpu
+    workers:
+    - gpus:
+      - 7
diff --git a/gpt_server/serving/openai_api_server.py b/gpt_server/serving/openai_api_server.py
@@ -19,12 +19,13 @@
 
 import aiohttp
 import fastapi
-from fastapi import Depends, HTTPException, responses
+from fastapi import Depends, File, HTTPException, Request, responses, Form, UploadFile
 from fastapi.exceptions import RequestValidationError
 from fastapi.middleware.cors import CORSMiddleware
 from fastapi.responses import StreamingResponse, JSONResponse, FileResponse
 from fastapi.security.http import HTTPAuthorizationCredentials, HTTPBearer
 import httpx
+import base64
 
 try:
     from pydantic.v1 import BaseSettings, validator
@@ -194,18 +195,18 @@ def create_error_response(code: int, message: str) -> JSONResponse:
 
 
 @app.exception_handler(RequestValidationError)
-async def validation_exception_handler(request, exc):
+async def validation_exception_handler(request: Request, exc: RequestValidationError):
     return create_error_response(ErrorCode.VALIDATION_TYPE_ERROR, str(exc))
 
 
-def check_model(request) -> Optional[JSONResponse]:
+def check_model(model: str) -> Optional[JSONResponse]:
     global model_address_map, models_
     ret = None
     models = models_
-    if request.model not in models_:
+    if model not in models_:
         ret = create_error_response(
             ErrorCode.INVALID_MODEL,
-            f"Only {'&&'.join(models)} allowed now, your model {request.model}",
+            f"Only {'&&'.join(models)} allowed now, your model {model}",
         )
     return ret
 
@@ -418,7 +419,7 @@ def get_model_address_map():
 )
 async def create_chat_completion(request: CustomChatCompletionRequest):
     """Creates a completion for the chat message"""
-    error_check_ret = check_model(request)
+    error_check_ret = check_model(request.model)
     if error_check_ret is not None:
         return error_check_ret
     worker_addr = get_worker_address(request.model)
@@ -554,7 +555,7 @@ async def chat_completion_stream_generator(
     response_class=responses.ORJSONResponse,
 )
 async def create_completion(request: CompletionRequest):
-    error_check_ret = check_model(request)
+    error_check_ret = check_model(request.model)
     if error_check_ret is not None:
         return error_check_ret
 
@@ -714,7 +715,6 @@ async def generate_completion(payload: Dict[str, Any], worker_addr: str):
     SpeechRequest,
     OpenAISpeechRequest,
     ImagesGenRequest,
-    ImagesEditsRequest,
 )
 
 
@@ -729,17 +729,27 @@ async def get_images_edits(payload: Dict[str, Any]):
 
 
 @app.post("/v1/images/edits", dependencies=[Depends(check_api_key)])
-async def images_edits(request: ImagesEditsRequest):
+async def images_edits(
+    model: str = Form(...),
+    image: UploadFile = File(media_type="application/octet-stream"),
+    prompt: Optional[Union[str, List[str]]] = Form(None),
+    # negative_prompt: Optional[Union[str, List[str]]] = Form(None),
+    response_format: Optional[str] = Form("url"),
+    output_format: Optional[str] = Form("png"),
+):
     """图片编辑"""
-    error_check_ret = check_model(request)
+
+    error_check_ret = check_model(model)
     if error_check_ret is not None:
         return error_check_ret
     payload = {
-        "image": request.image,
-        "model": request.model,
-        "prompt": request.prompt,
-        "output_format": request.output_format,
-        "response_format": request.response_format,
+        "image": base64.b64encode(await image.read()).decode(
+            "utf-8"
+        ),  # bytes → Base64 字符串,
+        "model": model,
+        "prompt": prompt,
+        "output_format": output_format,
+        "response_format": response_format,
     }
     result = await get_images_edits(payload=payload)
     return result
@@ -758,7 +768,7 @@ async def get_images_gen(payload: Dict[str, Any]):
 @app.post("/v1/images/generations", dependencies=[Depends(check_api_key)])
 async def images_generations(request: ImagesGenRequest):
     """文生图"""
-    error_check_ret = check_model(request)
+    error_check_ret = check_model(request.model)
     if error_check_ret is not None:
         return error_check_ret
     payload = {
@@ -877,10 +887,6 @@ async def get_transcriptions(payload: Dict[str, Any]):
     return json.loads(transcription)
 
 
-from fastapi import UploadFile, Form
-import base64
-
-
 @app.post(
     "/v1/audio/transcriptions",
     dependencies=[Depends(check_api_key)],
@@ -915,7 +921,7 @@ async def transcriptions(file: UploadFile, model: str = Form()):
     response_class=responses.ORJSONResponse,
 )
 async def classify(request: ModerationsRequest):
-    error_check_ret = check_model(request)
+    error_check_ret = check_model(request.model)
     if error_check_ret is not None:
         return error_check_ret
     request.input = process_input(request.model, request.input)
@@ -958,7 +964,7 @@ async def classify(request: ModerationsRequest):
     response_class=responses.ORJSONResponse,
 )
 async def rerank(request: RerankRequest):
-    error_check_ret = check_model(request)
+    error_check_ret = check_model(request.model)
     if error_check_ret is not None:
         return error_check_ret
     request.documents = process_input(request.model, request.documents)
@@ -1009,7 +1015,7 @@ async def create_embeddings(request: CustomEmbeddingsRequest, model_name: str =
     """Creates embeddings for the text"""
     if request.model is None:
         request.model = model_name
-    error_check_ret = check_model(request)
+    error_check_ret = check_model(request.model)
     if error_check_ret is not None:
         return error_check_ret
 
@@ -1111,7 +1117,7 @@ async def count_tokens(request: APITokenCheckRequest):
 @app.post("/api/v1/chat/completions")
 async def create_chat_completion(request: APIChatCompletionRequest):
     """Creates a completion for the chat message"""
-    error_check_ret = check_model(request)
+    error_check_ret = check_model(request.model)
     if error_check_ret is not None:
         return error_check_ret
 
diff --git a/pyproject.toml b/pyproject.toml
@@ -1,7 +1,7 @@
 [project]
 name = "gpt_server"
-version = "0.6.1"
-description = "gpt_server是一个用于生产级部署LLMs或Embedding的开源框架。"
+version = "0.6.2"
+description = "gpt_server是一个用于生产级部署LLMs、Embedding、Reranker、ASR和TTS的开源框架。"
 readme = "README.md"
 license = { text = "Apache 2.0" }
 authors = [{ name = "Yu Liu", email = "506610466@qq.com" }]
@@ -12,38 +12,40 @@ dependencies = [
     "ffmpy",
     "fschat==0.2.36",
     "infinity-emb[all]==0.0.76",
-    "lmdeploy==0.9.2",
+    "lmdeploy==0.9.2.post1",
     "loguru>=0.7.2",
     "openai==1.99.1",
     "setuptools==75.2.0",
     "streamlit==1.39.0",
     "torch==2.6.0",
     "torchvision==0.20.1",
-    "vllm==0.10.1",
+    "vllm",
     "qwen_vl_utils",
     "evalscope[perf,rag]==0.16.1",
     "modelscope==1.26.0",
     "edge-tts>=7.0.0",
     "funasr>=1.2.6",
-    "sglang[all]>=0.4.10.post2",
+    "sglang[all]>=0.5.1.post3",
     "flashinfer-python",
     "flashtts>=0.1.7",
-    "diffusers>=0.33.1",
+    "diffusers>=0.35.1",
+    "sqlmodel>=0.0.24",
 ]
 
 [tool.uv]
 default-groups = [] # 默认只安装dependencies中的库
 override-dependencies = [
-    "setuptools==75.2.0",
-    "torchvision==0.22.1",
-    "torchaudio==2.7.1",
-    "torch==2.7.0",
-    "triton",
-    "transformers==4.53.3", #  infinity-emb
+    "setuptools==77.0.3",
+    "torchvision==0.23.0",
+    "torchaudio==2.8.0",
+    "torch==2.8.0",
+    "triton==3.4.0",
+    "transformers==4.56.1", #  infinity-emb
     "soundfile==0.13.1", # infinity
     "xgrammar==0.1.23", #  sglang[all]==0.4.5 depends on xgrammar==0.1.17
     "flashinfer-python==0.2.10",
     "outlines-core==0.2.10", # sglang 和 vllm 的冲突
+    "peft>=0.17.0" # 和 lmdeloy 冲突
 ]
 
 [project.scripts]
@@ -53,6 +55,13 @@ gpt_server = "gpt_server.cli:main"
 url = "https://pypi.tuna.tsinghua.edu.cn/simple"
 default = true
 
+[tool.uv.sources]
+vllm = { index = "vllm-custom" }
+ 
+[[tool.uv.index]]
+name = "vllm-custom"
+url = "https://wheels.vllm.ai/006e7a34aeb3e905ca4131a3251fe079f0511e2f" 
+
 [build-system]
 requires = ["setuptools", "wheel"]
 build-backend = "setuptools.build_meta"
diff --git a/requirements.txt b/requirements.txt
diff --git a/tests/test_image_edit.py b/tests/test_image_edit.py
diff --git a/uv.lock b/uv.lock