deepjavalibrary · siddvenk · Jun 30, 2023 · Jun 30, 2023
@@ -23,6 +23,7 @@ ARG protobuf_version=3.20.3
 ARG transformers_version=4.29.2
 ARG accelerate_version=0.19.0
 ARG bitsandbytes_version=0.39.1
+ARG peft_version=0.3.0
 
 EXPOSE 8080
 
@@ -63,7 +64,7 @@ RUN apt-get update && apt-get install -y wget git libnuma-dev zlib1g-dev rapidjs
     scripts/install_python.sh ${python_version} && \
     pip3 install ${torch_wheel} ${ft_wheel} ${tb_wheel} safetensors protobuf==${protobuf_version} && \
     pip3 install transformers==${transformers_version} accelerate==${accelerate_version} bitsandbytes==${bitsandbytes_version} \
-    scipy einops && \
+    scipy einops peft==${peft_version} && \
     pip3 install cmake sentencepiece && \
     pip3 cache purge && \
     apt-get clean -y && rm -rf /var/lib/apt/lists/* && \

@@ -135,7 +135,7 @@ def get_model_name():
         "worker": 2,
     },
     "gpt4all-lora": {
-        "max_memory_per_gpu": [6.0, 8.0],
+        "max_memory_per_gpu": [8.0, 10.0],
         "batch_size": [1, 4],
         "seq_length": [16, 32],
         "worker": 1,
@@ -173,7 +173,7 @@ def get_model_name():
         "stream_output": True,
     },
     "gpt4all-lora": {
-        "max_memory_per_gpu": [6.0, 8.0],
+        "max_memory_per_gpu": [8.0, 10.0],
         "batch_size": [1, 4],
         "seq_length": [16, 32],
         "worker": 1,