Can the docker images be made smaller?

Hi all,

The `intelanalytics/ipex-llm-inference-cpp-xpu` docker image is ~27GB when unpacked, which is huge, and preventing me from deploying iGPU accelerated Ollama on my server.

There's a few obviously redundancies:
* There's two versions of drivers installed.
* Development packages like git, sudo, vim, less are installed.
* ~4gb of `nvidia-*` python packages are installed (a transitive dependency of `accelerate`).

Would it be possible to provide more granular docker images, with these redundancies remove?

Thanks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Can the docker images be made smaller? #13222

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Can the docker images be made smaller? #13222

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions