Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models

Set Up

Requirements

torch+cu123 - 2.3.0
transformers - 4.43.3
flash_attn - 2.6.3
scikit-learn - 1.5.1

Dataset

Action

Files in transformers_py should be copied to the path of transformers package of your running environment. (eg. /path/to/your/envs/{#env_name}/lib/python3.10/site-packages/transformers)
Files in qwen2moe_py should be copied to the path of qwen2_moe model from your transformers package. (eg. /path/to/your/envs/{#env_name}/lib/python3.10/site-packages/transformers/models/qwen2_moe)
Files in deepseek_model_py should be copied to the path of deepseek model downloaded from HuggingFace.

Running scripts

To prune the DeepseekV2Lite model with the suggested parameters, you can run the script below:

./scripts/pruning_mash.sh >/path/to/your/log

Citation

  @article{guo2025arxiv,
  title={Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models},
  author={Hongcheng Guo, Juntao Yao, Boyang Wang, Junjia Du, Shaosheng Cao, Donglin Di, Shun Zhang, Zhoujun Li},
  journal={arXiv preprint arXiv:2504.07807},
  year={2025},
  url={https://arxiv.org/abs/2504.07807}
  }

Name		Name	Last commit message	Last commit date
Latest commit History 71 Commits
archive		archive
data		data
deepseek_model_py		deepseek_model_py
pruned_result		pruned_result
qwen2moe_model_py		qwen2moe_model_py
scripts		scripts
transformers_py		transformers_py
utils		utils
visual		visual
.gitignore		.gitignore
README.md		README.md
baseline_finetuning.py		baseline_finetuning.py
convert_dataset.py		convert_dataset.py
dataset_check.py		dataset_check.py
nl2bash.py		nl2bash.py
pruning_check.py		pruning_check.py
pruning_mask.py		pruning_mask.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models

Set Up

Requirements

Dataset

Action

Running scripts

Citation

About

Uh oh!

Releases

Packages

Uh oh!

Languages

RESMP-DEV/MoE_unsupervised_pruning

Folders and files

Latest commit

History

Repository files navigation

Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models

Set Up

Requirements

Dataset

Action

Running scripts

Citation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages