[MoE] Optimizer parameter broadcast #8810

DesmonDay · 2024-07-25T13:19:53Z

PR types

Function optimization

PR changes

Others

Description

Optimize broadcast_moe_optimizer to avoid out-of-memory situations.

…nto update_predict_new

paddle-bot · 2024-07-25T13:19:58Z

Thanks for your contribution!

…nto update_predict_new

codecov · 2024-07-25T13:52:31Z

Codecov Report

Attention: Patch coverage is 7.69231% with 24 lines in your changes missing coverage. Please review.

Project coverage is 55.51%. Comparing base (77f6e98) to head (02378c7).
Report is 221 commits behind head on develop.

Files with missing lines	Patch %	Lines
paddlenlp/trainer/utils/helper.py	4.34%	22 Missing ⚠️
paddlenlp/transformers/conversion_utils.py	0.00%	2 Missing ⚠️

Additional details and impacted files

@@             Coverage Diff             @@
##           develop    #8810      +/-   ##
===========================================
+ Coverage    55.47%   55.51%   +0.04%     
===========================================
  Files          631      631              
  Lines        98466    98488      +22     
===========================================
+ Hits         54621    54677      +56     
+ Misses       43845    43811      -34

☔ View full report in Codecov by Sentry.
📢 Have feedback on the report? Share it here.

paddlenlp/trainer/trainer.py

ZHUI · 2024-07-25T14:09:30Z

paddlenlp/transformers/model_utils.py

@@ -115,7 +115,7 @@ def unwrap_optimizer(optimizer, optimizer_instances=()):

    from paddlenlp.utils.safetensors import fast_load_file as safe_load_file

-    if sys.platform.startswith("cpu"):


原来是“cpu” ？

有个合入PR我改错了

ZHUI

LGTM

DesmonDay added 9 commits July 18, 2024 17:15

update llama predict

6a9acb7

update qwen predict

f5e1114

update chatglm predict

33fde67

update opt, gpt predict

cf7b2fb

update return_numpy=True

5c2f595

Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleNLP i…

f1d65ab

…nto update_predict_new

fix tp split

e7d96a0

bug fix

ebc553d

optimize moe broadcast

7a8e9c9

Merge branch 'develop' of https://github.com/PaddlePaddle/PaddleNLP i…

1fa180f

…nto update_predict_new

DesmonDay force-pushed the update_predict_new branch from fbe4c4e to 1fa180f Compare July 25, 2024 13:30

fix logger level

1fb6e9f

ZHUI reviewed Jul 25, 2024

View reviewed changes

paddlenlp/trainer/trainer.py Show resolved Hide resolved

ZHUI reviewed Jul 25, 2024

View reviewed changes

fix

02378c7

ZHUI approved these changes Jul 26, 2024

View reviewed changes

ZHUI merged commit 054c3ad into PaddlePaddle:develop Jul 26, 2024
9 of 12 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[MoE] Optimizer parameter broadcast #8810

[MoE] Optimizer parameter broadcast #8810

DesmonDay commented Jul 25, 2024

paddle-bot bot commented Jul 25, 2024

codecov bot commented Jul 25, 2024 •

edited

Loading

ZHUI Jul 25, 2024

DesmonDay Jul 25, 2024

ZHUI left a comment

		@@ -115,7 +115,7 @@ def unwrap_optimizer(optimizer, optimizer_instances=()):

		from paddlenlp.utils.safetensors import fast_load_file as safe_load_file

		if sys.platform.startswith("cpu"):

[MoE] Optimizer parameter broadcast #8810

[MoE] Optimizer parameter broadcast #8810

Conversation

DesmonDay commented Jul 25, 2024

PR types

PR changes

Description

paddle-bot bot commented Jul 25, 2024

codecov bot commented Jul 25, 2024 • edited Loading

Codecov Report

ZHUI Jul 25, 2024

Choose a reason for hiding this comment

DesmonDay Jul 25, 2024

Choose a reason for hiding this comment

ZHUI left a comment

Choose a reason for hiding this comment

codecov bot commented Jul 25, 2024 •

edited

Loading