dev adamw graph config #5745

MARD1NO · 2021-08-05T07:41:42Z

No description provided.

python/oneflow/nn/optimizer/adamw.py

python/oneflow/test/graph/test_graph_adamw_optim.py

Ldpe2G · 2021-08-10T07:51:28Z

python/oneflow/nn/optimizer/adamw.py

+
+            # TODO(): optimizer_conf need to have loss_scale_factor field to support multi scale factor
+            base_scale = train_conf.loss_scale_factor()
+            assert math.isclose(base_scale, 1, rel_tol=1e-4), "nn.Graph only support one scale factor at the moment, base_scale {} vs scale {}".format(


这里还有必要对 base_scale 做限制吗，我看#5821 这个pr里去掉了

的确没有必要了

同步一下那次讨论的结论

loss scale是amp的功能之一，逻辑是防止loss过小，浮点截断后，导致回传梯度消失，所以先增大loss * scale，之后再grad/scale

loss scale不属于optimizer的参数，所以optimizer中的scale在5821中都清理掉了

optimizer调用modle_update_op的那个scale参数，是scale weight的一个接口，给内部调整weight用的通用接口

python/oneflow/test/graph/test_graph_adamw_optim.py

python/oneflow/nn/optimizer/adamw.py

github-actions · 2021-08-11T12:56:28Z

Speed stats:

GPU Name: GeForce GTX 1080 

PyTorch resnet50 time: 140.7ms (= 7033.6ms / 50, input_shape=[16, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 128.3ms (= 6416.3ms / 50, input_shape=[16, 3, 224, 224], backward is enabled)
Relative speed: 1.10 (= 140.7ms / 128.3ms)

PyTorch resnet50 time: 84.5ms (= 4224.9ms / 50, input_shape=[8, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 74.3ms (= 3715.7ms / 50, input_shape=[8, 3, 224, 224], backward is enabled)
Relative speed: 1.14 (= 84.5ms / 74.3ms)

PyTorch resnet50 time: 57.2ms (= 2860.7ms / 50, input_shape=[4, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 47.8ms (= 2392.1ms / 50, input_shape=[4, 3, 224, 224], backward is enabled)
Relative speed: 1.20 (= 57.2ms / 47.8ms)

PyTorch resnet50 time: 48.9ms (= 2445.2ms / 50, input_shape=[2, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 46.1ms (= 2304.5ms / 50, input_shape=[2, 3, 224, 224], backward is enabled)
Relative speed: 1.06 (= 48.9ms / 46.1ms)

PyTorch resnet50 time: 44.6ms (= 2231.0ms / 50, input_shape=[1, 3, 224, 224], backward is enabled)
OneFlow resnet50 time: 40.3ms (= 2014.9ms / 50, input_shape=[1, 3, 224, 224], backward is enabled)
Relative speed: 1.11 (= 44.6ms / 40.3ms)

first init

12a6dee

MARD1NO commented Aug 5, 2021

View reviewed changes

python/oneflow/nn/optimizer/adamw.py Show resolved Hide resolved

MARD1NO added 2 commits August 5, 2021 16:35

add graph conf for adamw

ad1fec7

add graph adamw test

cce452b

MARD1NO requested a review from Ldpe2G August 5, 2021 08:37

MARD1NO added test enhancement labels Aug 5, 2021

Ldpe2G reviewed Aug 6, 2021

View reviewed changes

python/oneflow/test/graph/test_graph_adamw_optim.py Show resolved Hide resolved

MARD1NO and others added 3 commits August 10, 2021 10:21

Merge branch 'master' into dev_adamw_graph_conf

f27629a

remove scale

742070f

fix test

f8fcb0f

MARD1NO requested a review from Ldpe2G August 10, 2021 03:01

remove scale

e2da383

Ldpe2G reviewed Aug 10, 2021

View reviewed changes

python/oneflow/test/graph/test_graph_adamw_optim.py Outdated Show resolved Hide resolved

strint reviewed Aug 11, 2021

View reviewed changes

python/oneflow/nn/optimizer/adamw.py Outdated Show resolved Hide resolved

strint reviewed Aug 11, 2021

View reviewed changes

python/oneflow/nn/optimizer/adamw.py Outdated Show resolved Hide resolved

strint reviewed Aug 11, 2021

View reviewed changes

python/oneflow/nn/optimizer/adamw.py Show resolved Hide resolved

MARD1NO and others added 2 commits August 11, 2021 11:50

Merge branch 'master' into dev_adamw_graph_conf

7f3d20a

fix comment

20e7e59

MARD1NO requested review from Ldpe2G, wyg1997 and strint August 11, 2021 06:11

MARD1NO marked this pull request as ready for review August 11, 2021 06:11

Merge branch 'master' into dev_adamw_graph_conf

2c9008e

Ldpe2G approved these changes Aug 11, 2021

View reviewed changes

MARD1NO added the automerge label Aug 11, 2021

MARD1NO requested a review from oneflow-ci-bot August 11, 2021 07:12

oneflow-ci-bot and others added 2 commits August 11, 2021 07:13

auto format by CI

ffe1d06

Merge branch 'master' into dev_adamw_graph_conf

25a46f0

oneflow-ci-bot requested review from oneflow-ci-bot and removed request for oneflow-ci-bot August 11, 2021 07:25

Merge branch 'master' into dev_adamw_graph_conf

eb79a07

oneflow-ci-bot requested review from oneflow-ci-bot and removed request for oneflow-ci-bot August 11, 2021 09:56

Merge branch 'master' into dev_adamw_graph_conf

bfa2761

oneflow-ci-bot requested review from oneflow-ci-bot and removed request for oneflow-ci-bot August 11, 2021 11:36

oneflow-ci-bot merged commit e9f1e23 into master Aug 11, 2021

oneflow-ci-bot deleted the dev_adamw_graph_conf branch August 11, 2021 12:58

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

dev adamw graph config #5745

dev adamw graph config #5745

MARD1NO commented Aug 5, 2021

Ldpe2G Aug 10, 2021

strint Aug 11, 2021

strint Aug 11, 2021

github-actions bot commented Aug 11, 2021

dev adamw graph config #5745

dev adamw graph config #5745

Conversation

MARD1NO commented Aug 5, 2021

Ldpe2G Aug 10, 2021

Choose a reason for hiding this comment

strint Aug 11, 2021

Choose a reason for hiding this comment

strint Aug 11, 2021

Choose a reason for hiding this comment

github-actions bot commented Aug 11, 2021