Fix extra gpu memory in flow.load and module.load_state_dict #8301

daquexian · 2022-05-25T06:52:17Z

No description provided.

Signed-off-by: daquexian <daquexian566@gmail.com>

python/oneflow/framework/tensor.py

Signed-off-by: daquexian <daquexian566@gmail.com>

github-actions · 2022-05-25T13:09:32Z

Code got formatted by CI. Please request CI again if you still want to have this PR merged. If the PR is from a forked repo, please download the patch files from the GitHub Actions web page and apply them locally.

github-actions · 2022-05-25T14:52:02Z

View latest API docs preview at: https://staging.oneflow.info/docs/Oneflow-Inc/oneflow/pr/8301/

github-actions · 2022-05-25T15:00:22Z

Speed stats:

GPU Name: NVIDIA GeForce GTX 1080 

❌ OneFlow resnet50 time: 130.4ms (= 13036.6ms / 100, input_shape=[16, 3, 224, 224])
PyTorch resnet50 time: 143.4ms (= 14335.3ms / 100, input_shape=[16, 3, 224, 224])
✔️ Relative speed: 1.10 (= 143.4ms / 130.4ms)

OneFlow resnet50 time: 76.6ms (= 7655.5ms / 100, input_shape=[8, 3, 224, 224])
PyTorch resnet50 time: 85.4ms (= 8540.1ms / 100, input_shape=[8, 3, 224, 224])
✔️ Relative speed: 1.12 (= 85.4ms / 76.6ms)

OneFlow resnet50 time: 53.9ms (= 10772.7ms / 200, input_shape=[4, 3, 224, 224])
PyTorch resnet50 time: 62.9ms (= 12586.8ms / 200, input_shape=[4, 3, 224, 224])
✔️ Relative speed: 1.17 (= 62.9ms / 53.9ms)

OneFlow resnet50 time: 43.2ms (= 8638.6ms / 200, input_shape=[2, 3, 224, 224])
PyTorch resnet50 time: 41.2ms (= 8232.2ms / 200, input_shape=[2, 3, 224, 224])
❌ Relative speed: 0.95 (= 41.2ms / 43.2ms)

OneFlow resnet50 time: 35.8ms (= 7159.4ms / 200, input_shape=[1, 3, 224, 224])
PyTorch resnet50 time: 42.1ms (= 8422.0ms / 200, input_shape=[1, 3, 224, 224])
✔️ Relative speed: 1.18 (= 42.1ms / 35.8ms)

OneFlow swin dataloader time: 0.251s (= 50.169s / 200, num_workers=1)
PyTorch swin dataloader time: 0.153s (= 30.697s / 200, num_workers=1)
Relative speed: 0.612 (= 0.153s / 0.251s)

OneFlow swin dataloader time: 0.065s (= 13.007s / 200, num_workers=4)
PyTorch swin dataloader time: 0.041s (= 8.265s / 200, num_workers=4)
Relative speed: 0.635 (= 0.041s / 0.065s)

OneFlow swin dataloader time: 0.036s (= 7.271s / 200, num_workers=8)
PyTorch swin dataloader time: 0.022s (= 4.469s / 200, num_workers=8)
Relative speed: 0.615 (= 0.022s / 0.036s)

❌ OneFlow resnet50 time: 146.4ms (= 14640.1ms / 100, input_shape=[16, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 176.3ms (= 17627.8ms / 100, input_shape=[16, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.20 (= 176.3ms / 146.4ms)

OneFlow resnet50 time: 96.4ms (= 9644.8ms / 100, input_shape=[8, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 112.8ms (= 11280.9ms / 100, input_shape=[8, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.17 (= 112.8ms / 96.4ms)

OneFlow resnet50 time: 74.8ms (= 14956.1ms / 200, input_shape=[4, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 88.4ms (= 17679.4ms / 200, input_shape=[4, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.18 (= 88.4ms / 74.8ms)

OneFlow resnet50 time: 61.2ms (= 12240.2ms / 200, input_shape=[2, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 74.2ms (= 14846.9ms / 200, input_shape=[2, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.21 (= 74.2ms / 61.2ms)

OneFlow resnet50 time: 54.4ms (= 10879.1ms / 200, input_shape=[1, 3, 224, 224], ddp, world size=2)
PyTorch resnet50 time: 69.0ms (= 13792.0ms / 200, input_shape=[1, 3, 224, 224], ddp, world size=2)
✔️ Relative speed: 1.27 (= 69.0ms / 54.4ms)

daquexian added 3 commits May 25, 2022 11:45

hotfix

6bd860d

Signed-off-by: daquexian <daquexian566@gmail.com>

fix bug and add checkpoint changes

f341765

Signed-off-by: daquexian <daquexian566@gmail.com>

refine

53c0908

Signed-off-by: daquexian <daquexian566@gmail.com>

daquexian added automerge bug system python labels May 25, 2022

daquexian requested review from BBuf and jackalcooper as code owners May 25, 2022 06:52

clackhan reviewed May 25, 2022

View reviewed changes

python/oneflow/framework/tensor.py Outdated Show resolved Hide resolved

fix other_cpu_placement

8bdd009

Signed-off-by: daquexian <daquexian566@gmail.com>

clackhan approved these changes May 25, 2022

View reviewed changes

Ldpe2G approved these changes May 25, 2022

View reviewed changes

mergify bot added 4 commits May 25, 2022 08:42

Merge branch 'master' into fix_extra_memory_in_load

9d2af94

Merge branch 'master' into fix_extra_memory_in_load

d10b650

Merge branch 'master' into fix_extra_memory_in_load

75bba77

Merge branch 'master' into fix_extra_memory_in_load

a27b4da

daquexian requested a review from oneflow-ci-bot May 25, 2022 13:07

auto format by CI

6db944f

Merge branch 'master' into fix_extra_memory_in_load

7e95748

mergify bot merged commit 3bf33ad into master May 25, 2022

mergify bot deleted the fix_extra_memory_in_load branch May 25, 2022 15:30

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fix extra gpu memory in flow.load and module.load_state_dict #8301

Fix extra gpu memory in flow.load and module.load_state_dict #8301

daquexian commented May 25, 2022

github-actions bot commented May 25, 2022

github-actions bot commented May 25, 2022

github-actions bot commented May 25, 2022

Fix extra gpu memory in flow.load and module.load_state_dict #8301

Fix extra gpu memory in flow.load and module.load_state_dict #8301

Conversation

daquexian commented May 25, 2022

github-actions bot commented May 25, 2022

github-actions bot commented May 25, 2022

github-actions bot commented May 25, 2022