Skip to content

AlexNet 单卡精度对齐 #188

@rentainhe

Description

@rentainhe

对齐Eager下的AlexNet精度与Benchmark中的AlexNet精度

超参:

optimizer: SGD { momentum=0.9 }
learning rate: 0.01
train_batch_size: 512
eval_batch_size: 512
epochs: 90

需要进行的工作:

  • 在eager模式下载入pytorch预训练的模型,验证在imagenet数据集上的准确率,保证前向正常
  • 运行benchmark的AlexNet模型,验证性能
  • 对齐单卡下的imagenet训练结果

FQAs:

Q: 在小数据集imagenette上进行训练的时候,可以正常收敛和验证,但是在imagenet数据集上训练的时候,正常收敛,但是验证精度极低
A: 可能的问题是data-part-num设置错误,目前已修正,重新验证

1. 载入pytorch预训练模型并在imagenet上进行测试

  • 载入pytorch预训练模型在imagenet val上验证准确率为: 55.38%

2. 对齐lazy和eager的模型加载,保证两边模型在相同输入下得到相同输出

此工作依赖于 Oneflow-Inc/OneFlow-Benchmark#215

Metadata

Metadata

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions