重点写厂商适配的情况,以及在厂商芯片的机器上的运行情况。
文件路径:training/<vendor>/<model>-<framework>/ 目录下
文档使用的语言:默认为中文README.md,可提供英文版本README.en.md
- 厂商名称
- 厂商对于模型的适配
- 算子扩展、优化情况
- 数值精度:fp16,fp32, fp64 等
- 机器型号:例如 NVIDIA_DGX-A100
- 加速卡型号: 执行 加速卡监控命令后,显示的加速卡型号。 例如 NVIDIA_A100-SXM4-40GB
- OS kernel版本: // 例如 Linux 5.4.0-136-generic x86_64 【uname -srm 可查看】
- Docker 版本: // 例如 20.10.9, 【docker --version可查看】
分布式训练方式 | 训练加速方式【如有,请填写】 | 配置文件 | 运行时长(秒) | Steps数 | 精度 | 性能(samples/秒) |
---|---|---|---|---|---|---|
单机单卡 | ||||||
单机X卡 | ||||||
多机多卡 |