我用4卡训练,去最好的pth进行验证,4卡时是20.5,单卡时是16.2,8卡时是16.4,为什么会出现这种问题,没有改过验证代码。 验证命令:CUDA_VISIBLE_DEVICES=0,1,2,3 torchrun --master_port=7777 --nproc_per_node=4 train.py --test-only,此时是20.5, <img width="745" height="442" alt="Image" src="https://github.com/user-attachments/assets/cee8c6d3-9f8e-4132-9ce5-abd434b295f8" /> 单卡时的验证结果: <img width="819" height="457" alt="Image" src="https://github.com/user-attachments/assets/2b8e36fe-9f99-4cab-93cc-e76596976621" /> 我非常震惊和疑惑,我应该相信哪个???