```python model_opt = torch.compile(model, mode="reduce-overhead") ``` compile之后算时间的话,要算第二次预测的时间,因为第一次编译器还在热身