pytorch
diff --git a/‎py/torch_tensorrt/dynamo/conversion/aten_ops_converters.py‎
Lines changed: 81 additions & 77 deletions b/‎py/torch_tensorrt/dynamo/conversion/aten_ops_converters.py‎
Lines changed: 81 additions & 77 deletions
diff --git a/‎py/torch_tensorrt/dynamo/conversion/converter_utils.py‎
Lines changed: 1 addition & 1 deletion b/‎py/torch_tensorrt/dynamo/conversion/converter_utils.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎tests/py/dynamo/conversion/test_add_aten.py‎
Lines changed: 61 additions & 6 deletions b/‎tests/py/dynamo/conversion/test_add_aten.py‎
Lines changed: 61 additions & 6 deletions
@@ -1,16 +1,10 @@
 import logging
 from typing import Any, Dict, Optional, Sequence, Tuple, Union
 
-import tensorrt as trt
 import torch
 from torch.fx.node import Argument, Node, Target
 from torch_tensorrt.dynamo._SourceIR import SourceIR
 from torch_tensorrt.dynamo.conversion import impl
-from torch_tensorrt.dynamo.conversion.converter_utils import (
-    cast_int_int_div_trt_tensor,
-    cast_trt_tensor,
-)
-from torch_tensorrt.fx.converters import acc_ops_converters
 from torch_tensorrt.fx.types import TRTNetwork, TRTTensor
 
 from .converter_registry import dynamo_tensorrt_converter
@@ -48,58 +42,6 @@ def aten_ops_batch_norm(
     )
 
 
-@dynamo_tensorrt_converter(torch.ops.aten.div.default)  # type: ignore[misc]
-@dynamo_tensorrt_converter(torch.ops.aten.div.Tensor_mode)  # type: ignore[misc]
-@dynamo_tensorrt_converter(torch.ops.aten.div.Tensor)  # type: ignore[misc]
-def aten_ops_div(
-    network: TRTNetwork,
-    target: Target,
-    args: Tuple[Argument, ...],
-    kwargs: Dict[str, Argument],
-    name: str,
-) -> Union[TRTTensor, Sequence[TRTTensor]]:
-    kwargs_new = {
-        "input": args[0],
-        "other": args[1],
-    }
-    # If both are TRTTensor, both are cast to float32
-    if isinstance(args[0], TRTTensor) and isinstance(args[1], TRTTensor):
-        kwargs_new["input"], kwargs_new["other"] = cast_int_int_div_trt_tensor(
-            network,
-            kwargs_new["input"],
-            kwargs_new["other"],
-            name,
-        )
-    # If one is TRTTensor, it is cast to float32
-    elif isinstance(args[0], TRTTensor) and (
-        kwargs_new["input"].dtype == trt.int8 or kwargs_new["input"].dtype == trt.int32
-    ):
-        kwargs_new["input"] = cast_trt_tensor(
-            network, kwargs_new["input"], trt.float32, name, target
-        )
-    elif isinstance(args[1], TRTTensor) and (
-        kwargs_new["other"].dtype == trt.int8 or kwargs_new["other"].dtype == trt.int32
-    ):
-        kwargs_new["other"] = cast_trt_tensor(
-            network, kwargs_new["other"], trt.float32, name, target
-        )
-    rounding_mode = kwargs.get("rounding_mode")
-    if rounding_mode is None:
-        return acc_ops_converters.acc_ops_div(network, target, None, kwargs_new, name)
-    elif rounding_mode == "floor":
-        return acc_ops_converters.acc_ops_floor_div(
-            network, target, None, kwargs_new, name
-        )
-    elif rounding_mode == "trunc":
-        return impl.elementwise.trunc_div(
-            network, target, SourceIR.ATEN, name, args[0], args[1]
-        )
-    else:
-        raise RuntimeError(
-            f"Target {target} does not support rounding mode {rounding_mode}"
-        )
-
-
 def embedding_param_validator(embedding_node: Node) -> bool:
     scale_grad_by_freq = args_bounds_check(embedding_node.args, 3)
     sparse = args_bounds_check(embedding_node.args, 4)
@@ -846,24 +788,39 @@ def aten_ops_isinf(
 
 
 @dynamo_tensorrt_converter(torch.ops.aten.add.Tensor)
+@dynamo_tensorrt_converter(torch.ops.aten.add.Scalar)
 def aten_ops_add(
     network: TRTNetwork,
     target: Target,
     args: Tuple[Argument, ...],
     kwargs: Dict[str, Argument],
     name: str,
 ) -> Union[TRTTensor, Sequence[TRTTensor]]:
+    other = args[1]
+    alpha = kwargs.get("alpha", 1)
+
+    if alpha != 1:
+        other = impl.elementwise.mul(
+            network,
+            target,
+            SourceIR.ATEN,
+            name,
+            other,
+            alpha,
+        )
+
     return impl.elementwise.add(
         network,
         target,
         SourceIR.ATEN,
         name,
         args[0],
-        args[1],
+        other,
     )
 
 
 @dynamo_tensorrt_converter(torch.ops.aten.mul.Tensor)
+@dynamo_tensorrt_converter(torch.ops.aten.mul.Scalar)
 def aten_ops_mul(
     network: TRTNetwork,
     target: Target,
@@ -918,43 +875,86 @@ def aten_ops_min(
 
 
 @dynamo_tensorrt_converter(torch.ops.aten.sub.Tensor)
+@dynamo_tensorrt_converter(torch.ops.aten.sub.Scalar)
 def aten_ops_sub(
     network: TRTNetwork,
     target: Target,
     args: Tuple[Argument, ...],
     kwargs: Dict[str, Argument],
     name: str,
 ) -> Union[TRTTensor, Sequence[TRTTensor]]:
+    other = args[1]
+    alpha = kwargs.get("alpha", 1)
+
+    if alpha != 1:
+        other = impl.elementwise.mul(
+            network,
+            target,
+            SourceIR.ATEN,
+            name,
+            other,
+            alpha,
+        )
+
     return impl.elementwise.sub(
         network,
         target,
         SourceIR.ATEN,
         name,
         args[0],
-        args[1],
+        other,
     )
 
 
-# TODO: keep this or line 54...?
-# @dynamo_tensorrt_converter(torch.ops.aten.div.Tensor)
-# def aten_ops_div(
-#     network: TRTNetwork,
-#     target: Target,
-#     args: Tuple[Argument, ...],
-#     kwargs: Dict[str, Argument],
-#     name: str,
-# ) -> Union[TRTTensor, Sequence[TRTTensor]]:
-#     return impl.elementwise.div(
-#         network,
-#         target,
-#         SourceIR.ATEN,
-#         name,
-#         args[0],
-#         args[1],
-#     )
+@dynamo_tensorrt_converter(torch.ops.aten.div.Tensor)
+@dynamo_tensorrt_converter(torch.ops.aten.div.Tensor_mode)
+@dynamo_tensorrt_converter(torch.ops.aten.div.Scalar)
+@dynamo_tensorrt_converter(torch.ops.aten.div.Scalar_mode)
+def aten_ops_div(
+    network: TRTNetwork,
+    target: Target,
+    args: Tuple[Argument, ...],
+    kwargs: Dict[str, Argument],
+    name: str,
+) -> Union[TRTTensor, Sequence[TRTTensor]]:
+    rounding_mode = kwargs.get("rounding_mode")
+
+    if rounding_mode is None:
+        return impl.elementwise.div(
+            network,
+            target,
+            SourceIR.ATEN,
+            name,
+            args[0],
+            args[1],
+        )
+    elif rounding_mode == "floor":
+        return impl.elementwise.floor_divide(
+            network,
+            target,
+            SourceIR.ATEN,
+            name,
+            args[0],
+            args[1],
+        )
+    elif rounding_mode == "trunc":
+        return impl.elementwise.trunc_div(
+            network,
+            target,
+            SourceIR.ATEN,
+            name,
+            args[0],
+            args[1],
+        )
+    else:
+        raise RuntimeError(
+            f"Target {target} does not support rounding mode {rounding_mode}"
+        )
 
 
 @dynamo_tensorrt_converter(torch.ops.aten.pow.Tensor_Tensor)
+@dynamo_tensorrt_converter(torch.ops.aten.pow.Scalar)
+@dynamo_tensorrt_converter(torch.ops.aten.pow.Tensor_Scalar)
 def aten_ops_pow(
     network: TRTNetwork,
     target: Target,
@@ -973,6 +973,7 @@ def aten_ops_pow(
 
 
 @dynamo_tensorrt_converter(torch.ops.aten.floor_divide.default)
+@dynamo_tensorrt_converter(torch.ops.aten.floor_divide.Scalar)
 def aten_ops_floor_div(
     network: TRTNetwork,
     target: Target,
@@ -1045,6 +1046,7 @@ def aten_ops_logical_xor(
 
 
 @dynamo_tensorrt_converter(torch.ops.aten.eq.Tensor)
+@dynamo_tensorrt_converter(torch.ops.aten.eq.Scalar)
 def aten_ops_equal(
     network: TRTNetwork,
     target: Target,
@@ -1063,6 +1065,7 @@ def aten_ops_equal(
 
 
 @dynamo_tensorrt_converter(torch.ops.aten.gt.Tensor)
+@dynamo_tensorrt_converter(torch.ops.aten.gt.Scalar)
 def aten_ops_greater(
     network: TRTNetwork,
     target: Target,
@@ -1081,6 +1084,7 @@ def aten_ops_greater(
 
 
 @dynamo_tensorrt_converter(torch.ops.aten.lt.Tensor)
+@dynamo_tensorrt_converter(torch.ops.aten.lt.Scalar)
 def aten_ops_less(
     network: TRTNetwork,
     target: Target,
 
@@ -97,7 +97,7 @@ def cast_trt_tensor(
 
     if input_val.dtype != trt_dtype:
         source_ir = source_ir if source_ir is not None else SourceIR.UNKNOWN
-        target_str = ConverterRegistry.qualified_name_or_str(target)
+        target_str = ConverterRegistry.qualified_name_or_str(ConverterRegistry, target)
         target_name = f"{source_ir}_ops{('.' + target_str) if target_str else ''}"
 
         identity_layer = network.add_identity(input_val)
 
@@ -1,24 +1,79 @@
 import torch
 import torch.nn as nn
-from .harness import DispatchTestCase
 from parameterized import parameterized
 from torch.testing._internal.common_utils import run_tests
 from torch_tensorrt import Input
 
+from .harness import DispatchTestCase
+
 
 class TestAddConverter(DispatchTestCase):
     @parameterized.expand(
         [
-            ("2d_dim_alpha", (2, 1), 2),
-            ("3d_dim_alpha", (2, 1, 2), 2),
+            ("2d", (2, 1)),
+            ("3d", (2, 1, 2)),
+        ]
+    )
+    def test_add_tensor(self, _, shape):
+        class add(nn.Module):
+            def forward(self, lhs_val, rhs_val):
+                return torch.add(lhs_val, rhs_val)
+
+        inputs = [torch.randn(shape), torch.randn(shape)]
+        self.run_test(
+            add(),
+            inputs,
+            expected_ops={torch.ops.aten.add.Tensor},
+        )
+
+    @parameterized.expand(
+        [
+            ("2d", (2, 1), 1),
+            ("3d", (2, 1, 2), 2.0),
         ]
     )
-    def test_add(self, _, x, alpha):
+    def test_add_tensor_alpha(self, _, shape, alpha):
         class add(nn.Module):
             def forward(self, lhs_val, rhs_val):
-                return lhs_val + rhs_val
+                return torch.add(lhs_val, rhs_val, alpha=alpha)
+
+        inputs = [torch.randn(shape), torch.randn(shape)]
+        self.run_test(
+            add(),
+            inputs,
+            expected_ops={torch.ops.aten.add.Tensor},
+        )
+
+    @parameterized.expand(
+        [
+            ("2d", (2, 1), 1.0),
+            ("3d", (2, 1, 2), 2),
+        ]
+    )
+    def test_add_scalar(self, _, shape, scalar):
+        class add(nn.Module):
+            def forward(self, lhs_val):
+                return torch.add(lhs_val, scalar)
+
+        inputs = [torch.randn(shape)]
+        self.run_test(
+            add(),
+            inputs,
+            expected_ops={torch.ops.aten.add.Tensor},
+        )
+
+    @parameterized.expand(
+        [
+            ("2d", (2, 1), 1.0, 1.0),
+            ("3d", (2, 1, 2), 2, 2),
+        ]
+    )
+    def test_add_scalar_alpha(self, _, shape, scalar, alpha):
+        class add(nn.Module):
+            def forward(self, lhs_val):
+                return torch.add(lhs_val, scalar, alpha=alpha)
 
-        inputs = [torch.randn(x) + 1, torch.randn(x) + 1]
+        inputs = [torch.randn(shape)]
         self.run_test(
             add(),
             inputs,