Tflite floor adds missing datatype support (#75)

swatheesh-mcw · nitheshsrikanth-mcw · web-flow · commit 18581a6cb30c · 2024-08-26T12:57:52.000+05:30
* Tflite floor missing datatype support
-Adds f16,bf16 for floor
-Adds f16,bf16 for floor unit test

Co-authored-by: nitheshsrikanth-mcw &lt;nithesh.srikanth@multicorewareinc.com&gt;
diff --git a/tensorflow/lite/kernels/floor.cc b/tensorflow/lite/kernels/floor.cc
@@ -42,7 +42,9 @@ TfLiteStatus Prepare(TfLiteContext* context, TfLiteNode* node) {
                     GetOutputSafe(context, node, kOutputTensor, &output));
   TF_LITE_ENSURE_EQ(context, NumInputs(node), 1);
   TF_LITE_ENSURE_EQ(context, NumOutputs(node), 1);
-  TF_LITE_ENSURE_TYPES_EQ(context, input->type, kTfLiteFloat32);
+  TF_LITE_ENSURE(context, input->type == kTfLiteFloat32 ||
+                          input->type == kTfLiteFloat16 ||
+                          input->type == kTfLiteBFloat16);
   output->type = input->type;
   TfLiteIntArray* output_size = TfLiteIntArrayCopy(input->dims);
   return context->ResizeTensor(context, output, output_size);
@@ -55,13 +57,38 @@ TfLiteStatus Eval(TfLiteContext* context, TfLiteNode* node) {
   TfLiteTensor* output;
   TF_LITE_ENSURE_OK(context,
                     GetOutputSafe(context, node, kOutputTensor, &output));
-
-  if (type == kGenericOptimized) {
-    optimized_ops::Floor(GetTensorShape(input), GetTensorData<float>(input),
-                         GetTensorShape(output), GetTensorData<float>(output));
-  } else {
-    reference_ops::Floor(GetTensorShape(input), GetTensorData<float>(input),
-                         GetTensorShape(output), GetTensorData<float>(output));
+  if (input->type == kTfLiteFloat32) {
+    if (type == kGenericOptimized) {
+      optimized_ops::Floor(GetTensorShape(input), GetTensorData<float>(input),
+                           GetTensorShape(output),
+                           GetTensorData<float>(output));
+    } else {
+      reference_ops::Floor(GetTensorShape(input), GetTensorData<float>(input),
+                           GetTensorShape(output),
+                           GetTensorData<float>(output));
+    }
+  }
+  if (input->type == kTfLiteFloat16) {
+    if (type == kGenericOptimized) {
+      optimized_ops::Floor(
+          GetTensorShape(input), GetTensorData<Eigen::half>(input),
+          GetTensorShape(output), GetTensorData<Eigen::half>(output));
+    } else {
+      reference_ops::Floor(
+          GetTensorShape(input), GetTensorData<Eigen::half>(input),
+          GetTensorShape(output), GetTensorData<Eigen::half>(output));
+    }
+  }
+  if (input->type == kTfLiteBFloat16) {
+    if (type == kGenericOptimized) {
+      optimized_ops::Floor(
+          GetTensorShape(input), GetTensorData<Eigen::bfloat16>(input),
+          GetTensorShape(output), GetTensorData<Eigen::bfloat16>(output));
+    } else {
+      reference_ops::Floor(
+          GetTensorShape(input), GetTensorData<Eigen::bfloat16>(input),
+          GetTensorShape(output), GetTensorData<Eigen::bfloat16>(output));
+    }
   }
 
   return kTfLiteOk;
diff --git a/tensorflow/lite/kernels/floor_test.cc b/tensorflow/lite/kernels/floor_test.cc
@@ -29,17 +29,19 @@ using ::testing::ElementsAreArray;
 class FloorOpModel : public SingleOpModel {
  public:
   FloorOpModel(std::initializer_list<int> input_shape, TensorType input_type) {
-    input_ = AddInput(TensorType_FLOAT32);
-    output_ = AddOutput(TensorType_FLOAT32);
+    input_ = AddInput(input_type);
+    output_ = AddOutput(input_type);
     SetBuiltinOp(BuiltinOperator_FLOOR, BuiltinOptions_NONE, 0);
     BuildInterpreter({
         input_shape,
     });
   }
 
   int input() { return input_; }
-
-  std::vector<float> GetOutput() { return ExtractVector<float>(output_); }
+  template <typename T>
+   std::vector<T> GetOutput() {
+    return ExtractVector<T>(output_);
+}
   std::vector<int> GetOutputShape() { return GetTensorShape(output_); }
 
  private:
@@ -51,7 +53,7 @@ TEST(FloorOpTest, SingleDim) {
   FloorOpModel model({2}, TensorType_FLOAT32);
   model.PopulateTensor<float>(model.input(), {8.5, 0.0});
   ASSERT_EQ(model.Invoke(), kTfLiteOk);
-  EXPECT_THAT(model.GetOutput(), ElementsAreArray({8, 0}));
+  EXPECT_THAT(model.GetOutput<float>(), ElementsAreArray({8, 0}));
   EXPECT_THAT(model.GetOutputShape(), ElementsAreArray({2}));
 }
 
@@ -70,10 +72,67 @@ TEST(FloorOpTest, MultiDims) {
                                                  -0.5,
                                              });
   ASSERT_EQ(model.Invoke(), kTfLiteOk);
-  EXPECT_THAT(model.GetOutput(),
+  EXPECT_THAT(model.GetOutput<float>(),
+              ElementsAreArray({0, 8, 0, 9, 0, -1, -9, -1, -10, -1}));
+  EXPECT_THAT(model.GetOutputShape(), ElementsAreArray({2, 1, 1, 5}));
+}
+
+TEST(FloorOpTest, SingleDimFloat16) {
+  FloorOpModel model({2}, TensorType_FLOAT16);
+  model.PopulateTensor<>(model.input(), {Eigen::half(8.5), Eigen::half(0.0)});
+  ASSERT_EQ(model.Invoke(), kTfLiteOk);
+  EXPECT_THAT(model.GetOutput<Eigen::half>(), ElementsAreArray({8, 0}));
+  EXPECT_THAT(model.GetOutputShape(), ElementsAreArray({2}));
+}
+
+TEST(FloorOpTest, MultiDimsFloat16) {
+  FloorOpModel model({2, 1, 1, 5}, TensorType_FLOAT16);
+  model.PopulateTensor<Eigen::half>(model.input(), {
+                                                 Eigen::half(0.75),
+                                                 Eigen::half(8.25),
+                                                 Eigen::half(0.49),
+                                                 Eigen::half(9.99),
+                                                 Eigen::half(0.5),
+                                                 Eigen::half(-0.25),
+                                                 Eigen::half(-8.75),
+                                                 Eigen::half(-0.99),
+                                                 Eigen::half(-9.49),
+                                                 Eigen::half(-0.5),
+                                             });
+  ASSERT_EQ(model.Invoke(), kTfLiteOk);
+  EXPECT_THAT(model.GetOutput<Eigen::half>(),
               ElementsAreArray({0, 8, 0, 9, 0, -1, -9, -1, -10, -1}));
   EXPECT_THAT(model.GetOutputShape(), ElementsAreArray({2, 1, 1, 5}));
 }
 
+
+TEST(FloorOpTest, SingleDimBFloat16) {
+  FloorOpModel model({2}, TensorType_BFLOAT16);
+  model.PopulateTensor<>(model.input(), {Eigen::bfloat16(8.5),Eigen::bfloat16(0.0)});
+  ASSERT_EQ(model.Invoke(), kTfLiteOk);
+  EXPECT_THAT(model.GetOutput<Eigen::bfloat16>(), ElementsAreArray({8, 0}));
+  EXPECT_THAT(model.GetOutputShape(), ElementsAreArray({2}));
+}
+
+TEST(FloorOpTest, MultiDimsBFloat16) {
+  FloorOpModel model({2, 1, 1, 5}, TensorType_BFLOAT16);
+  model.PopulateTensor<Eigen::bfloat16>(model.input(), {
+                                                 Eigen::bfloat16(1.75),
+                                                 Eigen::bfloat16(8.5),
+                                                 Eigen::bfloat16(1.49),
+                                                 Eigen::bfloat16(9.01),
+                                                 Eigen::bfloat16(1.5),
+                                                 Eigen::bfloat16(-1.25),
+                                                 Eigen::bfloat16(-8.99),
+                                                 Eigen::bfloat16(-1.99),
+                                                 Eigen::bfloat16(-9.5),
+                                                 Eigen::bfloat16(-1.5),
+                                             });
+  ASSERT_EQ(model.Invoke(), kTfLiteOk);
+  EXPECT_THAT(model.GetOutput<Eigen::bfloat16>(),
+              ElementsAreArray({1, 8, 1, 9, 1, -2, -9, -2, -10, -2}));
+  EXPECT_THAT(model.GetOutputShape(), ElementsAreArray({2, 1, 1, 5}));
+}
+
 }  // namespace
 }  // namespace tflite
diff --git a/tensorflow/lite/kernels/internal/optimized/optimized_ops.h b/tensorflow/lite/kernels/internal/optimized/optimized_ops.h
@@ -4224,8 +4224,9 @@ inline void Cast(const RuntimeShape& input_shape, const SrcT* input_data,
   output_map.array() = input_map.array().template cast<DstT>();
 }
 
-inline void Floor(const RuntimeShape& input_shape, const float* input_data,
-                  const RuntimeShape& output_shape, float* output_data) {
+template <typename T>
+inline void Floor(const RuntimeShape& input_shape, const T* input_data,
+                  const RuntimeShape& output_shape, T* output_data) {
   ruy::profiler::ScopeLabel label("Floor");
   auto input_map = MapAsVector(input_data, input_shape);
   auto output_map = MapAsVector(output_data, output_shape);
diff --git a/tensorflow/lite/kernels/internal/reference/floor.h b/tensorflow/lite/kernels/internal/reference/floor.h
@@ -23,13 +23,14 @@ namespace tflite {
 
 namespace reference_ops {
 
-inline void Floor(const RuntimeShape& input_shape, const float* input_data,
-                  const RuntimeShape& output_shape, float* output_data) {
+template <typename T>
+inline void Floor(const RuntimeShape& input_shape, const T* input_data,
+                  const RuntimeShape& output_shape, T* output_data) {
   const int flat_size = MatchingFlatSize(input_shape, output_shape);
 
   for (int i = 0; i < flat_size; i++) {
     int offset = i;
-    output_data[offset] = std::floor(input_data[offset]);
+    output_data[offset] = static_cast<T>(std::floor(static_cast<float>(input_data[offset])));
   }
 }
 

Original file line number	Diff line number	Diff line change
`@@ -23,13 +23,14 @@ namespace tflite {`
`23`	`23`
`24`	`24`	`namespace reference_ops {`
`25`	`25`
`26`		`-inline void Floor(const RuntimeShape& input_shape, const float* input_data,`
`27`		`- const RuntimeShape& output_shape, float* output_data) {`
	`26`	`+template <typename T>`
	`27`	`+inline void Floor(const RuntimeShape& input_shape, const T* input_data,`
	`28`	`+ const RuntimeShape& output_shape, T* output_data) {`
`28`	`29`	`const int flat_size = MatchingFlatSize(input_shape, output_shape);`
`29`	`30`
`30`	`31`	`for (int i = 0; i < flat_size; i++) {`
`31`	`32`	`int offset = i;`
`32`		`- output_data[offset] = std::floor(input_data[offset]);`
	`33`	`+ output_data[offset] = static_cast<T>(std::floor(static_cast<float>(input_data[offset])));`
`33`	`34`	`}`
`34`	`35`	`}`
`35`	`36`