Oneflow-Inc · oneflow-ci-bot · Jul 1, 2021 · May 12, 2021 · May 12, 2021 · May 12, 2021
@@ -395,6 +395,7 @@ list(APPEND OF_CORE_HDRS "${PROJECT_SOURCE_DIR}/oneflow/core/kernel/new_kernel_u
 list(APPEND OF_CORE_HDRS "${PROJECT_SOURCE_DIR}/oneflow/core/kernel/kernel_context.h")
 list(APPEND OF_CORE_HDRS "${PROJECT_SOURCE_DIR}/oneflow/core/kernel/kernel_util.cuh")
 list(APPEND OF_CORE_HDRS "${PROJECT_SOURCE_DIR}/oneflow/core/job/sbp_signature_builder.h")
+list(APPEND OF_CORE_HDRS "${PROJECT_SOURCE_DIR}/oneflow/core/common/symbol.h")
 list(APPEND OF_CORE_HDRS "${PROJECT_SOURCE_DIR}/oneflow/core/job/parallel_desc.h")
 list(APPEND OF_CORE_HDRS "${PROJECT_SOURCE_DIR}/oneflow/core/autograd/autograd_meta.h")
 copy_files("${OF_CORE_HDRS}" "${PROJECT_SOURCE_DIR}" "${ONEFLOW_INCLUDE_DIR}" of_include_copy)

@@ -48,6 +48,9 @@ ArgTuple::ArgTuple(const std::vector<std::string>& indexed_bns) : indexed_bns_(i
   for (const auto& bn : indexed_bns) { indexed_arg_name_and_index_.push_back(GetPair(bn)); }
   InitArgName2BnIndex2TensorTupleIndex(indexed_arg_name_and_index_,
                                        &arg_name2bn_index2tensor_tuple_index_);
+  for (int i = 0; i < indexed_bns.size(); ++i) {
+    bn_in_op2tensor_tuple_index_[indexed_bns.at(i)] = i;
+  }
 }
 
 int32_t ArgTuple::TensorTupleIndex4ArgNameAndIndex(const std::string& name, int32_t index) const {

@@ -37,6 +37,9 @@ class ArgTuple final {
   arg_name2bn_index2tensor_tuple_index() const {
     return arg_name2bn_index2tensor_tuple_index_;
   }
+  const std::unordered_map<std::string, int32_t>& bn_in_op2tensor_tuple_index() const {
+    return bn_in_op2tensor_tuple_index_;
+  }
 
   // return -1 if not found
   int32_t TensorTupleIndex4ArgNameAndIndex(const std::string& name, int32_t index) const;
@@ -45,6 +48,7 @@ class ArgTuple final {
   std::vector<std::string> indexed_bns_;
   std::vector<std::pair<std::string, int32_t>> indexed_arg_name_and_index_;
   std::unordered_map<std::string, std::vector<int32_t>> arg_name2bn_index2tensor_tuple_index_;
+  std::unordered_map<std::string, int32_t> bn_in_op2tensor_tuple_index_;
 };
 
 }  // namespace oneflow

@@ -0,0 +1,209 @@
+/*
+Copyright 2020 The OneFlow Authors. All rights reserved.
+
+Licensed under the Apache License, Version 2.0 (the "License");
+you may not use this file except in compliance with the License.
+You may obtain a copy of the License at
+
+    http://www.apache.org/licenses/LICENSE-2.0
+
+Unless required by applicable law or agreed to in writing, software
+distributed under the License is distributed on an "AS IS" BASIS,
+WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+See the License for the specific language governing permissions and
+limitations under the License.
+*/
+#include "oneflow/core/framework/consistent_tensor_infer_cache.h"
+#include "oneflow/core/framework/tensor_tuple.h"
+#include "oneflow/core/job/placement_scope.h"
+#include "oneflow/core/operator/operator.h"
+#include "oneflow/core/framework/to_string.h"
+#include "oneflow/core/framework/tensor.h"
+#include "oneflow/core/framework/op_expr.h"
+
+namespace oneflow {
+namespace one {
+
+size_t InputConsistentTensorMeta::hash_value() const {
+  return std::hash<Symbol<ConsistentTensorMeta>>()(tensor_meta())
+         ^ std::hash<Symbol<cfg::ParallelDistribution>>()(
+             consumer_parallel_distribution_constraint());
+}
+
+bool InputConsistentTensorMeta::operator==(const InputConsistentTensorMeta& other) const {
+  return this->tensor_meta() == other.tensor_meta()
+         && this->consumer_parallel_distribution_constraint()
+                == other.consumer_parallel_distribution_constraint();
+}
+
+void InputConsistentTensorMeta::assign(
+    Symbol<ConsistentTensorMeta> tensor_meta,
+    Symbol<cfg::ParallelDistribution> consumer_parallel_distribution_constraint) {
+  tensor_meta_ = tensor_meta;
+  consumer_parallel_distribution_constraint_ = consumer_parallel_distribution_constraint;
+}
+
+Maybe<void> ConsistentTensorMetaInferArgs::Init(const TensorTuple& input_tensors,
+                                                Symbol<PlacementScope> placement_scope,
+                                                const AttrMap& attrs) {
+  input_consistent_tensor_metas_.resize(input_tensors.size());
+  placement_scope_ = placement_scope;
+  attrs_ = attrs;
+  JUST(InitInputConsistentTensorMetas(input_tensors));
+  return Maybe<void>::Ok();
+}
+
+size_t ConsistentTensorMetaInferArgs::hash_value() const {
+  size_t hash_value = std::hash<Symbol<PlacementScope>>()(placement_scope_);
+  hash_value ^= std::hash<AttrMap>()(attrs_);
+  const auto& tensor_meta_hash_functor = std::hash<InputConsistentTensorMeta>();
+  for (const auto& tensor_meta : input_consistent_tensor_metas_) {
+    HashCombine(&hash_value, tensor_meta_hash_functor(tensor_meta));
+  }
+  return hash_value;
+}
+
+bool ConsistentTensorMetaInferArgs::operator==(const ConsistentTensorMetaInferArgs& other) const {
+  return this->input_consistent_tensor_metas_ == other.input_consistent_tensor_metas_
+         && this->placement_scope_ == other.placement_scope_ && this->attrs_ == other.attrs_;
+}
+
+Maybe<void> ConsistentTensorMetaInferArgs::MakeParallelDistributionConstraints(
+    const UserOpExpr& user_op_expr,
+    cfg::ParallelDistributionSignature* parallel_distribution_signature) const {
+  const auto& input_arg_tuple = *user_op_expr.input_arg_tuple();
+  auto* map = parallel_distribution_signature->mutable_bn_in_op2parallel_distribution();
+  for (int i = 0; i < input_arg_tuple.size(); ++i) {
+    const auto& constaint =
+        input_consistent_tensor_metas_.at(i).consumer_parallel_distribution_constraint();
+    if (constaint) { (*map)[input_arg_tuple.indexed_bns().at(i)] = *constaint; }
+  }
+  return Maybe<void>::Ok();
+}
+
+Maybe<void> ConsistentTensorMetaInferArgs::MakeInputBlobDescs(
+    const UserOpExpr& user_op_expr, std::vector<BlobDesc>* blob_descs) const {
+  CHECK_OR_RETURN(blob_descs->empty());
+  const auto& input_arg_tuple = *user_op_expr.input_arg_tuple();
+  blob_descs->reserve(input_arg_tuple.size());
+  for (int i = 0; i < input_arg_tuple.size(); ++i) {
+    const auto& tensor_meta = *input_consistent_tensor_metas_.at(i).tensor_meta();
+    const auto& shape = std::const_pointer_cast<Shape>(tensor_meta.shape_ptr());
+    blob_descs->emplace_back(shape, tensor_meta.data_type());
+  }
+  return Maybe<void>::Ok();
+}
+
+Maybe<void> ConsistentTensorMetaInferArgs::MakeParallelDistributionInferHints(
+    const UserOpExpr& user_op_expr, const std::vector<BlobDesc>& blob_descs,
+    std::vector<ParallelDistributionInferHint>* hints) const {
+  CHECK_OR_RETURN(hints->empty());
+  const auto& input_arg_tuple = *user_op_expr.input_arg_tuple();
+  hints->reserve(input_arg_tuple.size());
+  for (int i = 0; i < input_arg_tuple.size(); ++i) {
+    const auto& tensor_meta = *input_consistent_tensor_metas_.at(i).tensor_meta();
+    const auto* parallel_desc = &*tensor_meta.parallel_desc();
+    const auto* blob_desc = &blob_descs.at(i);
+    const auto* parallel_distribution = &*tensor_meta.parallel_distribution();
+    hints->emplace_back(parallel_desc, blob_desc, parallel_distribution);
+  }
+  return Maybe<void>::Ok();
+}
+
+Maybe<void> ConsistentTensorMetaInferArgs::InitInputConsistentTensorMetas(
+    const TensorTuple& input_tensors) {
+  for (int i = 0; i < input_tensors.size(); ++i) {
+    const auto& tensor = *input_tensors.at(i);
+    const auto& tensor_meta = JUST(tensor.consistent_tensor_meta());
+    const auto& constraints = JUST(tensor.consumer_parallel_distribution_constraint());
+    input_consistent_tensor_metas_.at(i).assign(tensor_meta, constraints);
+  }
+  return Maybe<void>::Ok();
+}
+
+namespace {
+
+Maybe<Operator> MakeOp(const UserOpExpr& user_op_expr, const AttrMap& attrs,
+                       const std::string& device_tag) {
+  OperatorConf op_conf;
+  JUST(user_op_expr.BuildOpConf(&op_conf, attrs));
+  DeviceType device_type = JUST(DeviceType4DeviceTag(device_tag));
+  return ConstructOp(op_conf, device_type);
+}
+
+}  // namespace
+
+/*static*/ Maybe<const ConsistentTensorInferResult> ConsistentTensorInferCache::Infer(
+    const UserOpExpr& user_op_expr, const ConsistentTensorMetaInferArgs& infer_args) {
+  Symbol<ParallelDesc> parallel_desc;
+  {
+    // Get parallel description.
+    const auto& placement_scope = infer_args.placement_scope();
+    parallel_desc = JUST(placement_scope->GetParallelDesc(user_op_expr.op_type_name()));
+  }
+  std::vector<OpArgMutConsistentTensorMeta> output_mut_metas(user_op_expr.output_size());
+  {
+    // Infer OpArgMutConsistentTensorMeta.
+    const auto& input_metas = infer_args.input_consistent_tensor_metas();
+    JUST(user_op_expr.InferLogicalShapeAndDType(
+        infer_args.attrs(), parallel_desc->device_tag(),
+        [&](int32_t i) { return &*input_metas.at(i).tensor_meta(); },
+        [&](int32_t i) { return output_mut_metas.at(i).mut_tensor_meta(); }));
+  }
+  const auto& op = JUST(MakeOp(user_op_expr, infer_args.attrs(), parallel_desc->device_tag()));
+  op->FillOpParallelDesc(parallel_desc.shared_from_symbol());
+  {
+    // Infer parallel distribution.
+    cfg::ParallelDistributionSignature parallel_distribution_constraints;
+    JUST(infer_args.MakeParallelDistributionConstraints(user_op_expr,
+                                                        &parallel_distribution_constraints));
+    std::vector<BlobDesc> blob_descs;
+    JUST(infer_args.MakeInputBlobDescs(user_op_expr, &blob_descs));
+    std::vector<ParallelDistributionInferHint> pd_infer_hints;
+    JUST(infer_args.MakeParallelDistributionInferHints(user_op_expr, blob_descs, &pd_infer_hints));
+    const auto& input_arg_tuple = *user_op_expr.input_arg_tuple();
+    const auto& ParallelDistributionInferHint4Ibn =
+        [&](const std::string& ibn) -> Maybe<const ParallelDistributionInferHint*> {
+      int32_t input_index = input_arg_tuple.bn_in_op2tensor_tuple_index().at(ibn);
+      CHECK_GE_OR_RETURN(input_index, 0);
+      CHECK_LT_OR_RETURN(input_index, pd_infer_hints.size());
+      return &pd_infer_hints.at(input_index);
+    };
+    // The inferred results can be retrieved by op->ParallelDistribution4BnInOp(obn).
+    JUST(op->InferParallelDistributionSignatureIf(parallel_distribution_constraints, *parallel_desc,
+                                                  ParallelDistributionInferHint4Ibn));
+  }
+  auto* result =
+      new ConsistentTensorInferResult(user_op_expr.input_size(), user_op_expr.output_size());
+  auto* input_pd = result->mut_input_parallel_distributions();
+  for (int32_t i = 0; i < user_op_expr.input_size(); ++i) {
+    const auto& ibn = user_op_expr.input_arg_tuple()->indexed_bns().at(i);
+    input_pd->at(i) = SymbolOf(*JUST(op->ParallelDistribution4BnInOp(ibn)));
+  }
+  auto* output_metas = result->mut_output_tensor_metas();
+  for (int32_t i = 0; i < user_op_expr.output_size(); ++i) {
+    const auto& output_mut_meta = output_mut_metas.at(i);
+    const auto& shape = output_mut_meta.tensor_meta().shape_ptr();
+    DataType data_type = output_mut_meta.tensor_meta().data_type();
+    const auto& obn = user_op_expr.output_arg_tuple()->indexed_bns().at(i);
+    const auto& parallel_distribution = SymbolOf(*JUST(op->ParallelDistribution4BnInOp(obn)));
+    ConsistentTensorMeta tensor_meta(shape, data_type, parallel_distribution, parallel_desc);
+    output_metas->at(i) = SymbolOf(tensor_meta);
+  }
+  return std::shared_ptr<const ConsistentTensorInferResult>(result);
+}
+
+Maybe<const ConsistentTensorInferResult> ConsistentTensorInferCache::GetOrInfer(
+    const ConsistentTensorMetaInferArgs& infer_args) {
+  auto iter = cache_.find(infer_args);
+  if (iter == cache_.end()) {
+    const auto& user_op_expr = user_op_expr_.lock();
+    CHECK_OR_RETURN(static_cast<bool>(user_op_expr));
+    const auto& output_tensor_metas = JUST(Infer(*user_op_expr, infer_args));
+    iter = cache_.emplace(infer_args, output_tensor_metas).first;
+  }
+  return iter->second;
+}
+
+}  // namespace one
+}  // namespace oneflow