pytorch
diff --git a/‎.ci/scripts/build-qnn-sdk.sh
Lines changed: 1 addition & 0 deletions b/‎.ci/scripts/build-qnn-sdk.sh
Lines changed: 1 addition & 0 deletions
diff --git a/‎backends/qualcomm/CMakeLists.txt
Lines changed: 6 additions & 1 deletion b/‎backends/qualcomm/CMakeLists.txt
Lines changed: 6 additions & 1 deletion
diff --git a/‎backends/qualcomm/aot/python/PyQnnManagerAdaptor.h
Lines changed: 6 additions & 3 deletions b/‎backends/qualcomm/aot/python/PyQnnManagerAdaptor.h
Lines changed: 6 additions & 3 deletions
diff --git a/‎backends/qualcomm/builders/op_dequantize.py
Lines changed: 1 addition & 1 deletion b/‎backends/qualcomm/builders/op_dequantize.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎backends/qualcomm/builders/op_quantize.py
Lines changed: 1 addition & 1 deletion b/‎backends/qualcomm/builders/op_quantize.py
Lines changed: 1 addition & 1 deletion
diff --git a/‎backends/qualcomm/qnn_preprocess.py
Lines changed: 9 additions & 0 deletions b/‎backends/qualcomm/qnn_preprocess.py
Lines changed: 9 additions & 0 deletions
diff --git a/‎backends/qualcomm/runtime/QnnExecuTorchBackend.cpp
Lines changed: 2 additions & 4 deletions b/‎backends/qualcomm/runtime/QnnExecuTorchBackend.cpp
Lines changed: 2 additions & 4 deletions
diff --git a/‎backends/qualcomm/runtime/QnnManager.cpp
Lines changed: 96 additions & 22 deletions b/‎backends/qualcomm/runtime/QnnManager.cpp
Lines changed: 96 additions & 22 deletions
diff --git a/‎backends/qualcomm/runtime/QnnManager.h
Lines changed: 21 additions & 1 deletion b/‎backends/qualcomm/runtime/QnnManager.h
Lines changed: 21 additions & 1 deletion
@@ -33,6 +33,7 @@ set_up_aot() {
   cmake .. \
       -DCMAKE_INSTALL_PREFIX=$PWD \
       -DEXECUTORCH_BUILD_QNN=ON \
+      -DANDROID_NATIVE_API_LEVEL=30 \
       -DQNN_SDK_ROOT=${QNN_SDK_ROOT} \
       -DEXECUTORCH_BUILD_DEVTOOLS=ON \
       -DEXECUTORCH_BUILD_EXTENSION_MODULE=ON \
 
@@ -70,6 +70,7 @@ endif()
 
 include_directories(
   BEFORE ${_common_include_directories} ${QNN_SDK_ROOT}/include/QNN
+  ${QNN_SDK_ROOT}/share/QNN/converter/jni
   ${EXECUTORCH_SOURCE_DIR}/third-party/flatbuffers/include
   ${EXECUTORCH_SOURCE_DIR}/runtime/core/portable_type/c10
 )
@@ -117,6 +118,7 @@ add_library(qnn_backend STATIC)
 add_library(qnn_backend_cache STATIC)
 add_library(qnn_context STATIC)
 add_library(qnn_custom_protocol STATIC)
+add_library(qnn_dlc_manager STATIC)
 add_library(qnn_device STATIC)
 add_library(qnn_executorch_backend SHARED)
 add_library(qnn_executorch_header INTERFACE)
@@ -174,8 +176,11 @@ target_link_libraries(
   qnn_factory PRIVATE qnn_schema qnn_backend qnn_device qnn_context qnn_graph
           qnn_mem_manager qnn_custom_protocol
 )
+
+target_link_libraries(qnn_dlc_manager PRIVATE qnn_factory qnn_backend qnn_device qnn_context qnn_graph qnn_mem_manager)
+
 target_link_libraries(
-  qnn_manager PRIVATE qnn_factory wrappers qnn_schema utils shared_buffer
+  qnn_manager PRIVATE qnn_factory wrappers qnn_schema utils shared_buffer qnn_dlc_manager
 )
 target_link_libraries(
   qnn_executorch_backend PRIVATE qnn_executorch_header qnn_schema qnn_manager
 
@@ -195,7 +195,7 @@ class PyQnnManager {
       std::vector<std::shared_ptr<OpWrapper>>& op_wrappers) {
     QnnExecuTorchContextBinary binary_info;
 
-    if (qnn_manager_->IsOnlinePrepare() || qnn_manager_->IsMultipleGraphs()) {
+    if (qnn_manager_->IsMultipleGraphs()) {
       builder_.Reset();
       std::vector<uint8_t> tensor_data;
       std::vector<uint64_t> offsets;
@@ -305,8 +305,11 @@ class PyQnnManager {
         QNN_EXECUTORCH_LOG_ERROR("Fail to compile QNN graph");
         return py::array_t<char>(0);
       }
-      if (qnn_manager_->GetContextBinary(binary_info) !=
-          executorch::runtime::Error::Ok) {
+      auto qnn_executorch_options = GetQnnExecuTorchOptions(
+          qnn_executorch_option_ptr_.cast<std::string_view>().data());
+      if (qnn_executorch_options->saver() ||
+          qnn_manager_->GetContextBinary(binary_info) !=
+              executorch::runtime::Error::Ok) {
         return py::array_t<char>(0);
       }
     }
 
@@ -45,7 +45,7 @@ def define_node(
         dequant_output_tensors = [output_tensor_wrapper]
 
         dequant_op = PyQnnWrapper.PyQnnOpWrapper(
-            node.target.__name__,
+            node.name,
             QNN_OP_PACKAGE_NAME_QTI_AISW,
             OpDequantize.op_name,
         )
 
@@ -52,7 +52,7 @@ def define_node(
         quant_output_tensors = [output_tensor_wrapper]
 
         quant_op = PyQnnWrapper.PyQnnOpWrapper(
-            node.target.__name__,
+            node.name,
             QNN_OP_PACKAGE_NAME_QTI_AISW,
             OpQuantize.op_name,
         )
 
@@ -15,6 +15,9 @@
 from executorch.backends.qualcomm.builders.node_visitor import get_node_visitors
 from executorch.backends.qualcomm.builders.qnn_constants import OpContextLoader
 from executorch.backends.qualcomm.partition.utils import generate_qnn_executorch_option
+from executorch.backends.qualcomm.serialization.qc_schema_serialize import (
+    flatbuffer_to_option,
+)
 from executorch.exir.backend.backend_details import (
     BackendDetails,
     CompileSpec,
@@ -92,6 +95,12 @@ def preprocess(
             qnn_manager.GetGraphNames()[0],
             [py_op_wrapper.GetOpWrapper() for py_op_wrapper in py_op_wrapper_list],
         )
+
+        obj_options = flatbuffer_to_option(option)
+        if obj_options.saver:
+            exit(
+                f"Record all QNN API calls from saver backend at: {obj_options.saver_output_dir}"
+            )
         assert len(qnn_context_binary) != 0, "Failed to generate Qnn context binary."
         qnn_manager.Destroy()
         # For now, debug_handle_map is not used by QNN ExecuTorch
 
@@ -36,7 +36,6 @@ Result<DelegateHandle*> QnnExecuTorchBackend::init(
   // covert SizedBuffer to qnn ExecuTorch option
   QnnExecuTorchContextBinary qnn_context_blob;
   const qnn_delegate::QnnExecuTorchOptions* qnn_executorch_options = nullptr;
-
   auto [status, signature, ctx_size, ctx_bin] =
       QnnContextCustomProtocol().DeserializeContextCustomBuffer(
           const_cast<void*>(processed->data()));
@@ -74,7 +73,6 @@ Result<DelegateHandle*> QnnExecuTorchBackend::init(
   // NOTE: Since we use placement new and since this type is not trivially
   // destructible, we must call the destructor manually in destroy().
   new (qnn_manager) QnnManager(qnn_executorch_options, qnn_context_blob);
-
   // TODO: this is a temporal solution for multi-graph support, will be
   //       removed once framework starts to accept runtime configuration
   // ---
@@ -96,9 +94,9 @@ Result<DelegateHandle*> QnnExecuTorchBackend::init(
 
   if (qnn_manager->IsOnlinePrepare()) {
     ET_CHECK_OR_RETURN_ERROR(
-        qnn_manager->CompileQcir() == Error::Ok,
+        qnn_manager->CompileDlc() == Error::Ok,
         Internal,
-        "Fail to compile binary in qcir format");
+        "Fail to compile binary in Dlc format");
   } else {
     for (const std::string& graph_name : qnn_manager->GetGraphNames()) {
       ET_CHECK_OR_RETURN_ERROR(
 
@@ -37,9 +37,7 @@ bool CompareExportedInput(
 }
 
 QnnManager::~QnnManager() {
-  backend_params_ptr_.reset(new BackendConfigParameters());
-  logger_.reset();
-  qnn_loaded_backend_.TerminateAllBackends();
+  Destroy();
 }
 
 QnnManager::QnnManager(
@@ -96,10 +94,14 @@ QnnManager::QnnManager(
   }
   qnn_loaded_backend_ = QnnImplementation(library_path);
   backend_params_ptr_ = std::make_unique<BackendConfigParameters>();
+
+  qnn_dlc_manager_ =
+      std::make_shared<QnnDlcManager>(qnn_context_blob_, options_);
 }
 
 Error QnnManager::LoadQnnLibrary() {
-  Error ret = qnn_loaded_backend_.Load(nullptr);
+  auto config = GetImplementationConfig();
+  Error ret = qnn_loaded_backend_.Load(config.get());
   return ret;
 }
 
@@ -286,7 +288,11 @@ Error QnnManager::Init() {
         "parameters for Qnn executorch backend type %d",
         options_->backend_options()->backend_type());
     backend_params_ptr_ = QnnBackendFactory().Create(
-        qnn_loaded_backend_, logger_.get(), qnn_context_blob_, options_);
+        qnn_loaded_backend_,
+        logger_.get(),
+        qnn_context_blob_,
+        options_,
+        qnn_dlc_manager_.get());
     ET_CHECK_OR_RETURN_ERROR(
         backend_params_ptr_ != nullptr,
         Internal,
@@ -326,6 +332,18 @@ Error QnnManager::Init() {
       Internal,
       "Fail to pre register custom memory handle");
 #endif
+
+  if (IsOnlinePrepare()) {
+    Qnn_ApiVersion_t qnn_version = {QNN_VERSION_INIT};
+    qnn_loaded_backend_.GetQnnInterface().qnn_backend_get_api_version(
+        &qnn_version);
+
+    ET_CHECK_OR_RETURN_ERROR(
+        qnn_dlc_manager_->SetUpDlcEnvironment(qnn_version.coreApiVersion) ==
+            Error::Ok,
+        Internal,
+        "Fail to setup Dlc environment");
+  }
   return Error::Ok;
 }
 
@@ -446,9 +464,11 @@ Error QnnManager::ProfileExecuteData(
 void QnnManager::Destroy() {
   QNN_EXECUTORCH_LOG_INFO("Destroy Qnn backend parameters");
   backend_params_ptr_.reset(new BackendConfigParameters());
+  qnn_dlc_manager_->ResetBackendParams();
   logger_.reset();
-
+  qnn_dlc_manager_->ResetLogger();
   qnn_loaded_backend_.TerminateAllBackends();
+  qnn_dlc_manager_->TerminateAllBackends();
 }
 
 bool QnnManager::IsNodeSupportedByBackend(
@@ -483,11 +503,64 @@ bool QnnManager::IsNodeSupportedByBackend(
 
 Error QnnManager::GetContextBinary(
     QnnExecuTorchContextBinary& qnn_executorch_context_binary) {
-  ET_CHECK_OR_RETURN_ERROR(
-      backend_params_ptr_->qnn_context_ptr_->GetContextBinary(
-          qnn_executorch_context_binary) == Error::Ok,
-      Internal,
-      "Fail to get context binary.");
+  if (IsOnlinePrepare() &&
+      qnn_dlc_manager_->backend_params_ptr_->qnn_context_ptr_.get() !=
+          nullptr) {
+    ET_CHECK_OR_RETURN_ERROR(
+        qnn_dlc_manager_->backend_params_ptr_->qnn_context_ptr_
+                ->GetContextBinary(qnn_executorch_context_binary) == Error::Ok,
+        Internal,
+        "Fail to get context binary.");
+  }
+
+  else {
+    ET_CHECK_OR_RETURN_ERROR(
+        backend_params_ptr_->qnn_context_ptr_->GetContextBinary(
+            qnn_executorch_context_binary) == Error::Ok,
+        Internal,
+        "Fail to get context binary.");
+  }
+  return Error::Ok;
+}
+
+Error QnnManager::CompileDlc() {
+  Qnn_ErrorHandle_t error;
+  auto qnn_dlc_graph_info = qnn_dlc_manager_->GetQnnDlcGraphInfoPtr();
+  uint32_t qnn_dlc_graph_info_num = qnn_dlc_manager_->GetQnnDlcGraphInfoNum();
+  for (uint32_t i = 0; i < qnn_dlc_graph_info_num; ++i) {
+    auto& graphInfo = (*qnn_dlc_graph_info)[i];
+    backend_params_ptr_->qnn_graph_ptr_->SetGraphHandle(
+        graphInfo.graphName, graphInfo.graph);
+    error =
+        backend_params_ptr_->qnn_graph_ptr_->GraphFinalize(graphInfo.graphName);
+    if (error != QNN_SUCCESS) {
+      QNN_EXECUTORCH_LOG_ERROR(
+          "Failed to finalize Qnn Graph with error: %d",
+          QNN_GET_ERROR_CODE(error));
+      return Error::Internal;
+    }
+
+    std::vector<std::shared_ptr<TensorWrapper>> graph_inputs, graph_outputs,
+        tensors;
+
+    for (int i = 0; i < graphInfo.numInputTensors; ++i) {
+      auto tw = CreateTensorWrapper(graphInfo.inputTensors[i]);
+      tw->UpdateQnnTensorMeta(graphInfo.inputTensors[i]);
+      graph_inputs.push_back(tw);
+    }
+    for (int i = 0; i < graphInfo.numOutputTensors; ++i) {
+      auto tw = CreateTensorWrapper(graphInfo.outputTensors[i]);
+      tw->UpdateQnnTensorMeta(graphInfo.outputTensors[i]);
+      graph_outputs.push_back(tw);
+    }
+
+    ET_CHECK_OR_RETURN_ERROR(
+        AllocateTensor(graphInfo.graphName, graph_inputs, graph_outputs) ==
+            Error::Ok,
+        Internal,
+        "Fail to allocate tensor for Dlc with graph_name: %s",
+        graphInfo.graphName);
+  }
 
   return Error::Ok;
 }
@@ -616,31 +689,34 @@ Error QnnManager::Compile(
     const std::string& graph_name,
     std::vector<std::shared_ptr<OpWrapper>>& op_wrappers) {
   Qnn_ErrorHandle_t error = QNN_SUCCESS;
+  QnnGraph* qnn_graph_ptr = backend_params_ptr_->qnn_graph_ptr_.get();
 
+  if (IsOnlinePrepare() &&
+      qnn_dlc_manager_->backend_params_ptr_->qnn_graph_ptr_.get() != nullptr) {
+    qnn_graph_ptr = qnn_dlc_manager_->backend_params_ptr_->qnn_graph_ptr_.get();
+  }
   for (std::shared_ptr<OpWrapper>& op_wrapper : op_wrappers) {
     for (const auto& tensor_wrapper : op_wrapper->GetInputTensors()) {
       ET_CHECK_OR_RETURN_ERROR(
-          backend_params_ptr_->qnn_graph_ptr_->EnsureTensorInQnnGraph(
-              graph_name, tensor_wrapper) == Error::Ok,
+          qnn_graph_ptr->EnsureTensorInQnnGraph(graph_name, tensor_wrapper) ==
+              Error::Ok,
           Internal,
           "Tensor name %s isn't added to Qnn Graph",
           tensor_wrapper->GetName().c_str());
     }
-
     for (const auto& tensor_wrapper : op_wrapper->GetOutputTensors()) {
       ET_CHECK_OR_RETURN_ERROR(
-          backend_params_ptr_->qnn_graph_ptr_->EnsureTensorInQnnGraph(
-              graph_name, tensor_wrapper) == Error::Ok,
+          qnn_graph_ptr->EnsureTensorInQnnGraph(graph_name, tensor_wrapper) ==
+              Error::Ok,
           Internal,
           "Tensor name %s isn't added to Qnn Graph",
           tensor_wrapper->GetName().c_str());
     }
-
     for (const auto& param : op_wrapper->GetParams()) {
       auto* p_tensor_param = dynamic_cast<TensorParamWrapper*>(param.get());
       if (p_tensor_param != nullptr) {
         ET_CHECK_OR_RETURN_ERROR(
-            backend_params_ptr_->qnn_graph_ptr_->EnsureTensorInQnnGraph(
+            qnn_graph_ptr->EnsureTensorInQnnGraph(
                 graph_name, p_tensor_param->GetTensorWrapper()) == Error::Ok,
             Internal,
             "Param tensor name %s isn't added to Qnn Graph",
@@ -652,23 +728,21 @@ Error QnnManager::Compile(
           "Fail to configure Qnn backend");
     }
 
-    error = backend_params_ptr_->qnn_graph_ptr_->GraphAddNode(
-        graph_name, op_wrapper->GetOpConfig());
+    error = qnn_graph_ptr->GraphAddNode(graph_name, op_wrapper->GetOpConfig());
     if (error != QNN_SUCCESS) {
       QNN_EXECUTORCH_LOG_ERROR(
           "Failed to add node to Qnn Graph with error: %d",
           QNN_GET_ERROR_CODE(error));
       return Error::Internal;
     }
   }
-  error = backend_params_ptr_->qnn_graph_ptr_->GraphFinalize(graph_name);
+  error = qnn_graph_ptr->GraphFinalize(graph_name);
   if (error != QNN_SUCCESS) {
     QNN_EXECUTORCH_LOG_ERROR(
         "Failed to finalize Qnn Graph with error: %d",
         QNN_GET_ERROR_CODE(error));
     return Error::Internal;
   }
-
   return Error::Ok;
 }
 
 
@@ -13,6 +13,7 @@
 #include <executorch/backends/qualcomm/runtime/Logging.h>
 #include <executorch/backends/qualcomm/runtime/QnnExecuTorch.h>
 #include <executorch/backends/qualcomm/runtime/backends/QnnBackendFactory.h>
+#include <executorch/backends/qualcomm/runtime/backends/QnnDlcManager.h>
 #include <executorch/runtime/core/error.h>
 
 #include <memory>
@@ -71,7 +72,7 @@ class QnnManager {
       QnnExecuTorchContextBinary& qnn_executorch_context_binary);
 
   executorch::runtime::Error CompileQcir();
-
+  executorch::runtime::Error CompileDlc();
   executorch::runtime::Error Compile(
       const std::string& graph_name,
       std::vector<std::shared_ptr<OpWrapper>>& op_wrappers);
@@ -110,6 +111,22 @@ class QnnManager {
   std::string GetBinarySignature();
 
  private:
+  std::unique_ptr<const QnnSaver_Config_t*[]> GetImplementationConfig() {
+    if (options_->saver()) {
+      auto outputDirCfg = std::make_unique<QnnSaver_Config_t>();
+      outputDirCfg->option = QNN_SAVER_CONFIG_OPTION_OUTPUT_DIRECTORY;
+      outputDirCfg->outputDirectory = options_->saver_output_dir()->c_str();
+
+      auto saverCfg = std::make_unique<const QnnSaver_Config_t*[]>(2);
+      saverCfg[0] = outputDirCfg.release();
+      saverCfg[1] = nullptr;
+
+      return saverCfg;
+    } else {
+      return nullptr;
+    }
+  }
+
   executorch::runtime::Error LoadQnnLibrary();
 
   static constexpr const char* htp_library_name_ = "libQnnHtp.so";
@@ -147,6 +164,9 @@ class QnnManager {
           {Qnn_DataType_t::QNN_DATATYPE_UFIXED_POINT_16,
            executorch::aten::ScalarType::UInt16},
   };
+
+  // Manager for handling DLC (Deep Learning Container)
+  std::shared_ptr<QnnDlcManager> qnn_dlc_manager_;
 };
 } // namespace qnn
 } // namespace backends
Original file line number	Diff line number	Diff line change
`@@ -45,7 +45,7 @@ def define_node(`
`45`	`45`	`dequant_output_tensors = [output_tensor_wrapper]`
`46`	`46`
`47`	`47`	`dequant_op = PyQnnWrapper.PyQnnOpWrapper(`
`48`		`- node.target.__name__,`
	`48`	`+ node.name,`
`49`	`49`	`QNN_OP_PACKAGE_NAME_QTI_AISW,`
`50`	`50`	`OpDequantize.op_name,`
`51`	`51`	`)`
Original file line number	Diff line number	Diff line change
`@@ -52,7 +52,7 @@ def define_node(`
`52`	`52`	`quant_output_tensors = [output_tensor_wrapper]`
`53`	`53`
`54`	`54`	`quant_op = PyQnnWrapper.PyQnnOpWrapper(`
`55`		`- node.target.__name__,`
	`55`	`+ node.name,`
`56`	`56`	`QNN_OP_PACKAGE_NAME_QTI_AISW,`
`57`	`57`	`OpQuantize.op_name,`
`58`	`58`	`)`