[Executorch][C++] Add low level inference API #584

ismukhin · 2025-06-01T20:33:04Z

No description provided.

ismukhin · 2025-06-01T20:37:49Z

@valentina-kustikova, сделал рефакторинг, добавил возможность вывода с помощью 2-ух API

valentina-kustikova · 2025-06-03T18:33:40Z

src/cpp_dl_benchmark/executorch_launcher/include/memory_manager.hpp

+        program = std::make_unique<Result<Program>>(Program::load(&loader->get()));
+        const char* method_name = "forward";
+        method_meta = std::make_unique<Result<MethodMeta>>(program->get().method_meta(method_name));
+        size_t num_memory_planned_buffers1 = method_meta->get().num_memory_planned_buffers();


Может, в названии переменной удалить цифру? Переменных с таким содержательный именем я не вижу больше.

valentina-kustikova · 2025-06-03T18:35:37Z

src/cpp_dl_benchmark/executorch_launcher/include/memory_manager.hpp

+    }
+
+    void set_input(const std::vector<std::vector<executorch::runtime::EValue>>& tens, const int input_idx) override {
+        Error set_input_error = method.get()->get().set_input(tens[0][input_idx], 0);


Выглядит странно, что код ошибки сохраняется в локальную переменную, но далее нигде не возвращается и соответственно не обрабатывается. Поскольку он есть, то имеет смысл возвращать и обрабатывать.

valentina-kustikova · 2025-06-03T18:36:03Z

src/cpp_dl_benchmark/executorch_launcher/include/memory_manager.hpp

+    }
+
+    void inference() override {
+        Error execute_error = method.get()->get().execute();


Аналогичное замечание касательно кода ошибки.

valentina-kustikova · 2025-06-03T18:39:24Z

src/cpp_dl_benchmark/executorch_launcher/include/memory_manager.hpp

+        method.get()->get().execute();
+        const auto result = method.get()->get().get_output(0);
+        return result.toTensor();
+    }


По смыслу этот метод получения выхода сети, тогда не понятно, почему здесь установка входов и вызов вывода. Если это больше отладочный метод, то предлагаю его удалить. Если его задача - сохранение выхода, то оставить только сохранение.

valentina-kustikova · 2025-06-03T18:42:02Z

src/cpp_dl_benchmark/executorch_launcher/include/memory_manager.hpp

+    virtual ~HighLevelInferenceAPI() {}
+
+    void read_model(const std::string& model_file) override {
+        module = std::make_unique<executorch::extension::Module>(model_file);


Общий вопрос по реализации вывода средствами разных интерфейсов и, в частности, к этой строке. Могут ли генерировать я исключения на разных этапах, и не нужно ли их обрабатывать?

valentina-kustikova · 2025-06-03T18:43:04Z

src/cpp_dl_benchmark/executorch_launcher/include/memory_manager.hpp

+    }
+
+    void set_input(const std::vector<std::vector<executorch::runtime::EValue>>& tens, const int input_idx) override {
+        module->set_input("forward", tens[0][input_idx], 0);


Здесь точно нет кода ошибки и не может генерироваться исключение?

valentina-kustikova · 2025-06-03T18:43:21Z

src/cpp_dl_benchmark/executorch_launcher/include/memory_manager.hpp

+    }
+
+    void inference() override {
+        module->forward();


Аналогичный вопрос

valentina-kustikova · 2025-06-03T18:44:09Z

src/cpp_dl_benchmark/executorch_launcher/include/memory_manager.hpp

+        module->set_input("forward", tens[0][0], 0);
+        const auto result = module->forward();
+        return result->at(0).toTensor();
+    }


Здесь тот же комментарий, что и у соответствествующего метода низкоуровневого интерфейса.

valentina-kustikova · 2025-06-03T18:44:56Z

src/cpp_dl_benchmark/executorch_launcher/src/executorch_launcher.cpp

@@ -84,8 +95,12 @@ void ExecuTorchLauncher::prepare_input_tensors(std::vector<std::vector<TensorBuf
    for (int i = 0; i < tensor_buffers[0].size(); ++i) {
        auto& buffer = tensor_buffers[0][i];
        std::vector<int> shape(buffer.shape().begin(), buffer.shape().end());
+        for(int j = 0; j < shape.size(); j++) {
+            std::cout << shape[j];
+        }


По всей видимости, это отладочный код. Его надо удалить.

valentina-kustikova · 2025-06-03T18:47:40Z

src/cpp_dl_benchmark/executorch_launcher/src/executorch_launcher.cpp

-        throw std::runtime_error("Output dumping is supported only for models with one output!");
-    }
-
+    auto result = inference_api->dump_output(tensors);


По смыслу этот метод не должен вызываться до установки входов и вывода, поэтому метод dump_output должен содержать только получение выходов

ismukhin and others added 26 commits March 11, 2025 16:56

raw executorch

9b08518

fix CMakeLists

df10049

fix workflow and another

cd56684

fix1

9adc7d8

fix1

68fe79b

fix1

a23a573

build script and other

d6af3fb

codestyle

96d30d8

copypaste fix

a5065fe

Merge branch 'master' into executorch_pipeline

2145bce

readme finally

5a4432b

readme

a9e2a0e

Fix README.md

aef785d

Fix README.md

178a955

Fix README.md

c5a44c1

Fix README.md

9732fed

fix lines

891475f

benchmark support and raw model converter

6d106d5

add dir

a69abf2

Merge branch 'master' into executorch_benchmark_support

c6cc198

converter

ba86c1a

fixes, add logger

9a413d8

logger and fixes

c5ccc6d

rm arm

381c0c4

add low level api for cpp

68efc47

Merge branch 'master' into executorch_benchmark_support

0d2ca8c

valentina-kustikova reviewed Jun 3, 2025

View reviewed changes

add python api benchmarks

d31ce6b

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[Executorch][C++] Add low level inference API #584

[Executorch][C++] Add low level inference API #584

Uh oh!

ismukhin commented Jun 1, 2025

Uh oh!

ismukhin commented Jun 1, 2025

Uh oh!

valentina-kustikova Jun 3, 2025

Uh oh!

valentina-kustikova Jun 3, 2025

Uh oh!

valentina-kustikova Jun 3, 2025

Uh oh!

valentina-kustikova Jun 3, 2025

Uh oh!

valentina-kustikova Jun 3, 2025

Uh oh!

valentina-kustikova Jun 3, 2025

Uh oh!

valentina-kustikova Jun 3, 2025

Uh oh!

valentina-kustikova Jun 3, 2025

Uh oh!

valentina-kustikova Jun 3, 2025

Uh oh!

valentina-kustikova Jun 3, 2025

Uh oh!

Uh oh!

[Executorch][C++] Add low level inference API #584

Are you sure you want to change the base?

[Executorch][C++] Add low level inference API #584

Uh oh!

Conversation

ismukhin commented Jun 1, 2025

Uh oh!

ismukhin commented Jun 1, 2025

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Uh oh!