From c20fcf26ebc0eeda41b6fd4e54d87623030ead91 Mon Sep 17 00:00:00 2001
From: Vlad Burlik <vladbph@users.noreply.github.com>
Date: Fri, 2 Oct 2020 22:45:14 -0700
Subject: [PATCH] Onnx GPU runtime fails to fallback to CPU when GPU is not
 available/busy (#5304)

* ONNX GPU runtime fails to fallback to CPU when GPU is not available OR busy
https://github.com/microsoft/onnxruntime/issues/5299

* comments

* Init _fallback_providers before C.InferenceSession

* As per review: Fallback providers order supersedes user's providers order, IF they are included into providers list.

* Code convention fix

* pep8
---
 onnxruntime/python/session.py | 24 +++++++++++++++++-------
 1 file changed, 17 insertions(+), 7 deletions(-)

diff --git a/onnxruntime/python/session.py b/onnxruntime/python/session.py
index 1d63c07f58e88..8444fbd3196b5 100644
--- a/onnxruntime/python/session.py
+++ b/onnxruntime/python/session.py
@@ -192,9 +192,25 @@ def __init__(self, path_or_bytes, sess_options=None, providers=None, provider_op
         self._enable_fallback = True
         self._read_config_from_model = os.environ.get('ORT_LOAD_CONFIG_FROM_MODEL') == '1'
 
-        self._create_inference_session(providers, provider_options)
+        try:
+            self._create_inference_session(providers, provider_options)
+        except RuntimeError:
+            if self._enable_fallback:
+                print("EP Error using {}".format(self._providers))
+                print("Falling back to {} and retrying.".format(self._fallback_providers))
+                self._create_inference_session(self._fallback_providers)
+                # Fallback only once.
+                self.disable_fallback()
+            else:
+                raise
 
     def _create_inference_session(self, providers, provider_options):
+        # Tensorrt can fall back to CUDA. All others fall back to CPU.
+        if 'TensorrtExecutionProvider' in C.get_available_providers():
+            self._fallback_providers = ['CUDAExecutionProvider', 'CPUExecutionProvider']
+        else:
+            self._fallback_providers = ['CPUExecutionProvider']
+
         session_options = self._sess_options if self._sess_options else C.get_default_session_options()
         if self._model_path:
             sess = C.InferenceSession(session_options, self._model_path, True, self._read_config_from_model)
@@ -213,12 +229,6 @@ def _create_inference_session(self, providers, provider_options):
         self._providers = self._sess.get_providers()
         self._provider_options = self._sess.get_provider_options()
 
-        # Tensorrt can fall back to CUDA. All others fall back to CPU.
-        if 'TensorrtExecutionProvider' in C.get_available_providers():
-            self._fallback_providers = ['CUDAExecutionProvider', 'CPUExecutionProvider']
-        else:
-            self._fallback_providers = ['CPUExecutionProvider']
-
     def _reset_session(self, providers, provider_options):
         "release underlying session object."
         # meta data references session internal structures