pytorch
diff --git a/‎examples/huggingface/pippy_gpt2.py
Lines changed: 8 additions & 1 deletion b/‎examples/huggingface/pippy_gpt2.py
Lines changed: 8 additions & 1 deletion
diff --git a/‎pippy/ModelSplit.py
Lines changed: 2 additions & 0 deletions b/‎pippy/ModelSplit.py
Lines changed: 2 additions & 0 deletions
diff --git a/‎pippy/_IR.py
Lines changed: 4 additions & 4 deletions b/‎pippy/_IR.py
Lines changed: 4 additions & 4 deletions
@@ -24,7 +24,7 @@ def run(args):
     config.n_embd = args.n_embd or config.n_embd
     config.n_layer = args.n_layer or config.n_layer
     config.n_head = args.n_head or config.n_head
-    print("Using device:", args.device)
+    print("[Rank {}] Using device: {}".format(args.rank, args.device))
 
     # Create model
     model_class = GPT2ForSequenceClassification
@@ -41,13 +41,19 @@ def run(args):
     example_inputs = generate_inputs_for_model(
         model_class, gpt2, model_name, args.batch_size, args.device)
 
+    assert not args.autosplit or not args.graphsplit
+
     split_policy = None
     split_spec = None
 
     if args.autosplit:
         # Automatic split
         from pippy import split_into_equal_size
         split_policy = split_into_equal_size(args.world_size)
+    elif args.graphsplit:
+        # Graph-based split
+        from pippy import split_by_graph
+        split_policy = split_by_graph(args.world_size)
     else:
         # Use manual split spec
         decoders_per_rank = (gpt2.config.n_layer + args.world_size - 1) // args.world_size
@@ -112,6 +118,7 @@ def run(args):
     parser.add_argument('--n_layer', type=int, default=None)
     parser.add_argument('--n_head', type=int, default=None)
     parser.add_argument('--autosplit', action="store_true")
+    parser.add_argument('--graphsplit', action="store_true")
 
     args = parser.parse_args()
 
 
@@ -5,6 +5,8 @@
 import torch
 import torch.fx as fx
 
+from pippy.graphsplit import split_by_graph_with_num_stages
+
 from ._IR import aten_pipe_split_alias
 
 
 
@@ -925,10 +925,10 @@ def set_multi_use_param_spec(
                 if isinstance(multi_use_param_spec, MultiUseParameterConfig):
                     multi_use_params_qualnames[param] = multi_use_param_spec
                 elif isinstance(multi_use_param_spec, dict):
-                    multi_use_params_qualnames[
-                        param
-                    ] = multi_use_param_spec.get(
-                        param, MultiUseParameterConfig.TRANSMIT
+                    multi_use_params_qualnames[param] = (
+                        multi_use_param_spec.get(
+                            param, MultiUseParameterConfig.TRANSMIT
+                        )
                     )
                 else:
                     raise ValueError(