facebook · saitcakmak · Jun 5, 2025 · Jun 5, 2025 · Jun 5, 2025
diff --git a/ax/adapter/transforms/fill_missing_parameters.py b/ax/adapter/transforms/fill_missing_parameters.py
@@ -13,6 +13,7 @@
 from ax.core.observation import Observation, ObservationFeatures
 from ax.core.search_space import SearchSpace
 from ax.core.types import TParameterization
+from ax.exceptions.core import UnsupportedError
 from ax.generators.types import TConfig
 from pyre_extensions import assert_is_instance, none_throws
 
@@ -68,3 +69,25 @@ def transform_observation_features(
             }
             obsf.parameters.update(fill_params)
         return observation_features
+
+    def transform_experiment_data(
+        self, experiment_data: ExperimentData
+    ) -> ExperimentData:
+        if self.fill_values is None:
+            return experiment_data
+        if self.fill_None is False:
+            # This shouldn't be relevant in regular usage. We add both
+            # FillMissingParameters and Cast as default transfroms in
+            # Adapter. Cast will drop parameterizations with missing / None
+            # values, so not filling None will just lead to it being dropped.
+            # The exception is added here for completeness.
+            raise UnsupportedError(
+                "Transforming `ExperimentData` is not supported for "
+                "FillMissingParameters with fill_None=False. "
+                "We cannot distinguish between parameters that are missing "
+                "and those that are None in `ExperimentData`. "
+            )
+        return ExperimentData(
+            arm_data=experiment_data.arm_data.fillna(value=self.fill_values),
+            observation_data=experiment_data.observation_data,
+        )
diff --git a/ax/adapter/transforms/logit.py b/ax/adapter/transforms/logit.py
@@ -81,3 +81,13 @@ def untransform_observation_features(
                     param: float = obsf.parameters[p_name]  # pyre-ignore [9]
                     obsf.parameters[p_name] = expit(param).item()
         return observation_features
+
+    def transform_experiment_data(
+        self, experiment_data: ExperimentData
+    ) -> ExperimentData:
+        arm_data = experiment_data.arm_data
+        for p_name in self.transform_parameters:
+            arm_data[p_name] = logit(arm_data[p_name])
+        return ExperimentData(
+            arm_data=arm_data, observation_data=experiment_data.observation_data
+        )
diff --git a/ax/adapter/transforms/one_hot.py b/ax/adapter/transforms/one_hot.py
@@ -9,6 +9,7 @@
 from typing import Optional, TYPE_CHECKING
 
 import numpy as np
+import pandas as pd
 from ax.adapter.data_utils import ExperimentData
 from ax.adapter.transforms.base import Transform
 from ax.adapter.transforms.rounding import randomized_onehot_round, strict_onehot_round
@@ -207,3 +208,35 @@ def untransform_observation_features(
                 )
                 obsf.parameters[p_name] = val
         return observation_features
+
+    def transform_experiment_data(
+        self, experiment_data: ExperimentData
+    ) -> ExperimentData:
+        arm_data = experiment_data.arm_data
+        for p_name, values in self.encoded_values.items():
+            # First, replace values with 0, 1, 2, so that column names are as expected.
+            arm_data = arm_data.replace(
+                to_replace={p_name: {v: i for i, v in enumerate(values)}}
+            ).astype({p_name: int})
+
+            if len(values) == 2:
+                # Handle the special case. Only need to rename the column.
+                arm_data = arm_data.rename(columns={p_name: p_name + OH_PARAM_INFIX})
+            else:
+                # Use get_dummies to one-hot encode the column.
+                arm_data = pd.get_dummies(
+                    arm_data,
+                    columns=[p_name],
+                    prefix=p_name + OH_PARAM_INFIX,
+                    # Could be int, but using float to match the parameter type.
+                    dtype=float,
+                )
+                # Make sure all expected columns are present, even if there is no
+                # corresponding value in the data.
+                for i in range(len(values)):
+                    if f"{p_name}{OH_PARAM_INFIX}_{i}" not in arm_data:
+                        arm_data[f"{p_name}{OH_PARAM_INFIX}_{i}"] = 0.0
+
+        return ExperimentData(
+            arm_data=arm_data, observation_data=experiment_data.observation_data
+        )
diff --git a/ax/adapter/transforms/tests/test_fill_missing_parameters.py b/ax/adapter/transforms/tests/test_fill_missing_parameters.py
@@ -8,10 +8,14 @@
 
 from copy import deepcopy
 
+from ax.adapter.base import DataLoaderConfig
+from ax.adapter.data_utils import extract_experiment_data
 from ax.adapter.transforms.fill_missing_parameters import FillMissingParameters
-
 from ax.core.observation import ObservationFeatures
+from ax.exceptions.core import UnsupportedError
 from ax.utils.common.testutils import TestCase
+from ax.utils.testing.core_stubs import get_experiment_with_observations
+from pandas.testing import assert_frame_equal
 
 
 class FillMissingParametersTransformTest(TestCase):
@@ -52,3 +56,45 @@ def test_TransformObservationFeatures(self) -> None:
         t = FillMissingParameters(config={})
         obs_ft3 = t.transform_observation_features(deepcopy(observation_features))
         self.assertEqual(obs_ft3, observation_features)
+
+    def test_transform_experiment_data(self) -> None:
+        parameterizations = [
+            {"x": 0.0},
+            {"x": 1.0, "y": 0.0},
+            {"x": None, "y": None},
+        ]
+        experiment = get_experiment_with_observations(
+            observations=[[1.0], [2.0], [3.0]],
+            parameterizations=parameterizations,
+        )
+        experiment_data = extract_experiment_data(
+            experiment=experiment, data_loader_config=DataLoaderConfig()
+        )
+        # Check that arm_data has NaNs as expected.
+        self.assertEqual(experiment_data.arm_data["x"].isna().sum(), 1)
+        self.assertEqual(experiment_data.arm_data["y"].isna().sum(), 2)
+
+        # Transform and see that NaNs are filled.
+        t = FillMissingParameters(config={"fill_values": {"x": 2.0, "y": 1.0}})
+        transformed_data = t.transform_experiment_data(
+            experiment_data=deepcopy(experiment_data)
+        )
+        self.assertEqual(transformed_data.arm_data["x"].tolist(), [0.0, 1.0, 2.0])
+        self.assertEqual(transformed_data.arm_data["y"].tolist(), [1.0, 0.0, 1.0])
+        assert_frame_equal(
+            transformed_data.observation_data, experiment_data.observation_data
+        )
+
+        # Nothing happens if no fill values are given.
+        t = FillMissingParameters(config={})
+        transformed_data = t.transform_experiment_data(
+            experiment_data=deepcopy(experiment_data)
+        )
+        self.assertEqual(transformed_data, experiment_data)
+
+        # Check for error if fill_None is False.
+        t = FillMissingParameters(
+            config={"fill_values": {"x": 2.0, "y": 1.0}, "fill_None": False}
+        )
+        with self.assertRaisesRegex(UnsupportedError, "ExperimentData"):
+            t.transform_experiment_data(experiment_data=experiment_data)
diff --git a/ax/adapter/transforms/tests/test_logit_transform.py b/ax/adapter/transforms/tests/test_logit_transform.py
@@ -8,14 +8,19 @@
 
 from copy import deepcopy
 
+from ax.adapter.base import DataLoaderConfig
+from ax.adapter.data_utils import extract_experiment_data
 from ax.adapter.transforms.logit import Logit
-
 from ax.core.observation import ObservationFeatures
 from ax.core.parameter import ChoiceParameter, ParameterType, RangeParameter
 from ax.core.search_space import SearchSpace
 from ax.exceptions.core import UnsupportedError, UserInputError
 from ax.utils.common.testutils import TestCase
-from ax.utils.testing.core_stubs import get_robust_search_space
+from ax.utils.testing.core_stubs import (
+    get_experiment_with_observations,
+    get_robust_search_space,
+)
+from pandas.testing import assert_frame_equal, assert_series_equal
 from scipy.special import expit, logit
 
 
@@ -55,9 +60,9 @@ def setUp(self) -> None:
             ]
         )
 
-    # pyre-fixme[3]: Return type must be annotated.
-    # pyre-fixme[2]: Parameter must be annotated.
-    def _create_logit_parameter(self, lower, upper, log_scale=False):
+    def _create_logit_parameter(
+        self, lower: float, upper: float, log_scale: bool = False
+    ) -> RangeParameter:
         return RangeParameter(
             "x",
             lower=lower,
@@ -142,3 +147,39 @@ def test_w_parameter_distributions(self) -> None:
         )
         with self.assertRaisesRegex(UnsupportedError, "transform is not supported"):
             t.transform_search_space(rss)
+
+    def test_transform_experiment_data(self) -> None:
+        parameterizations = [
+            {"x": 0.2, "a": 1, "b": "a"},
+            {"x": 0.5, "a": 2, "b": "b"},
+            {"x": 0.7, "a": 3, "b": "c"},
+        ]
+        experiment = get_experiment_with_observations(
+            observations=[[1.0], [2.0], [3.0]],
+            search_space=self.search_space,
+            parameterizations=parameterizations,
+        )
+        experiment_data = extract_experiment_data(
+            experiment=experiment, data_loader_config=DataLoaderConfig()
+        )
+        transformed_data = self.t.transform_experiment_data(
+            experiment_data=deepcopy(experiment_data)
+        )
+
+        # Check that `x` has been log-transformed.
+        assert_series_equal(
+            transformed_data.arm_data["x"], logit(experiment_data.arm_data["x"])
+        )
+
+        # Check that other columns remain unchanged.
+        assert_series_equal(
+            transformed_data.arm_data["a"], experiment_data.arm_data["a"]
+        )
+        assert_series_equal(
+            transformed_data.arm_data["b"], experiment_data.arm_data["b"]
+        )
+
+        # Check that observation data is unchanged.
+        assert_frame_equal(
+            transformed_data.observation_data, experiment_data.observation_data
+        )
diff --git a/ax/adapter/transforms/tests/test_one_hot_transform.py b/ax/adapter/transforms/tests/test_one_hot_transform.py
@@ -8,14 +8,22 @@
 
 from copy import deepcopy
 
-from ax.adapter.transforms.one_hot import OH_PARAM_INFIX, OneHot
+from ax.adapter.base import DataLoaderConfig
+
+from ax.adapter.data_utils import extract_experiment_data
 
+from ax.adapter.transforms.one_hot import OH_PARAM_INFIX, OneHot
 from ax.core.observation import ObservationFeatures
 from ax.core.parameter import ChoiceParameter, ParameterType, RangeParameter
 from ax.core.parameter_constraint import ParameterConstraint
 from ax.core.search_space import RobustSearchSpace, SearchSpace
 from ax.utils.common.testutils import TestCase
-from ax.utils.testing.core_stubs import get_robust_search_space
+from ax.utils.testing.core_stubs import (
+    get_experiment_with_observations,
+    get_robust_search_space,
+)
+from pandas import DataFrame
+from pandas.testing import assert_frame_equal
 
 
 class OneHotTransformTest(TestCase):
@@ -34,9 +42,7 @@ def setUp(self) -> None:
                     "b", parameter_type=ParameterType.STRING, values=["a", "b", "c"]
                 ),
                 ChoiceParameter(
-                    "c",
-                    parameter_type=ParameterType.BOOL,
-                    values=[True, False],
+                    "c", parameter_type=ParameterType.BOOL, values=[True, False]
                 ),
                 ChoiceParameter(
                     "d",
@@ -49,13 +55,9 @@ def setUp(self) -> None:
                 ParameterConstraint(constraint_dict={"x": -0.5, "a": 1}, bound=0.5)
             ],
         )
-        self.t = OneHot(
-            search_space=self.search_space,
-            observations=[],
-        )
+        self.t = OneHot(search_space=self.search_space)
         self.t2 = OneHot(
             search_space=self.search_space,
-            observations=[],
             config={"rounding": "randomized"},
         )
 
@@ -255,3 +257,55 @@ def test_heterogeneous_search_space(self) -> None:
         ]
         untf_obs = self.t.untransform_observation_features(obs_ft)
         self.assertFalse(any(obs.parameters.get("b") == "b" for obs in untf_obs))
+
+    def test_transform_experiment_data(self) -> None:
+        parameterizations = [
+            {"x": 2.2, "a": 2, "b": "b", "c": False, "d": 10.0},
+            {"x": 1.2, "a": 2, "b": "a", "c": False, "d": 100.0},
+        ]
+        experiment = get_experiment_with_observations(
+            observations=[[1.0], [2.0]],
+            search_space=self.search_space,
+            parameterizations=parameterizations,
+        )
+        experiment_data = extract_experiment_data(
+            experiment=experiment, data_loader_config=DataLoaderConfig()
+        )
+        transformed_data = self.t.transform_experiment_data(
+            experiment_data=deepcopy(experiment_data)
+        )
+
+        # Check that only "b" has been transformed and column names are as expected.
+        base_columns = ["x", "a", "c", "d", "metadata"]
+        transformed_columns = [
+            "b" + OH_PARAM_INFIX + "_0",
+            "b" + OH_PARAM_INFIX + "_1",
+            "b" + OH_PARAM_INFIX + "_2",
+        ]
+        self.assertEqual(
+            set(transformed_data.arm_data),
+            {*base_columns, *transformed_columns},
+        )
+
+        # Untransformed columns are same as before.
+        assert_frame_equal(
+            transformed_data.arm_data[base_columns],
+            experiment_data.arm_data[base_columns],
+        )
+        # Observation data is unchanged.
+        assert_frame_equal(
+            transformed_data.observation_data, experiment_data.observation_data
+        )
+
+        # Transformed columns have correct values.
+        expected_columns = DataFrame(
+            index=transformed_data.arm_data.index,
+            data=[
+                [0.0, 1.0, 0.0],
+                [1.0, 0.0, 0.0],
+            ],
+            columns=transformed_columns,
+        )
+        assert_frame_equal(
+            transformed_data.arm_data[transformed_columns], expected_columns
+        )