[Math] Replace VecCore functions with std::simd functions

guitargeek · guitargeek · commit 8c4657a6dd6a · 2025-12-19T02:00:26.000+01:00
diff --git a/hist/hist/inc/TF1.h b/hist/hist/inc/TF1.h
@@ -841,7 +841,7 @@ inline double TF1::EvalParVec(const Double_t *data, const Double_t *params)
       //    res = GetSave(x);
       return TMath::SignalingNaN();
    }
-   return vecCore::Get<ROOT::Double_v>(res, 0);
+   return res[0];
 }
 #endif
 
diff --git a/hist/hist/src/TFormula.cxx b/hist/hist/src/TFormula.cxx
@@ -3134,7 +3134,7 @@ Double_t TFormula::EvalPar(const Double_t *x,const Double_t *params) const
 
    if (fNdim == 0 || !x) {
       ROOT::Double_v ret =  DoEvalVec(nullptr, params);
-      return vecCore::Get( ret, 0 );
+      return ret[0];
    }
 
     // otherwise, regular Double_t inputs on a vectorized function
@@ -3150,15 +3150,15 @@ Double_t TFormula::EvalPar(const Double_t *x,const Double_t *params) const
          xvec[i] = x[i];
 
       ROOT::Double_v ans = DoEvalVec(xvec.data(), params);
-      return vecCore::Get(ans, 0);
+      return ans[0];
    }
    // allocating a vector is much slower (we do only for dim > 4)
    std::vector<ROOT::Double_v> xvec(fNdim);
    for (int i = 0; i < fNdim; i++)
       xvec[i] = x[i];
 
    ROOT::Double_v ans = DoEvalVec(xvec.data(), params);
-   return  vecCore::Get(ans, 0);
+   return  ans[0];
 
 #else
    // this should never happen, because fVectorized can only be set true with
@@ -3398,7 +3398,7 @@ ROOT::Double_v TFormula::EvalParVec(const ROOT::Double_v *x, const Double_t *par
 
    for (int i = 0; i < vecSize; i++)
       for (int j = 0; j < fNdim; j++)
-         xscalars[i*fNdim+j] = vecCore::Get(x[j],i);
+         xscalars[i*fNdim+j] = x[j][i];
 
    ROOT::Double_v answers(0.);
    for (int i = 0; i < vecSize; i++)
diff --git a/math/mathcore/inc/Fit/FitUtil.h b/math/mathcore/inc/Fit/FitUtil.h
@@ -251,7 +251,7 @@ namespace FitUtil {
            vecCore::Load<ROOT::Double_v>(xx[i], xBuffer);
         }
         auto res = (*f)(xx, p);
-        return vecCore::Get<ROOT::Double_v>(res, 0);
+        return res[0];
      }
 
 #if __clang_major__ > 16
@@ -442,7 +442,7 @@ namespace FitUtil {
             // avoid infinity or nan in chi2 values due to wrong function values
             auto m = vecCore::Mask_v<T>(chi2 > maxResValue);
 
-            vecCore::MaskedAssign<T>(chi2, m, maxResValue);
+            where(m, chi2) = maxResValue;
 
             return chi2;
          };
@@ -478,8 +478,7 @@ namespace FitUtil {
 
          // Last SIMD vector of elements (if padding needed)
          if (data.Size() % vecSize != 0)
-            vecCore::MaskedAssign(res, vecCore::Int2Mask<T>(data.Size() % vecSize),
-                                  res + mapFunction(data.Size() / vecSize));
+            where(vecCore::Int2Mask<T>(data.Size() % vecSize), res) = res + mapFunction(data.Size() / vecSize);
 
          return vecCore::ReduceAdd(res);
       }
@@ -661,9 +660,9 @@ namespace FitUtil {
             auto remainingPointsContribution = mapFunction(numVectors);
             // Add the contribution from the valid remaining points and store the result in the output variable
             auto remainingMask = vecCore::Int2Mask<T>(remainingPoints);
-            vecCore::MaskedAssign(logl_v, remainingMask, logl_v + remainingPointsContribution.logvalue);
-            vecCore::MaskedAssign(sumW_v, remainingMask, sumW_v + remainingPointsContribution.weight);
-            vecCore::MaskedAssign(sumW2_v, remainingMask, sumW2_v + remainingPointsContribution.weight2);
+            where(remainingMask, logl_v) = logl_v + remainingPointsContribution.logvalue;
+            where(remainingMask, sumW_v) = sumW_v + remainingPointsContribution.weight;
+            where(remainingMask, sumW2_v) = sumW2_v + remainingPointsContribution.weight2;
          }
 
 
@@ -791,7 +790,7 @@ namespace FitUtil {
 
             // EvalLog protects against 0 values of fval but don't want to add in the -log sum
             // negative values of fval
-            vecCore::MaskedAssign<T>(fval, fval < 0.0, 0.0);
+            where(fval < 0.0, fval) =  0.0;
 
             T nloglike{}; // negative loglikelihood
 
@@ -810,7 +809,7 @@ namespace FitUtil {
                if (extended) {
                   nloglike =  weight * ( fval - y);
                }
-               vecCore::MaskedAssign<T>(nloglike, y != 0, nloglike + weight * y *( ROOT::Math::Util::EvalLog(y) -  ROOT::Math::Util::EvalLog(fval)) );
+               where(y != 0, nloglike) = nloglike + weight * y *( ROOT::Math::Util::EvalLog(y) -  ROOT::Math::Util::EvalLog(fval));
 
             } else {
                // standard case no weights or iWeight=1
@@ -1054,7 +1053,7 @@ namespace FitUtil {
 
             for (const auto &mask : validPointsMasks) {
                for (unsigned int i = 0; i < vecSize; i++) {
-                  nRejected += !vecCore::Get(mask, i);
+                  nRejected += !mask[i];
                }
             }
 
@@ -1094,7 +1093,7 @@ namespace FitUtil {
       // const auto x = vecCore::FromPtr<ROOT::Double_v>(data.GetCoordComponent(i, 0));
       // auto fval = func(&x, p);
       // auto logPdf = ROOT::Math::Util::EvalLog(fval);
-      // return vecCore::Get<ROOT::Double_v>(logPdf, 0);
+      // return logPdf[0];
 
       static void
       EvalPoissonLogLGradient(const IModelFunctionTempl<T> &f, const BinData &data, const double *p, double *grad,
diff --git a/math/mathcore/src/VectorizedTMath.cxx b/math/mathcore/src/VectorizedTMath.cxx
@@ -4,6 +4,19 @@
 
 #ifdef ROOT_VECTORIZED_TMATH
 
+namespace {
+
+template <class T, class V, class M>
+T blend_simd(M const &mask, V const &src1, V const &src2)
+{
+   T v{};
+   where(mask, v) = src1;
+   where(!mask, v) = src2;
+   return v;
+}
+
+} // namespace
+
 namespace TMath {
 ////////////////////////////////////////////////////////////////////////////////
 ::ROOT::Double_v Log2(::ROOT::Double_v &x)
@@ -32,7 +45,7 @@ ::ROOT::Double_v Gaus(::ROOT::Double_v &x, Double_t mean, Double_t sigma, Bool_t
 
    // For those entries of |arg| > 39 result is zero in double precision
    ::ROOT::Double_v out =
-      vecCore::Blend<::ROOT::Double_v>(abs(arg) < ::ROOT::Double_v(39.0),
+      blend_simd<::ROOT::Double_v>(abs(arg) < ::ROOT::Double_v(39.0),
                                        exp(::ROOT::Double_v(-0.5) * arg * arg), ::ROOT::Double_v(0.0));
    if (norm)
       out *= 0.3989422804014327 * inv_sigma; // 1/sqrt(2*Pi)=0.3989422804014327
@@ -65,7 +78,7 @@ ::ROOT::Double_v LaplaceDistI(::ROOT::Double_v &x, Double_t alpha, Double_t beta
 {
    ::ROOT::Double_v alpha_v = ::ROOT::Double_v(alpha);
    ::ROOT::Double_v beta_v_inv = ::ROOT::Double_v(1.0) / ::ROOT::Double_v(beta);
-   return vecCore::Blend<::ROOT::Double_v>(
+   return blend_simd<::ROOT::Double_v>(
       x <= alpha_v, 0.5 * exp(-abs((x - alpha_v) * beta_v_inv)),
       1 - 0.5 * exp(-abs((x - alpha_v) * beta_v_inv)));
 }
@@ -98,9 +111,9 @@ ::ROOT::Double_v Freq(::ROOT::Double_v &x)
 
    ::ROOT::Double_v result{};
 
-   vecCore::Mask<::ROOT::Double_v> mask1 = v < ::ROOT::Double_v(0.5);
-   vecCore::Mask<::ROOT::Double_v> mask2 = !mask1 && v < ::ROOT::Double_v(4.0);
-   vecCore::Mask<::ROOT::Double_v> mask3 = !(mask1 || mask2);
+   auto mask1 = v < ::ROOT::Double_v(0.5);
+   auto mask2 = !mask1 && v < ::ROOT::Double_v(4.0);
+   auto mask3 = !(mask1 || mask2);
 
    ::ROOT::Double_v v2 = v * v;
    ::ROOT::Double_v v3 = v2 * v;
@@ -110,20 +123,16 @@ ::ROOT::Double_v Freq(::ROOT::Double_v &x)
    ::ROOT::Double_v v7 = v6 * v;
    ::ROOT::Double_v v8 = v7 * v;
 
-   vecCore::MaskedAssign<::ROOT::Double_v>(
-      result, mask1, v * (p10 + p11 * v2 + p12 * v4 + p13 * v6) / (q10 + q11 * v2 + q12 * v4 + v6));
-   vecCore::MaskedAssign<::ROOT::Double_v>(
-      result, mask2,
-      ::ROOT::Double_v(1.0) -
+   where(mask1, result) = v * (p10 + p11 * v2 + p12 * v4 + p13 * v6) / (q10 + q11 * v2 + q12 * v4 + v6);
+   where(mask2, result) = ::ROOT::Double_v(1.0) -
          (p20 + p21 * v + p22 * v2 + p23 * v3 + p24 * v4 + p25 * v5 + p26 * v6 + p27 * v7) /
-            (exp(v2) * (q20 + q21 * v + q22 * v2 + q23 * v3 + q24 * v4 + q25 * v5 + q26 * v6 + v7)));
-   vecCore::MaskedAssign<::ROOT::Double_v>(result, mask3,
-                                           ::ROOT::Double_v(1.0) -
+            (exp(v2) * (q20 + q21 * v + q22 * v2 + q23 * v3 + q24 * v4 + q25 * v5 + q26 * v6 + v7));
+   where(mask3, result) = ::ROOT::Double_v(1.0) -
                                               (c1 + (p30 * v8 + p31 * v6 + p32 * v4 + p33 * v2 + p34) /
                                                        ((q30 * v8 + q31 * v6 + q32 * v4 + q33 * v2 + q34) * v2)) /
-                                                 (v * exp(v2)));
+                                                 (v * exp(v2));
 
-   return vecCore::Blend<::ROOT::Double_v>(x > 0, ::ROOT::Double_v(0.5) + ::ROOT::Double_v(0.5) * result,
+   return blend_simd<::ROOT::Double_v>(x > 0, ::ROOT::Double_v(0.5) + ::ROOT::Double_v(0.5) * result,
                                            ::ROOT::Double_v(0.5) * (::ROOT::Double_v(1) - result));
 }
 
@@ -153,7 +162,7 @@ ::ROOT::Double_v BesselI0(::ROOT::Double_v &x)
 {
    ::ROOT::Double_v ax = abs(x);
 
-   return vecCore::Blend<::ROOT::Double_v>(ax <= 3.75, BesselI0_Split_Less(x), BesselI0_Split_More(ax));
+   return blend_simd<::ROOT::Double_v>(ax <= 3.75, BesselI0_Split_Less(x), BesselI0_Split_More(ax));
 }
 
 ////////////////////////////////////////////////////////////////////////////////
@@ -168,7 +177,7 @@ ::ROOT::Double_v BesselI1_Split_More(::ROOT::Double_v &ax, ::ROOT::Double_v &x)
                               y * (1.63801e-3 + y * (-1.031555e-2 +
                                                      y * (2.282967e-2 + y * (-2.895312e-2 +
                                                                              y * (1.787654e-2 + y * -4.20059e-3))))))));
-   return vecCore::Blend<::ROOT::Double_v>(x < 0, ::ROOT::Double_v(-1.0) * result, result);
+   return blend_simd<::ROOT::Double_v>(x < 0, ::ROOT::Double_v(-1.0) * result, result);
 }
 
 ::ROOT::Double_v BesselI1_Split_Less(::ROOT::Double_v &x)
@@ -183,7 +192,7 @@ ::ROOT::Double_v BesselI1(::ROOT::Double_v &x)
 {
    ::ROOT::Double_v ax = abs(x);
 
-   return vecCore::Blend<::ROOT::Double_v>(ax <= 3.75, BesselI1_Split_Less(x), BesselI1_Split_More(ax, x));
+   return blend_simd<::ROOT::Double_v>(ax <= 3.75, BesselI1_Split_Less(x), BesselI1_Split_More(ax, x));
 }
 
 ////////////////////////////////////////////////////////////////////////////////
@@ -212,7 +221,7 @@ ::ROOT::Double_v BesselJ0_Split1_Less(::ROOT::Double_v &x)
 ::ROOT::Double_v BesselJ0(::ROOT::Double_v &x)
 {
    ::ROOT::Double_v ax = abs(x);
-   return vecCore::Blend<::ROOT::Double_v>(ax < 8, BesselJ0_Split1_Less(x), BesselJ0_Split1_More(ax));
+   return blend_simd<::ROOT::Double_v>(ax < 8, BesselJ0_Split1_Less(x), BesselJ0_Split1_More(ax));
 }
 
 ////////////////////////////////////////////////////////////////////////////////
@@ -228,7 +237,7 @@ ::ROOT::Double_v BesselJ1_Split1_More(::ROOT::Double_v &ax, ::ROOT::Double_v &x)
       0.04687499995 + y * (-0.2002690873e-3 + y * (0.8449199096e-5 + y * (-0.88228987e-6 - y * 0.105787412e-6)));
    ::ROOT::Double_v result =
       sqrt(0.636619772 / ax) * (cos(xx) * result1 - z * sin(xx) * result2);
-   vecCore::MaskedAssign<::ROOT::Double_v>(result, x < 0, -result);
+   where(x < 0, result) = -result;
    return result;
 }
 
@@ -244,7 +253,7 @@ ::ROOT::Double_v BesselJ1_Split1_Less(::ROOT::Double_v &x)
 ::ROOT::Double_v BesselJ1(::ROOT::Double_v &x)
 {
    ::ROOT::Double_v ax = abs(x);
-   return vecCore::Blend<::ROOT::Double_v>(ax < 8, BesselJ1_Split1_Less(x), BesselJ1_Split1_More(ax, x));
+   return blend_simd<::ROOT::Double_v>(ax < 8, BesselJ1_Split1_Less(x), BesselJ1_Split1_More(ax, x));
 }
 
 } // namespace TMath
diff --git a/test/TFormulaVecTests.h b/test/TFormulaVecTests.h
@@ -31,7 +31,7 @@ bool testVec1D(TF1 * f1, const TString & formula, FreeFunc1D func, double x ) {
 #ifdef R__HAS_VECCORE
    ROOT::Double_v vx = x;
    ROOT::Double_v vy = f1->EvalPar(&vx, nullptr);
-   double y2 = vecCore::Get(vy,0);
+   double y2 = vy[0];
    ret &= CheckValues(formula+TString("_v"), y2, y0);
 #endif
 
@@ -67,7 +67,7 @@ bool testVec2D(TF2 * f1, const TString & formula, FreeFunc2D func, double x, dou
 #ifdef R__HAS_VECCORE
    ROOT::Double_v vx[2] = { x, y};
    ROOT::Double_v vy = f1->EvalPar(vx, nullptr);
-   double r2 = vecCore::Get(vy,0);
+   double r2 = vy[0];
    ret &= CheckValues(formula+TString("_v"), r2, r0);
 #endif
 

Original file line number	Diff line number	Diff line change
`@@ -841,7 +841,7 @@ inline double TF1::EvalParVec(const Double_t data, const Double_t params)`
`841`	`841`	`// res = GetSave(x);`
`842`	`842`	`return TMath::SignalingNaN();`
`843`	`843`	`}`
`844`		`- return vecCore::Get<ROOT::Double_v>(res, 0);`
	`844`	`+ return res[0];`
`845`	`845`	`}`
`846`	`846`	`#endif`
`847`	`847`