ydb-platform
diff --git a/‎ydb/library/yql/udfs/common/knn/knn-defines.h‎
Lines changed: 37 additions & 0 deletions b/‎ydb/library/yql/udfs/common/knn/knn-defines.h‎
Lines changed: 37 additions & 0 deletions
diff --git a/‎ydb/library/yql/udfs/common/knn/knn-distance.h‎
Lines changed: 234 additions & 0 deletions b/‎ydb/library/yql/udfs/common/knn/knn-distance.h‎
Lines changed: 234 additions & 0 deletions
diff --git a/‎ydb/library/yql/udfs/common/knn/knn-enumerator.h‎
Lines changed: 6 additions & 78 deletions b/‎ydb/library/yql/udfs/common/knn/knn-enumerator.h‎
Lines changed: 6 additions & 78 deletions
@@ -0,0 +1,37 @@
+#pragma once
+
+#include "util/system/types.h"
+
+enum EFormat: ui8 {
+    FloatVector = 1, // 4-byte per element
+    Uint8Vector = 2, // 1-byte per element, better than Int8 for positive-only Float
+    Int8Vector = 3,  // 1-byte per element
+    BitVector = 10,  // 1-bit  per element
+};
+
+template <typename T>
+struct TTypeToFormat;
+
+template <>
+struct TTypeToFormat<float> {
+    static constexpr auto Format = EFormat::FloatVector;
+};
+
+template <>
+struct TTypeToFormat<i8> {
+    static constexpr auto Format = EFormat::Int8Vector;
+};
+
+template <>
+struct TTypeToFormat<ui8> {
+    static constexpr auto Format = EFormat::Uint8Vector;
+};
+
+template <>
+struct TTypeToFormat<bool> {
+    static constexpr auto Format = EFormat::BitVector;
+};
+
+template <typename T>
+inline constexpr auto Format = TTypeToFormat<T>::Format;
+inline constexpr auto HeaderLen = sizeof(ui8);
@@ -0,0 +1,234 @@
+#pragma once
+
+#include "knn-defines.h"
+#include "knn-serializer.h"
+
+#include <ydb/library/yql/public/udf/udf_helpers.h>
+
+#include <library/cpp/dot_product/dot_product.h>
+#include <library/cpp/l1_distance/l1_distance.h>
+#include <library/cpp/l2_distance/l2_distance.h>
+#include <util/generic/array_ref.h>
+#include <util/generic/buffer.h>
+#include <util/stream/format.h>
+
+#include <bit>
+
+using namespace NYql;
+using namespace NYql::NUdf;
+
+inline void BitVectorHandleShort(ui64 byteLen, const ui64* v1, const ui64* v2, auto&& op) {
+    Y_ASSERT(0 < byteLen);
+    Y_ASSERT(byteLen < sizeof(ui64));
+    ui64 d1 = 0;
+    ui64 d2 = 0;
+    // TODO manual switch for [1..7]?
+    std::memcpy(&d1, v1, byteLen);
+    std::memcpy(&d2, v2, byteLen);
+    op(d1, d2);
+}
+
+inline void BitVectorHandleTail(ui64 byteLen, const ui64* v1, const ui64* v2, auto&& op) {
+    if (Y_LIKELY(byteLen == 0)) // fast-path for aligned case
+        return;
+    Y_ASSERT(byteLen < sizeof(ui64));
+    const auto unneededBytes = sizeof(ui64) - byteLen;
+    const auto* r1 = reinterpret_cast<const char*>(v1) - unneededBytes;
+    const auto* r2 = reinterpret_cast<const char*>(v2) - unneededBytes;
+    ui64 d1, d2; // unaligned loads
+    std::memcpy(&d1, r1, sizeof(ui64));
+    std::memcpy(&d2, r2, sizeof(ui64));
+    ui64 mask = 0;
+    // big    endian: 0 1 2 3 4 5 6 7 | 0 1 2 3 | 0 1 | 0 | 0 => needs to zero high bits
+    // little endian: 7 6 5 4 3 2 1 0 | 3 2 1 0 | 1 0 | 0 | 0 => needs to zero low  bits
+    if constexpr (std::endian::native == std::endian::big) {
+        mask = (ui64{1} << (byteLen * 8)) - 1;
+    } else {
+        mask = ~((ui64{1} << (unneededBytes * 8)) - 1);
+    }
+    op(d1 & mask, d2 & mask);
+}
+
+inline void BitVectorHandleOp(ui64 bitLen, const ui64* v1, const ui64* v2, auto&& op) {
+    if (Y_UNLIKELY(bitLen == 0))
+        return;
+    auto byteLen = (bitLen + 7) / 8;
+    const auto wordLen = byteLen / sizeof(ui64);
+    if (Y_LIKELY(wordLen == 0)) // fast-path for short case
+        return BitVectorHandleShort(byteLen, v1, v2, op);
+    byteLen %= sizeof(ui64);
+    for (const auto* end = v1 + wordLen; v1 != end; ++v1, ++v2) {
+        op(*v1, *v2);
+    }
+    BitVectorHandleTail(byteLen, v1, v2, op);
+}
+
+using TDistanceResult = std::optional<float>;
+
+template <typename Func>
+inline TDistanceResult VectorFuncImpl(const auto* v1, const auto* v2, auto len1, auto len2, Func&& func) {
+    if (Y_UNLIKELY(len1 != len2))
+        return {};
+    return {func(v1, v2, len1)};
+}
+
+template <typename T, typename Func>
+inline auto VectorFunc(const TStringRef& str1, const TStringRef& str2, Func&& func) {
+    const TArrayRef<const T> v1 = TKnnVectorSerializer<T>::GetArray(str1);
+    const TArrayRef<const T> v2 = TKnnVectorSerializer<T>::GetArray(str2);
+    return VectorFuncImpl(v1.data(), v2.data(), v1.size(), v2.size(), std::forward<Func>(func));
+}
+
+template <typename Func>
+inline auto BitVectorFunc(const TStringRef& str1, const TStringRef& str2, Func&& func) {
+    auto [v1, bitLen1] = TKnnSerializerFacade::GetBitArray(str1);
+    auto [v2, bitLen2] = TKnnSerializerFacade::GetBitArray(str2);
+    return VectorFuncImpl(v1, v2, bitLen1, bitLen2, std::forward<Func>(func));
+}
+
+inline TDistanceResult KnnManhattanDistance(const TStringRef& str1, const TStringRef& str2) {
+    const ui8 format1 = str1.Data()[str1.Size() - HeaderLen];
+    const ui8 format2 = str2.Data()[str2.Size() - HeaderLen];
+    if (Y_UNLIKELY(format1 != format2))
+        return {};
+
+    switch (format1) {
+        case EFormat::FloatVector:
+            return VectorFunc<float>(str1, str2, [](const float* v1, const float* v2, size_t len) {
+                return ::L1Distance(v1, v2, len);
+            });
+        case EFormat::Int8Vector:
+            return VectorFunc<i8>(str1, str2, [](const i8* v1, const i8* v2, size_t len) {
+                return ::L1Distance(v1, v2, len);
+            });
+        case EFormat::Uint8Vector:
+            return VectorFunc<ui8>(str1, str2, [](const ui8* v1, const ui8* v2, size_t len) {
+                return ::L1Distance(v1, v2, len);
+            });
+        case EFormat::BitVector:
+            return BitVectorFunc(str1, str2, [](const ui64* v1, const ui64* v2, ui64 bitLen) {
+                ui64 ret = 0;
+                BitVectorHandleOp(bitLen, v1, v2, [&](ui64 d1, ui64 d2) {
+                    ret += std::popcount(d1 ^ d2);
+                });
+                return ret;
+            });
+        default:
+            return {};
+    }
+}
+
+inline TDistanceResult KnnEuclideanDistance(const TStringRef& str1, const TStringRef& str2) {
+    const ui8 format1 = str1.Data()[str1.Size() - HeaderLen];
+    const ui8 format2 = str2.Data()[str2.Size() - HeaderLen];
+    if (Y_UNLIKELY(format1 != format2))
+        return {};
+
+    switch (format1) {
+        case EFormat::FloatVector:
+            return VectorFunc<float>(str1, str2, [](const float* v1, const float* v2, size_t len) {
+                return ::L2Distance(v1, v2, len);
+            });
+        case EFormat::Int8Vector:
+            return VectorFunc<i8>(str1, str2, [](const i8* v1, const i8* v2, size_t len) {
+                return ::L2Distance(v1, v2, len);
+            });
+        case EFormat::Uint8Vector:
+            return VectorFunc<ui8>(str1, str2, [](const ui8* v1, const ui8* v2, size_t len) {
+                return ::L2Distance(v1, v2, len);
+            });
+        case EFormat::BitVector:
+            return BitVectorFunc(str1, str2, [](const ui64* v1, const ui64* v2, ui64 bitLen) {
+                ui64 ret = 0;
+                BitVectorHandleOp(bitLen, v1, v2, [&](ui64 d1, ui64 d2) {
+                    ret += std::popcount(d1 ^ d2);
+                });
+                return NPrivate::NL2Distance::L2DistanceSqrt(ret);
+            });
+        default:
+            return {};
+    }
+}
+
+inline TDistanceResult KnnDotProduct(const TStringRef& str1, const TStringRef& str2) {
+    const ui8 format1 = str1.Data()[str1.Size() - HeaderLen];
+    const ui8 format2 = str2.Data()[str2.Size() - HeaderLen];
+    if (Y_UNLIKELY(format1 != format2))
+        return {};
+
+    switch (format1) {
+        case EFormat::FloatVector:
+            return VectorFunc<float>(str1, str2, [](const float* v1, const float* v2, size_t len) {
+                return ::DotProduct(v1, v2, len);
+            });
+        case EFormat::Int8Vector:
+            return VectorFunc<i8>(str1, str2, [](const i8* v1, const i8* v2, size_t len) {
+                return ::DotProduct(v1, v2, len);
+            });
+        case EFormat::Uint8Vector:
+            return VectorFunc<ui8>(str1, str2, [](const ui8* v1, const ui8* v2, size_t len) {
+                return ::DotProduct(v1, v2, len);
+            });
+        case EFormat::BitVector:
+            return BitVectorFunc(str1, str2, [](const ui64* v1, const ui64* v2, ui64 bitLen) {
+                ui64 ret = 0;
+                BitVectorHandleOp(bitLen, v1, v2, [&](ui64 d1, ui64 d2) {
+                    ret += std::popcount(d1 & d2);
+                });
+                return ret;
+            });
+        default:
+            return {};
+    }
+}
+
+inline TDistanceResult KnnCosineSimilarity(const TStringRef& str1, const TStringRef& str2) {
+    const ui8 format1 = str1.Data()[str1.Size() - HeaderLen];
+    const ui8 format2 = str2.Data()[str2.Size() - HeaderLen];
+    if (Y_UNLIKELY(format1 != format2))
+        return {};
+
+    auto compute = [](auto ll, float lr, auto rr) {
+        const float norm = std::sqrt(ll * rr);
+        const float cosine = norm != 0 ? lr / norm : 1;
+        return cosine;
+    };
+
+    switch (format1) {
+        case EFormat::FloatVector:
+            return VectorFunc<float>(str1, str2, [&](const float* v1, const float* v2, size_t len) {
+                const auto res = ::TriWayDotProduct(v1, v2, len);
+                return compute(res.LL, res.LR, res.RR);
+            });
+        case EFormat::Int8Vector:
+            return VectorFunc<i8>(str1, str2, [&](const i8* v1, const i8* v2, size_t len) {
+                // TODO We can optimize it if we will iterate over both vector at the same time, look to the float implementation
+                const i64 ll = ::DotProduct(v1, v1, len);
+                const i64 lr = ::DotProduct(v1, v2, len);
+                const i64 rr = ::DotProduct(v2, v2, len);
+                return compute(ll, lr, rr);
+            });
+        case EFormat::Uint8Vector:
+            return VectorFunc<ui8>(str1, str2, [&](const ui8* v1, const ui8* v2, size_t len) {
+                // TODO We can optimize it if we will iterate over both vector at the same time, look to the float implementation
+                const ui64 ll = ::DotProduct(v1, v1, len);
+                const ui64 lr = ::DotProduct(v1, v2, len);
+                const ui64 rr = ::DotProduct(v2, v2, len);
+                return compute(ll, lr, rr);
+            });
+        case EFormat::BitVector:
+            return BitVectorFunc(str1, str2, [&](const ui64* v1, const ui64* v2, ui64 bitLen) {
+                ui64 ll = 0;
+                ui64 rr = 0;
+                ui64 lr = 0;
+                BitVectorHandleOp(bitLen, v1, v2, [&](ui64 d1, ui64 d2) {
+                    ll += std::popcount(d1);
+                    rr += std::popcount(d2);
+                    lr += std::popcount(d1 & d2);
+                });
+                return compute(ll, lr, rr);
+            });
+        default:
+            return {};
+    }
+}
@@ -2,95 +2,23 @@
 
 #include <ydb/library/yql/public/udf/udf_helpers.h>
 
-#include <util/generic/buffer.h>
-#include <util/stream/format.h>
+#include <util/generic/array_ref.h>
 
 using namespace NYql;
 using namespace NYql::NUdf;
 
-template <typename TCallback>
+template <typename T, typename TCallback>
 void EnumerateVector(const TUnboxedValuePod vector, TCallback&& callback) {
-    const auto elements = vector.GetElements();
+    const auto* elements = vector.GetElements();
     if (elements) {
-        const auto size = vector.GetListLength();
-        
-        for (ui32 i = 0; i < size; ++i) {
-            callback(elements[i].Get<float>());
+        for (auto& value : TArrayRef{elements, vector.GetListLength()}) {
+            callback(value.Get<T>());
         }
     } else {
         TUnboxedValue value;
         const auto it = vector.GetListIterator();
         while (it.Next(value)) {
-            callback(value.Get<float>());
+            callback(value.Get<T>());
         }
     }
 }
-
-template <typename TCallback>
-bool EnumerateVectors(const TUnboxedValuePod vector1, const TUnboxedValuePod vector2, TCallback&& callback) {
-    
-    auto enumerateBothSized = [&callback] (const TUnboxedValuePod vector1, const TUnboxedValue* elements1, const TUnboxedValuePod vector2, const TUnboxedValue* elements2) {
-        const auto size1 = vector1.GetListLength();
-        const auto size2 = vector2.GetListLength();
-        
-        // Length mismatch
-        if (size1 != size2)
-            return false;
-
-        for (ui32 i = 0; i < size1; ++i) {
-            callback(elements1[i].Get<float>(), elements2[i].Get<float>());
-        }
-        
-        return true;
-    };
-    
-    auto enumerateOneSized = [&callback] (const TUnboxedValuePod vector1, const TUnboxedValue* elements1, const TUnboxedValuePod vector2) {
-        const auto size = vector1.GetListLength();
-        ui32 idx = 0;
-        TUnboxedValue value;
-        const auto it = vector2.GetListIterator();          
-
-        while (it.Next(value)) {
-            callback(elements1[idx++].Get<float>(), value.Get<float>());
-        }
-
-        // Length mismatch
-        if (it.Next(value) || idx != size)
-            return false;
-
-        return true;
-    };
-
-    auto enumerateNoSized = [&callback] (const TUnboxedValuePod vector1, const TUnboxedValuePod vector2) {
-        TUnboxedValue value1, value2;
-        const auto it1 = vector1.GetListIterator();
-        const auto it2 = vector2.GetListIterator();    
-        for (; it1.Next(value1) && it2.Next(value2);) {
-            callback(value1.Get<float>(), value2.Get<float>());
-        }
-
-        // Length mismatch
-        if (it1.Next(value1) || it2.Next(value2))
-            return false;
-
-        return true;
-    };
-
-    const auto elements1 = vector1.GetElements();
-    const auto elements2 = vector2.GetElements();
-    if (elements1 && elements2) {
-        if (!enumerateBothSized(vector1, elements1, vector2, elements2))
-            return false;
-    } else if (elements1) {
-        if (!enumerateOneSized(vector1, elements1, vector2))
-            return false;
-    } else if (elements2) {
-        if (!enumerateOneSized(vector2, elements2, vector1))
-            return false;
-    } else {
-        if (!enumerateNoSized(vector1, vector2))
-            return false;
-    }
-
-    return true;
-}