rust 实现
目标--性能优先,批量更新的在线特征存储
参考F14VectorMap (Facebook Folly),特性:
•向量化查询:SIMD指令14路并行比较
•连续内存:数据存储在std::vector提升缓存局部性
•链内嵌优化:将链表指针嵌入值存储块
•智能驱逐策略:缓存驱逐时保留热数据
推荐系统适配性:
优点:
•查询性能王者:SIMD加速比普通哈希快3-5倍
•内存连续→缓存命中率高(推荐系统关键优势)
•天然支持高效范围遍历(适合特征批量加载)
•Facebook大规模验证(支持万亿级查询/天)
缺点:
•扩容代价大(全量rehash)
•写入性能低于libcuckoo(约20-30%差距)
•删除操作导致空洞
适用场景:
读密集型特征服务(如Embedding查找),需要低延迟响应的在线推理场景,中小规模数据