-
Notifications
You must be signed in to change notification settings - Fork 1.3k
[vector]support lumina #7330
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
base: master
Are you sure you want to change the base?
[vector]support lumina #7330
Changes from all commits
3cb15a2
0a20c81
0f64b8c
a59205f
faffb66
8b96857
3eb43a8
30d58b4
562bb39
2b9e099
98e72f5
483f278
9d846c1
b69417c
643cd13
1a5cd6f
973254f
186ed45
962ec98
8b62ef1
d6b1fd1
b57993e
888fba2
80fec05
39e16c1
c3417b3
a19e97e
38281d2
c4f0142
f722cf1
aae2cdb
cd4193c
b3c3aea
File filter
Filter by extension
Conversations
Jump to
Diff view
Diff view
There are no files selected for viewing
| Original file line number | Diff line number | Diff line change |
|---|---|---|
| @@ -0,0 +1,35 @@ | ||
| ## Paimon Lumina | ||
|
|
||
| This module integrates [Lumina](https://github.com/alibaba/paimon-cpp/tree/main/third_party/lumina) | ||
| as a vector index for Apache Paimon's global index framework. | ||
|
|
||
| Lumina vector search library is derived from an internal repository maintained by | ||
| Alibaba Storage Service Team. It is accessed via JNI through the `lumina-jni` artifact. | ||
|
|
||
| ### Supported Index Types | ||
|
|
||
| | Index Type | Description | | ||
| |------------|-------------| | ||
| | **DISKANN** | DiskANN graph-based index (default) | | ||
|
|
||
jerry-024 marked this conversation as resolved.
Show resolved
Hide resolved
|
||
| ### Supported Vector Metrics | ||
|
|
||
| | Metric | Description | | ||
| |--------|-------------| | ||
| | **L2** | Euclidean distance (default) | | ||
| | **COSINE** | Cosine distance | | ||
| | **INNER_PRODUCT** | Dot product | | ||
|
|
||
| ### Configuration Options | ||
|
|
||
| | Option | Type | Default | Description | | ||
| |--------|------|---------|-------------| | ||
| | `vector.dim` | int | 128 | Vector dimension | | ||
| | `vector.metric` | enum | L2 | Distance metric | | ||
| | `vector.index-type` | enum | DISKANN | Index type | | ||
| | `vector.encoding-type` | string | rawf32 | Encoding type (rawf32, sq8, pq) | | ||
| | `vector.size-per-index` | int | 2,000,000 | Max vectors per index file | | ||
| | `vector.training-size` | int | 500,000 | Vectors used for pretraining | | ||
| | `vector.search-factor` | int | 10 | Multiplier for search limit when filtering | | ||
| | `vector.diskann.search-list-size` | int | 100 | DiskANN search list size | | ||
| | `vector.pretrain-sample-ratio` | double | 1.0 | Pretrain sample ratio | | ||
| Original file line number | Diff line number | Diff line change | ||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| @@ -0,0 +1,101 @@ | ||||||||||||||||||||||||||||||||||||||||||
| <?xml version="1.0" encoding="UTF-8"?> | ||||||||||||||||||||||||||||||||||||||||||
| <!-- | ||||||||||||||||||||||||||||||||||||||||||
| Licensed to the Apache Software Foundation (ASF) under one | ||||||||||||||||||||||||||||||||||||||||||
| or more contributor license agreements. See the NOTICE file | ||||||||||||||||||||||||||||||||||||||||||
| distributed with this work for additional information | ||||||||||||||||||||||||||||||||||||||||||
| regarding copyright ownership. The ASF licenses this file | ||||||||||||||||||||||||||||||||||||||||||
| to you under the Apache License, Version 2.0 (the | ||||||||||||||||||||||||||||||||||||||||||
| "License"); you may not use this file except in compliance | ||||||||||||||||||||||||||||||||||||||||||
| with the License. You may obtain a copy of the License at | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| http://www.apache.org/licenses/LICENSE-2.0 | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| Unless required by applicable law or agreed to in writing, | ||||||||||||||||||||||||||||||||||||||||||
| software distributed under the License is distributed on an | ||||||||||||||||||||||||||||||||||||||||||
| "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY | ||||||||||||||||||||||||||||||||||||||||||
| KIND, either express or implied. See the License for the | ||||||||||||||||||||||||||||||||||||||||||
| specific language governing permissions and limitations | ||||||||||||||||||||||||||||||||||||||||||
| under the License. | ||||||||||||||||||||||||||||||||||||||||||
| --> | ||||||||||||||||||||||||||||||||||||||||||
| <project xmlns="http://maven.apache.org/POM/4.0.0" | ||||||||||||||||||||||||||||||||||||||||||
| xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" | ||||||||||||||||||||||||||||||||||||||||||
| xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> | ||||||||||||||||||||||||||||||||||||||||||
| <modelVersion>4.0.0</modelVersion> | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| <parent> | ||||||||||||||||||||||||||||||||||||||||||
| <artifactId>paimon-parent</artifactId> | ||||||||||||||||||||||||||||||||||||||||||
| <groupId>org.apache.paimon</groupId> | ||||||||||||||||||||||||||||||||||||||||||
| <version>1.4-SNAPSHOT</version> | ||||||||||||||||||||||||||||||||||||||||||
| </parent> | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| <artifactId>paimon-lumina</artifactId> | ||||||||||||||||||||||||||||||||||||||||||
|
Contributor
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Just one paimon-lumina is OK, no need to have index and e2e.
Contributor
There was a problem hiding this comment. Choose a reason for hiding this commentThe reason will be displayed to describe this comment to others. Learn more. Please create a README.md to this, explain what is lumina. |
||||||||||||||||||||||||||||||||||||||||||
| <name>Paimon : Lumina Index</name> | ||||||||||||||||||||||||||||||||||||||||||
|
|
||||||||||||||||||||||||||||||||||||||||||
| <repositories> | ||||||||||||||||||||||||||||||||||||||||||
| <repository> | ||||||||||||||||||||||||||||||||||||||||||
| <id>lumina</id> | ||||||||||||||||||||||||||||||||||||||||||
| <url>https://lumina-binary.oss-cn-shanghai.aliyuncs.com/mvn-repo/</url> | ||||||||||||||||||||||||||||||||||||||||||
| </repository> | ||||||||||||||||||||||||||||||||||||||||||
| </repositories> | ||||||||||||||||||||||||||||||||||||||||||
|
Comment on lines
+34
to
+39
|
||||||||||||||||||||||||||||||||||||||||||
| <repositories> | |
| <repository> | |
| <id>lumina</id> | |
| <url>https://lumina-binary.oss-cn-shanghai.aliyuncs.com/mvn-repo/</url> | |
| </repository> | |
| </repositories> | |
| <profiles> | |
| <profile> | |
| <id>lumina-repo</id> | |
| <activation> | |
| <activeByDefault>false</activeByDefault> | |
| </activation> | |
| <repositories> | |
| <repository> | |
| <id>lumina</id> | |
| <url>https://lumina-binary.oss-cn-shanghai.aliyuncs.com/mvn-repo/</url> | |
| </repository> | |
| </repositories> | |
| </profile> | |
| </profiles> |
Uh oh!
There was an error while loading. Please reload this page.