一个简单的表情包向量库,基于 zhaoolee/ChineseBQB 中的表情包数据,结合阿里巴巴 NLP 的 GME-Qwen2VL 系列多模态大模型进行文本与图像向量检索。
memerag/
├── bqb/ # 表情包图片文件夹(来自 ChineseBQB)
│── bqb-preview/ # resized bqb
├── embedding_dicts/ # GME模型给出的向量 与bqb中文件一一对应
│ └── 2b_embeddings_dict.pt
│ └── 2b_fused_embeddings_dict.pt
│ └── 7b_embeddings_dict.pt
│ └── 7b_fused_embeddings_dict.pt
├── image/
├── config.yaml
├── demo_api.ipynb
├── demo_preview.ipynb # 用于演示
├── gme_inference.py
├── main.py # 启动
├── README.md
└── requirements.txt
git clone https://github.com/jiz322/memerag.git
cd memerag- 创建并激活虚拟环境(可选):
# Windows PowerShell
python -m venv venv
.\venv\Scripts\activate
# macOS/Linux
python3 -m venv venv
source venv/bin/activate- 安装依赖:
pip install -r requirements.txt- 检查config.yaml配置后,启动服务端:
python main.py