Skip to content

[Question]: No data can be retrieved from the knowledge base in mixed scenarios #5492

Open
@wzqiang1332

Description

@wzqiang1332

Describe your problem

工号	姓名	性别	卡编号	地址
TX0001	张三	男	DLRIL000001	浙江省杭州市西湖区XX街道YY小区13-1201
TX0002	李四	女	DLRIL000002	浙江省杭州市西湖区XX街道YY小区13-1202
TX0003	王五	男	DLRIL000003	浙江省杭州市西湖区XX街道YY小区13-1203
TX0004	赵六	女	DLRIL000004	浙江省杭州市西湖区XX街道YY小区13-1204

将一批这样的数据excel导入到知识库,使用TX0001,DLRIL000001这样的值无法检索出数据。
其他工号和卡编号通过知识库都无法检索出来,试过将工号和卡编号加入到关键字也无法检索到,中文比较容易检索,或者数字。模式尝试过Table或者General,或者将知识库设置为英文,也都无法检出数据。在试了好几个数据样例,发现字母+数字,或者字母加下划线组合(类似这种RISK_TK_VINTAGE_M)都无法检索到,加入关键词,降低匹配相似度也不行。

ragflow的版本是0.16.0 emeddingmodel试过BAAI/bge-large-zh-v1.5,maidalun1020/bce-embedding-base-v1,text-embedding-v2@Tongyi-Qianwen

求解这种情况的数据该怎么导入到知识库使用。

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions