Skip to content

召回率比较低的问题 #2

@qxzhou1010

Description

@qxzhou1010

你好,我用自己的数据跑了一下你的代码,目前测出来的召回率比较低,想跟你请教一下这个问题,是由于我使用的问题还是?我是这样做的,先有一个训练数据集和一个测试数据集,二者的lable就是index,是一一对应的,比如train[i] 和 test[i] 就是同一个label的不同数据,然后先用tarin来建立索引(add),建立好了后,用test[i]去做query,返回topk个结果,结果返回是[j ,distance],然后就比较j 和 i是否相等,如果相等则acc+1,最后acc/test_num。但这样测出来的准确率很低,同样的思路我用https://github.com/nmslib/hnswlib这个库测过,准确率是可以很高的。我急需一份hnsw的python实现代码,然后拿过来进行一些改进,所以想跟您交流一下

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions