Skip to content

分布式爬取中,worker的主备mq同步问题 #60

Open
@tottilin

Description

@tottilin

分布式爬取中,worker的主备mq同步问题,目前缺少主备同步机制,也就是说在主正常运行过程中,备一直接收url或者bundle放在mq中,一旦主worker挂了,备又会把主之前跑过的url或者bundle执行一遍。这样会比较耗时,可以做一个定时同步机制,这样备中的数据不会有很多冗余

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions