Skip to content

或许可以用微博的搜索功能实现比较精确的按时间段爬取,以及类型和关键词筛选 #648

Closed
@InMirrors

Description

@InMirrors
  • 问:请说明需要什么新功能。

答:配置帮助中说“当end_date值不是"now"时,在爬微博数非常多的账号时,程序可能不稳定”。我看到登录账号后,打开微博用户的主页会出现高级搜索的功能,里面有时间段的设置,确认后会打开只含对应时间段的微博的页面,地址中包含时间戳。高级搜索中还有类型筛选和关键词筛选,也是会在地址中包含相关信息。不知道项目是怎么爬取指定范围的,如果目前没有利用微博的这个功能的话,以后或许可以利用它实现更好的爬取。

  • 问:请说明添加该功能的意义。(非必填)

答:

Metadata

Metadata

Assignees

No one assigned

    Labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions