Skip to content

请问有办法爬取2级评论吗? #302

Closed
@wyycommu

Description

@wyycommu

首先感谢作者的付出。

实际使用了comment功能,发现无法爬取二级评论。

我只懂一些粗浅的原理,如果二级评论比较少的话,data['comment']会直接显示。如下图:
image

但是如果二级评论比较多的话,它会一折叠起来,我就拿它没办法了。如下图:

image

此外,向您提一个bug:部分官方账号是不显示ip地址的,所以item['ip_location'] = data['source']这里如果没有获得信息的话,这条评论就会被跳过。这可能是部分评论抓取不到的原因。
关键字段加一个try-except或者if "" in data·,或许可以改善。

附上述问题相关的主要代码:

    def parse_comment(data):
        """
        解析comment
        """
        item = dict()
        item['created_at'] = parse_time(data['created_at'])
        item['_id'] = data['id']
        item['like_counts'] = data['like_counts']
        item['ip_location'] = data['source']
        item['content'] = data['text_raw']
        item['comment_user'] = parse_user_info(data['user'])
        return item

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions