Closed
Description
首先感谢作者的付出。
实际使用了comment功能,发现无法爬取二级评论。
我只懂一些粗浅的原理,如果二级评论比较少的话,data['comment']
会直接显示。如下图:
但是如果二级评论比较多的话,它会一折叠起来,我就拿它没办法了。如下图:
此外,向您提一个bug:部分官方账号是不显示ip地址的,所以item['ip_location'] = data['source']
这里如果没有获得信息的话,这条评论就会被跳过。这可能是部分评论抓取不到的原因。
关键字段加一个try-except
或者if "" in data·
,或许可以改善。
附上述问题相关的主要代码:
def parse_comment(data):
"""
解析comment
"""
item = dict()
item['created_at'] = parse_time(data['created_at'])
item['_id'] = data['id']
item['like_counts'] = data['like_counts']
item['ip_location'] = data['source']
item['content'] = data['text_raw']
item['comment_user'] = parse_user_info(data['user'])
return item
Metadata
Metadata
Assignees
Labels
No labels