Skip to content

Latest commit

 

History

History
 
 

extractor

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

这里是一些小爬虫集合


每个平台对应一个文件,每个文件里面有一个get(url: str)函数 统一形式如下(里面使用f-string需要python3.6+):

"""
Args:
    url: str
Returns:
    data: dict
      |_ {
            title: str,
            author: str,
            audioName: str,
            videoName: str,
            imgs: List[str],
            audios: List[str],
            videos: List[str],
            text: str,
            msg: str
         }
Tips:
    data里面的各个字段只有当爬取到相关内容时才会存在,除了msg(不过这个没啥大用)
    ☆爬取未成功也会返回data,而且不一定为空
"""

默认输入的链接都正确:grin:


平台 资源内容 完成状态
bilibili(哔哩哔哩) 封面、视频
changya(唱鸭) 音频
douyin(抖音) 无水印视频
kugou(酷狗) 音频
kuwo(酷我) 音频
lizhiFM(荔枝FM) 音频
music163(网易云音乐) 音频
qqmusic(QQ音乐) 音频
pipigaoxiao(皮皮搞笑) 无水印视频
quanminkge(全民K歌) 音频或视频
weibo(微博) 视频
weishi(微视) 无水印视频
zhihu(知乎) 视频
zuiyou(最右) 音频(语音帖评论)
qianqian(千千音乐) 音频
5sing(5sing) 音频
pipix(皮皮虾) 无水印视频
qingshipin(轻视频) 无水印视频
qutoutiao(趣头条) 视频 💨
ku6(酷6网) 视频
lofter(乐乎) 视频
open163(网易公开课) 免费视频
xinpianchang(新片场) 视频
baidutieba(百度贴吧) 视频
kuaishou(快手) 无水印视频、长图视频
acfun(AcFun弹幕网) 视频
haokan(百度好看视频) 视频
pearvideo(梨视频) 视频
xiaokaxiu(小咖秀) 无水印视频
sohuTV(搜狐视频) 视频
ted(TED) 视频
tudou(土豆视频) 视频