TwitterCrawler Introduction

数据来源于 Twitter Search ,而没有用官方twitter api,可以不受api的限制.
WARNING: please be polite and follow the crawler's politeness policy.

TwitterCrawler Installation

基于spring boot 2.0
webmagic爬虫框架
Maven 3.6
JDK 1.8
需要翻墙，可设置翻墙代理ip、端口
存储:oracle/mysql

TwitterCrawler Usage

resources/application.properties 配置数据库连接.
resources/twi.properties 配置本地代理端口，twitter用户名或关键字.
具体抓取数据，可根据url不同设置规则，可以搜索时间范围，包含与或条件等，本项目目前只做了根据用户名+时间范围获取数据.

数据示例

Lisence

Lisenced under Apache 2.0 lisence

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.settings		.settings
images		images
src		src
target		target
.classpath		.classpath
.project		.project
README.md		README.md
pom.xml		pom.xml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TwitterCrawler Introduction

TwitterCrawler Installation

TwitterCrawler Usage

Lisence

About

Releases

Packages

Languages

kailinguo/TwitterCrawler

Folders and files

Latest commit

History

Repository files navigation

TwitterCrawler Introduction

TwitterCrawler Installation

TwitterCrawler Usage

Lisence

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages