nohup scrapy crawl myspider -a term='hotel' -a location='los angeles ca' > ./logs/my.log 2>&1 &
其中term参数是搜索内容,location参数是位置;
爬取多个内容时,可修改爬虫参数,启动多个爬虫并行处理。
name, address, phone, categories
文件夹名称是location参数值,数据文件名称是term参数值 数据文件csv格式,可直接excel打开
cd <path>/yellowpage
sh -x spider_start.sh