Skip to content

sakuramochi0/prettyrhythm-prismstone-scrapy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

22 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

prettyrhythm-prismstone-scrapy

プリズムストーンリスト (http://www.prettyrhythm.jp/list/index.php) のストーンの情報を、インターネットアーカイブからスクレイピングするコード。プリズムストーンリストのページが壊れてしまっているので(2018/01/09現在)、正しく検索できるページを作るための準備として作りました。

2020年12月13日に確認したら、ウェブサイトのプリズムストーンリストのページが消されてしまっているみたいでした。画像のURLにもアクセスできなくなってしまったので、Google Cloud StorageのURLを使用したリストを作成しました。

プリズムストーンリスト

コードのライセンス

ただし、プリズムストーンのデータ *.json*.md を除く。

使い方

*.json の作り方

  1. Python3 をインストールする。
  2. $ pip install -r requirements.txt
  3. $ scrapy runspider main.py -o prismstone.json
  4. $ scrapy runspider brand.py -o brand.json

*.json*.md に変換する方法

  1. Node.js をインストールする。
  2. $ npm install
  3. $ npm run convert

バグ

  • 同じアイテムを重複して取得してしまう問題があります。リポジトリにあるデータは、重複を手動で取り除いたものになっています。

About

💛 プリズムストーン検索アプリ、作ってみた!

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published