Java ๊ธฐ๋ฐ์ ํ๊ตญ ์ํ ๋ฐ์ค์คํผ์ค 1~10์๊น์ง์ ์ ๋ณด๋ฅผ parsing ๋ฐ crawlingํ๊ณ MongoDB์ ์ ์ฅ ํ ์ฌ์ฉ์์๊ฒ ์ ๋ณด๋ฅผ ์ถ๋ ฅํด์ฃผ๋ ์ฝ์ํ๋ก๊ทธ๋๋ฐ
- Language: โJAVA 1.8
- IDE Tool: ๐ปEclipse
- Package Manager: MavenRepository
- Using Package: [jsoup, json-simple, Mongo-java-driver]
- Version Tools: Github, Sourcetree
- Parsing URL: ํ๊ตญ ์ํ์งํฅ์์ํ
- Crawling URL:
- SimpleMovieMain: ํ๋ก๊ทธ๋จ ์์ํ๋ ๊ณณ + ์ฝ์ ํ๋ก๊ทธ๋๋ฐ view๋จ
- BoxOfficeParser: ํ๊ตญ์ํ์งํฅ์์ํ์์ ์ผ๋ณ ๋ฐ์ค์คํผ์ค ์ ๋ณด ์์ง(๋ญํฌ, ์ํ์ ๋ชฉ, ๋์ ๊ด๊ฐ์, ๋์ ๋งค์ถ์ก)
- BoxOfficeNaver: Naver์์ Boxoffice 1~10์๊น์ง ์ํ ์ ๋ณด(์ ๋ชฉ, ์์์ผ์, ๊ฐ๋ , ์ถ์ฐ์ง ๋ฑ) ๋ฐ ์ํ ์ฝ๋(๋ค์ด๋ฒ ๊ณ ์ ์ํ์ฝ๋) ์์ง
- ReplyCrawlNaver: Naver์์ ํด๋น ์ํ์ ๋๊ธ, ํ์ , ์์ฑ์, ์์ฑ์ผ์ ์์งํด์ MongoDB์ ์ ์ฅ
- BoxOfficeDaum: Daum์์ Boxoffice 1~10์๊น์ง ์ํ ์ฝ๋(๋ค์ ๊ณ ์ ์ํ์ฝ๋) ์์ง
- ReplyCrawlDaum: Daum์์ ํด๋น ์ํ์ ๋๊ธ, ํ์ , ์์ฑ์, ์์ฑ์ผ์ ์์งํด์ MongoDB์ ์ ์ฅ
- ReplyDAO: ๋ค์ด๋ฒ, ๋ค์์์ ์์งํ ์ํ ๋๊ธ ์ ์ฅ ๋๋ ์ญ์ ํ ๋ ์ฌ์ฉํ๋ DAO
- ReplyDTO: ๋ค์ด๋ฒ, ๋ค์์์ ์ํ ๋๊ธ ์์ง ํ MongoDB์ ์ ์ฅํ ๋ ์ฌ์ฉํ๋ DTO
- pom.xml: Maven์์ buildํ Library ์ค์ ํ๋ ์ฅ์
First, you should goet a key form [ํ๊ตญ์ํ์งํฅ์์ํ](https://www.kofic.or.kr/kofic/business/infm/introBoxOffice.do)
- BoxOfficeParser์์ ๋ฐ๊ธ๋ฐ์ key๋ฅผ ๊ต์ฒดํ๋ค.
- ReplyDAO์์ MongoDB๋ฅผ ์ธํ ํ๋ค(connect, DB, Collection ๋ฑ).
- ๋ฉ์ธ ํ๋ก๊ทธ๋จ์ ์คํํ๋ค.
- 1-10์ ์ค ์ํ๋ ์ํ๋ฅผ ์ ํํ๋ค โ 1-10์ ์ซ์๋ฅผ ์ ๋ ฅ
- Run the program!