요구사항:
미디엄에서 업데이트 되는 링크의 HTML을 수집하는 방법을 연구하고 설계 합니다.
미디엄의 모든 글을 대상으로 HTML을 수집할 수는 없기때문에 미디엄의 모니터링 대상이되는 (예를들면, 유투브의 채널) 것이 어떤것이 있는지를 먼저 파악해야 합니다.
- HTML 수집기에서는 새로운 글이 올라오면 이를 인지해야합니다.
- 새로 올라온 글에서 oz 태그 등을 추출할 수 있는 HTML을 얻습니다.(oz 태그가 없을수도 있음)
- HTML을 미디엄 파서에 넘깁니다.