- 네이버 뉴스, 네이버 스마트 스토어, 네이버 영화의 URL을 받아 해당 기사의 댓글, 쇼핑몰 후기, 영화 리뷰 정보를 분석하고 결과를 시각화하여 새로운 정보를 출력해 보여주는 웹 서비스
- 뉴스, 영화, 쇼핑몰 분석 결과는 사용자의 니즈를 고려하여 각 성향에 맞도록 분석을 진행하여 결과를 보여줌
- 실시간으로 댓글이 많은 기사 상위 5개를 출력하여 보여줌
- 정보의 신뢰성 문제: 악의적 댓글 혹은 여론 조작 등 거짓 정보를 제공하는 댓글이 늘어남에 따라, 악의적 사용자의 댓글을 사전에 예방하여 올바른 정보를 취할 필요가 있음
- 필요 정보 찾기의 어려움: 많은 양의 댓글 중 사용자가 자체적으로 선별하여 필요한 정보를 가진 갯글을 찾기가 쉽지 않음, 정보과다 사회에 있어 필요한 정보만을 추출하여 선별적으로 정보에 접근할 수 있음
- 기존 분석 시스템의 한계: 평점을 중심으로 분석하는 기존의 분석 시스템으로 평점 자체의 신뢰성 문제가 생길 수 있음
- 유효 URL 확인 기능
- 주요 뉴스 랭킹 기능
- 크롤링을 통한 데이터 추출
- 뉴스: 댓글 작성자의 성별, 나이별 분포, 작성된 댓글 내용, 작성 시간, 공감 수, 비공감 수, 대댓글 수를 가져옴
- 쇼핑몰: 사용자 총 평점, 전체 리뷰 개수, 작성된 댓글 내용, 작성 시간, 토픽(주제), 토픽(주제)에 해당하는 댓글을 가져옴
- 영화: 네티즌 평점, 성별/나이별 관람 추이와 만족도, 한줄 평, 감상 포인트, 작성된 댓글 내용, 작성 시간, 토픽(주제), 토픽(주제)에 해당하는 댓글을 가져옴
- 다양한 EDA 분석
- 크롤링한 댓글을 분석하여 논란 댓글 목록 생성, 재구매율(횟수), 각 토픽별 평점, 각 제품/옵션별 평점, 각 제품/옵션별 구매순위, 댓글 작성 시간 분포 그래프, 워드 클라우드 등의 Insight롤 얻음
- LDA 모델을 통한 토픽 모델링
- 딥러닝을 통한 감성분석
- 총 300,000개의 텍스트 데이터셋을 이용하여 긍부정 분석 진행
- 모델의 정확도는 약 0.827
- 악성 댓글 필터링 기능
- 데이터 시각화
- 댓글의 주요 토픽을 분석하여 워드 클라우드 생성
- 그래프 형태로 댓글 작성 시간 분포 보여줌