- 대구광역시 2020년 상반기 사례를 중심으로
- 주제 선정 배경
- 활용 데이터
- 분석 목표
- 분석 시각화 및 설명
- 해석 및 결론
- 김진우
- 데이터 분석
- 시각화
- 데이터 전처리
- 강민경
- 데이터 분석
- 시각화
- 문서 작업
- 이윤우
- 데이터 분석
- 시각화
- 발표
- 성아연
- 통계처리
- PPT
- 데이터 분석
- 운영체제
- window 10
- 개발도구
- anconda
- 개발언어
- python
- 라이브러리
- numpy, pandas (전처리), seaborn, matplobli, folium (시각화), sklearn(모델)
- 브레인 스토밍을 통한 아이디어 구상 및 자료 서칭
- 국도교통정보 교통카드
- 시도코드, 시간, 시군구코드, 읍면동코드, 이용지역코드, 발생통행인원
- 코로나19 데이터
- 감염경로, 환자정보, 정책
- 대구광역시 지역별 건축물 데이터
- 소매점, 사무소, 종교집회장
- 인구수 데이터
- 주민등록번호, 나이대, 인구수
- 국토굥정보 교통카드 데이터는 프로그램에서 메모리 부족으로 코드를 실행하지 못하자 데이터를 읽어와서 모두 저장하는 접근 하는 것이 아니라 데이터를 한 줄씩 접근(메모리에 적재할 필요 x)
- 읽은 데이터 중에서 대구광역시 데이터만 새로운 파일에 저장
- 코로나로 인해 대중교통 이용량이 전박적으로 감소했는데, 동네 특성별, 시간대별로 이용량의 변화가 다르게 나타났을 것이다.(가설)
- 분석 방법 설정 : 동별, 시간대별 대중교통 이용변화량 확인