-
Notifications
You must be signed in to change notification settings - Fork 0
Weekly Report #5
Kwak Jeong Won edited this page Mar 25, 2020
·
3 revisions
-
오늘 한 것
- 데이터 파일 정리(csv 파일 한번에 처리)
- 기타 자연어처리 -> jupyter환경에서 돌아가는 거 확인
- 데이터 만든 거 확인
- 잘못 작성했을 때, 수정할 수 있도록 변경
-
다음까지 해야 할 것
- 교수님께 마이크 빌리기(당일)
- 필요한 부분 서로 구현하기(int형으로 바꾸는 거 등)
-
변수 처리 방법 고안 및 논의
- 음성을 텍스트로 변환했을 때 생기는 문제점
- => 영어로 된 변수도 한글 텍스트로 변환됨.
- 변수인지 아닌지 판단하는 방법
- 기존) 파이썬의 특성상 한글 변수가 받아지지 않으므로 input문장에 영어를 변수로 인식. 동일한 개념으로 output문장의 한글을 변수로 인식하여 서로 변수를 저장하였다가 transpose하는 방식
- 변경) 형태소 분석기를 사용하여 "변수" 뒤에 오는 명사를 선택적으로 저장.
konlpy의 Twitter(), Hannanum() 사용
그 후, 변수 transpose - 문제점)
- ex. 변수 var1을 변수 var2 + 3 * 변수 var3로 초기화해줘.
- 저장되야하는 변수 리스트 : [var1, var2+3*var3]
- 변수를 var1, var2, 3, var3 각각 저장할 경우, 학습 데이터에 해당하는 데이터가 있어야하는 단점 발생
- ex. 문자열 참빛설계는 재밌다를 출력해줘. 조사를 이용하여 끊기 => "참빛설계" ? "참빛설계는 재밌다" ?
- 문자열 A를 출력해줘. 에서 A가 어느 부분까지인지 불분명함.
-
다음까지 해야 할 것
- 변수 처리 다양한 방법 시도
- 데이터 생성