Skip to content

Weekly Report #5

Kwak Jeong Won edited this page Mar 25, 2020 · 3 revisions

3월 4째 주

3월 24일 (화)

  • 오늘 한 것

    • 데이터 파일 정리(csv 파일 한번에 처리)
    • 기타 자연어처리 -> jupyter환경에서 돌아가는 거 확인
    • 데이터 만든 거 확인
    • 잘못 작성했을 때, 수정할 수 있도록 변경
  • 다음까지 해야 할 것

    • 교수님께 마이크 빌리기(당일)
    • 필요한 부분 서로 구현하기(int형으로 바꾸는 거 등)

3월 25일 (수)

  • 변수 처리 방법 고안 및 논의

    • 음성을 텍스트로 변환했을 때 생기는 문제점
    • => 영어로 된 변수도 한글 텍스트로 변환됨.
    • 변수인지 아닌지 판단하는 방법
    • 기존) 파이썬의 특성상 한글 변수가 받아지지 않으므로 input문장에 영어를 변수로 인식. 동일한 개념으로 output문장의 한글을 변수로 인식하여 서로 변수를 저장하였다가 transpose하는 방식
    • 변경) 형태소 분석기를 사용하여 "변수" 뒤에 오는 명사를 선택적으로 저장. konlpy의 Twitter(), Hannanum() 사용
      그 후, 변수 transpose
    • 문제점)
    • ex. 변수 var1을 변수 var2 + 3 * 변수 var3로 초기화해줘.
    • 저장되야하는 변수 리스트 : [var1, var2+3*var3]
    • 변수를 var1, var2, 3, var3 각각 저장할 경우, 학습 데이터에 해당하는 데이터가 있어야하는 단점 발생
    • ex. 문자열 참빛설계는 재밌다를 출력해줘. 조사를 이용하여 끊기 => "참빛설계" ? "참빛설계는 재밌다" ?
    • 문자열 A를 출력해줘. 에서 A가 어느 부분까지인지 불분명함.
  • 다음까지 해야 할 것

    • 변수 처리 다양한 방법 시도
    • 데이터 생성
Clone this wiki locally