Skip to content

Weekly Report #3

Kwak Jeong Won edited this page Mar 14, 2020 · 7 revisions

3월 2째 주

3월 11일 (수)

  • 띄어쓰기로 학습을 시켰을 때, and or 등 꽤 긴 문장에 한해서도 좋은 성능을 보임.

  • 변수 A 등을 한글로 바꾸어 변수에 대입

  • 교수님과의 면담

    • 띄어쓰기 / 형태소
    • 변수 입력 문제
    • nas : 뉴런 아키텍쳐 서치 => 모델의 구조 자체를 학습
  • 정리(임시)

      1. "사용자가 입력할 데이터"에서 한글이 아닌 모든 것을 찾아내서 리스트로 보관 (변수 또는 숫자 찾기) ex) [i, 10, 15, 1]
      1. "사용자가 입력할 데이터"에서 리스트에 보관된 단어들을 찾아 알파벳 순서대로 바꿔준다
    • ex) i -> a , 10 -> b, 15-> c , 1 -> d
      1. 바꿔준 데이터를 test data(input data)로 입력해 알맞은 output data를 찾아준다
    • ex) "a가 b부터 c까지 d씩 더하면서 반복해줘" -> for 가 in range( 나 , 다 , 라 )
      1. output data에서 "가 나 다 ... " 순서대로 1번 과정에서 나온 리스트로 바꿔준다.
    • ex) for 가 in range( 나 , 다 , 라 ) -> for i in range( 10 , 15 , 1 )
  • 변수 또는 숫자를 알파벳 순서대로 바꾸는 2가지 이유

      1. 변수 또는 숫자는 순서가 있기 때문에 "사용자가 입력한 데이터"에서 쉽게 변수를 찾아 다시 대체할 수 있다.
      1. input data (training data)는 변수 또는 숫자가 모두 a b c d .. 등 알파벳 시퀀스로 되어 있기 때문에 학습효과가 높다.
    • (seq2seq는 다음에 나올 가장 높은 확률을 가진 문자를 택하기 때문에)
    • ex) "i를 10부터 15까지 1씩 더하면서 반복해줘" 이렇게 학습시키면 [i, 10, 15, 1]이 아무 도움이 안되며 제외한다고 해도 학습데이터는 "a b c d.." 등을 포함하기 때문에 제외한다고 해도 도움 x. 만약 학습데이터에서 a b c d .. 를 제외하더라도 변수 또는 숫자의 위치를 찾을 수 없다.

3월 13일 (금)

  • 구글 음성 api에서는 단순히 "에이" 라고 하면 "a"라 인식하지 않음.
  • "변수 a"라 해야 "a"로 인식 -> 변수들은 말할 때 "변수"를 붙여야 함.
  • 변수를 단순히 A, B -> 가, 나로 바꾸어 인식
  • "A가 B보다 작아질 때까지 반복해줘." -> while A < B: 출력 성공
  • level 고민 : line by line으로 할 때, level을 어떻게 찾으면 좋을지..
  • 만약 문법이 잘못된 코드의 경우 인식 또한 오류 -> 코드를 실행했을 때 오류가 나도록 함.
  • jupyter notebook 내에서 코드 자동 입력 성공

  • 다음까지 해야 할 것
    • 예산집행서 작성
    • 주간 보고서 1주차 작성
Clone this wiki locally