-
Notifications
You must be signed in to change notification settings - Fork 0
Weekly Report #3
Kwak Jeong Won edited this page Mar 14, 2020
·
7 revisions
-
띄어쓰기로 학습을 시켰을 때, and or 등 꽤 긴 문장에 한해서도 좋은 성능을 보임.
-
변수 A 등을 한글로 바꾸어 변수에 대입
-
교수님과의 면담
- 띄어쓰기 / 형태소
- 변수 입력 문제
- nas : 뉴런 아키텍쳐 서치 => 모델의 구조 자체를 학습
-
정리(임시)
-
- "사용자가 입력할 데이터"에서 한글이 아닌 모든 것을 찾아내서 리스트로 보관 (변수 또는 숫자 찾기) ex) [i, 10, 15, 1]
-
- "사용자가 입력할 데이터"에서 리스트에 보관된 단어들을 찾아 알파벳 순서대로 바꿔준다
- ex) i -> a , 10 -> b, 15-> c , 1 -> d
-
- 바꿔준 데이터를 test data(input data)로 입력해 알맞은 output data를 찾아준다
- ex) "a가 b부터 c까지 d씩 더하면서 반복해줘" -> for 가 in range( 나 , 다 , 라 )
-
- output data에서 "가 나 다 ... " 순서대로 1번 과정에서 나온 리스트로 바꿔준다.
- ex) for 가 in range( 나 , 다 , 라 ) -> for i in range( 10 , 15 , 1 )
-
-
변수 또는 숫자를 알파벳 순서대로 바꾸는 2가지 이유
-
- 변수 또는 숫자는 순서가 있기 때문에 "사용자가 입력한 데이터"에서 쉽게 변수를 찾아 다시 대체할 수 있다.
-
- input data (training data)는 변수 또는 숫자가 모두 a b c d .. 등 알파벳 시퀀스로 되어 있기 때문에 학습효과가 높다.
- (seq2seq는 다음에 나올 가장 높은 확률을 가진 문자를 택하기 때문에)
- ex) "i를 10부터 15까지 1씩 더하면서 반복해줘" 이렇게 학습시키면 [i, 10, 15, 1]이 아무 도움이 안되며 제외한다고 해도 학습데이터는 "a b c d.." 등을 포함하기 때문에 제외한다고 해도 도움 x. 만약 학습데이터에서 a b c d .. 를 제외하더라도 변수 또는 숫자의 위치를 찾을 수 없다.
-
- 구글 음성 api에서는 단순히 "에이" 라고 하면 "a"라 인식하지 않음.
- "변수 a"라 해야 "a"로 인식 -> 변수들은 말할 때 "변수"를 붙여야 함.
- 변수를 단순히 A, B -> 가, 나로 바꾸어 인식
- "A가 B보다 작아질 때까지 반복해줘." -> while A < B: 출력 성공
- level 고민 : line by line으로 할 때, level을 어떻게 찾으면 좋을지..
- 만약 문법이 잘못된 코드의 경우 인식 또한 오류 -> 코드를 실행했을 때 오류가 나도록 함.
- jupyter notebook 내에서 코드 자동 입력 성공
- 다음까지 해야 할 것
- 예산집행서 작성
- 주간 보고서 1주차 작성