-
Notifications
You must be signed in to change notification settings - Fork 7
/
kostem.py
96 lines (81 loc) · 9.47 KB
/
kostem.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
from utils import joinseq
"""Korean Stems.
These are similar but not same as definition of stem(어간) in Korean grammar.
In example, we use '나ㅃ' instead of '나쁘-' for '나쁘다'.
"""
## A: Adjective (removed final consonant which will be dropped during conjugatation)
# can be conjugated to # VS AS ASL ASN AVC AVM AVN BH
KS_Aa = '나ㅃ|바ㅃ' # +ㅏ지다 +ㅡ+다 +ㅡ+ㄹ +ㅡ+ㄴ +ㅏ서 +ㅡ+게 +ㅡ+지
KS_Ab = '가까|귀여|더|무서|쉬|즐거|차가|추|해로' # +워지다 +ㅂ+다 +울 +운 +워서 +ㅂ+게 +ㅂ+지
KS_Ac = '많|맑|않|작|좁' # +아지다 +다 +을 +은 +아서 +게 +지
KS_Ad = '다' # sweet # +ㄹ+아지다 +ㄹ+다 +ㄹ +ㄴ +ㄹ+아서 +ㄹ+게 +ㄹ+지
KS_Ae = '예ㅃ|ㅋ' # +ㅓ지다 +ㅡ+다 +ㅡ+ㄹ +ㅡ+ㄴ +ㅓ서 +ㅡ+게 +ㅡ+지
KS_Af = '다' # different # +ㄹ+라지다 +르+다 +를 +른 +ㄹ+라서 +르+게 +르+지
# +해지다 +하다 +할 +한 +해서 +하게 +하지
KS_Ag = '건장|날씬|능숙|바람직|비슷|스마트|심각|적[정합]|착|불길|미약|병약|심약|참신|상이|익숙|진부'
# +해지다 +하다 +할 +한 +해서 +하게 +하지 +히
KS_Ah = '간[결단명략]|간단|건강|긴요|깔끔|딱딱|똑똑|멍청|명확|못마땅|부지런|상세|씩씩|원만|장렬|적[당절]|졸렬|지저분|침착|화려'
KS_Ai = '붉' # +어지다 +다 +을 +은 +어서 +게 +지
KS_Aj = '괜찮|낮|높|좋|짧' # +아지다 +다 +을 +은 +아서 +게 +지
KS_Ak = '같|높' # +아지다 +다 +을 +은 +아서 +게 +지 +이
KS_Al = '섣부' # x +르다 +를 +른 +ㄹ+러서 +르게 +르지 +ㄹ+리
KS_Am = '맛있' # +어지다 +다 +을 +는 +어서 +게 +지
KS_An = '낯서|머|힘드' # +ㄹ+어지다 +ㄹ+다 +ㄹ +ㄴ +ㄹ+어서 +ㄹ+게 +ㄹ+지
KS_Ao = '넓' # +어지다 +다 +을 +은 +어서 +게 +지
KS_Ap = '희' # +어지다 +다 +ㄹ +ㄴ +어서 +게 +지
KS_Ar = '이로|평화로' # +와지다 +ㅂ+다 +울 +운 +와서 +ㅂ+게 +ㅂ+지
KS_As = '나' # +아지다 +ㅅ+다 +을 +은 +아서 +ㅅ+게 +ㅅ+지
KS_Aw = '고' # +와지다 +ㅂ+다 +울 +운 +와서 +ㅂ+게 +ㅂ+지
KS_Ay = '못ㄷ' # +ㅚ+어+지다 +ㅚ+다, +ㅚ+ㄹ +ㅚ+ㄴ +ㅚ+어ㅙ+서 +ㅚ+게 +ㅚ+지 ('ㅚ+어' can be shortend to 'ㅙ')
KS_Az = '간소|첨예' # +해지다 +하다 +할 +한 +해서 +하게 +하지 +히 +화
# '쓰다(bitter)' is not included because it is ambiguous with '쓰다(write)'
## stems of verb
### stems of '~거리다'
KS_VGa = "매끈|시들|질척" # -거리다(verb), -히, -대다, -하다(adjective)
KS_VGb = "거들먹" # -거리다, -이다, -대다
### Both(intransives can conjugate to transive)
# # intransive(자동) transive(타동)
# # no-tense present past no-tense past intension
KS_VCc = "낮|늦|맞|곧" # 맞+다 맞+는+다 맞+았+다 맞+추+다 맞+추+었+다 맞+출
KS_VCe = "보" # 보+다 보+ㄴ+다 보+았+다 보+이+다 보+였+다 보+일
KS_VCf = "감|맡" # 맡+다 맡+는+다 맡+았+다 맡+기+다 맡+겼+다 맡+길
KS_VCg = "벗|숨|신|씻|웃" # 숨+다 숨+는+다 숨+었+다 숨+기+다 숨+겼+다 숨+길
KS_VCh = "익|읽|입|앉|눕|맞" # 읽+다 읽+는+다 읽+었+다 읽+히+다 읽+혔+다 읽+힐
KS_VCi = "끓|먹|붙|죽" # 먹+다 먹+는+다 먹+었+다 먹+이+다 먹+였+다 먹+일
KS_VCj = "속" # 속+다 속+는+다 속+았+다 속+이+다 속+였+다 속+일
KS_VCk = "돋|일|달|돗" # 돗+다 돗+는+다 돗+았+다 돗+구+다 돗+구+었+다 돗+굴
KS_VCl = "노|도|사|아" # 사+ㄹ+다 사+ㄴ+다 사+ㄹ+았+다 사+ㄹ+리+다 사+ㄹ+렸+다 사+ㄹ+릴
KS_VCm = "우" # 우+ㄹ+다 우+ㄴ+다 우+ㄹ+었+다 우+ㄹ+리+다 우+ㄹ+렸+다 우+ㄹ+릴
KS_VCr = "주" # 주+ㄹ+다 주+ㄴ+다 주+ㄹ+었+다 주+ㄹ+이+다 주+ㄹ+였+다 주+ㄹ+일
KS_VCu = "깨|세|씌|재|태" # 깨+다 깨+ㄴ+다 깨+ㅆ+다 깨+우+다 깨+웠+다 깨+울
### Intransive
# # no-tense present past
KS_VId = "거" # '걷' # 거+ㄷ+다 거+ㄷ+는+다 거+ㄹ+었+다
KS_VIa = "가" # 가+다 가+ㄴ+다 가+ㅆ+다
KS_VIe = "야무|여무" # 여무+ㄹ+다 여무+ㄴ+다 여무+ㄹ+었+다
KS_VIy = "숨죽ㅇ|생ㄱ|쓰러ㅈ|해ㅈ" # 생ㄱ+ㅣ+다 생ㄱ+ㅣ+ㄴ+다 생ㄱ+ㅕ+ㅆ+다
KS_VIl = "조" # 조+ㄹ+다 조+ㄴ+다 조+ㄹ+았+다
KS_VIn = '잘나' # 잘나+다 잘나+ㅆ다 잘나+ㅆ었다
### Transive(타동사)
# # active passive(피동)
# # no-tense present past no-tense present past
KS_VTg = "박|붙잡|잡" # +다 +는+다 +았+다 +히+다 +힌+다 +혔+다
KS_VTh = "먹|읽|찍" # +다 +는+다 +었+다 +ㅎ+ㅣ+다 +ㅎ+ㅣ+ㄴ+다 +ㅎ+ㅕ+ㅆ+다
KS_VTi = "보|쪼" # +다 +ㄴ+다 +았+다 +ㅇ+ㅣ+다 +ㅇ+ㅣ+ㄴ+다 +ㅇ+ㅕ+ㅆ+다
KS_VTl = "가" # grind # +ㄹ+다 +ㄴ+다 +ㄹ+았+다 +ㄹ+ㄹ+ㅣ+다 +ㄹ+ㄹ+ㅣ+ㄴ+다 +ㄹ+ㄹ+ㅕ+ㅆ+다
KS_VTm = "거|드|미" # +ㄹ+다 +ㄴ+다 +ㄹ+었+다 +ㄹ+ㄹ+ㅣ+다 +ㄹ+ㄹ+ㅣ+ㄴ+다 +ㄹ+ㄹ+ㅕ+ㅆ+다
KS_VTn = "빠" # wash # +ㄹ+다 +ㄴ+다 +ㄹ+았+다 +ㄹ+ㄹ+ㅣ+다 +ㄹ+ㄹ+ㅣ+ㄴ+다 +ㄹ+ㄹ+ㅕ+ㅆ+다
KS_VTy = "나ㄴ" # +ㅜ+다 +ㅜ+ㄴ+다 +ㅝ+ㅆ+다 +ㅟ+다 +ㅟ+ㄴ+다 +ㅟ+었+다
### Active
# # no-tense present past past(short) noun
KS_VAd = "넣" # 넣+다 넣+는다 넣+었다 x 넣+음
KS_VAh = "가까이|뒷받침" # 가까이+하+다 가까이+한+다 가까이+했+다 x 가까이+함
KS_VAi = "내ㅊ|당ㄱ|[되]?[돌살]ㄹ|망ㅊ|숨ㄱ|외ㅊ|[드]높|되뇌|죽|[보]살ㅍ" # 외ㅊ+ㅣ다 외ㅊ+ㅣ+ㄴ+다 외ㅊ+ㅕ+ㅆ+다 x 외ㅊ+ㅣ+ㅁ
KS_VAj = '만드' # 만드+ㄹ+다 만드+ㄴ+다 만드+ㄹ+었다 x 만+듦
KS_VAk = '모' # 모+르+다 모+른+다 모+ㄹ+랐다 x 모+름
KS_VAl = "[되][돌살]|[쳐]올|[내때]" # 돌+리다 돌+린다 돌+렸다 x 돌+림
KS_VAm = "빼|재" # 넣+다 넣+는다 넣+었다 x 빼+ㅁ
KS_VAn = "만나" # 만나+다 만나+ㄴ+다 만나+ㅆ+다 x 만나+ㅁ
KS_VAr = "내미|마|[받쳐]?드|허무" # 내미+ㄹ+다 내미+ㄴ+다 내미+ㄹ+었다 x 내미+ㄻ
KS_VAu = "ㅊ|낮ㅊ|늦ㅊ" # 늦ㅊ+ㅜ+다 늦ㅊ+ㅜ+ㄴ+다 늦ㅊ+ㅜ+었+다 늦ㅊ+ㅝ+ㅆ+다 늦ㅊ+ㅜ+ㅁ
KS_VAw = "[치채키]" # 치+우다 치+운다 치+웠다 x 치+움