Skip to content

Commit

Permalink
Browse files Browse the repository at this point in the history
  • Loading branch information
leoalenc committed Jan 10, 2023
1 parent dee7189 commit 2f2ccd9
Show file tree
Hide file tree
Showing 4 changed files with 559 additions and 306 deletions.
31 changes: 26 additions & 5 deletions data/corpus/universal-dependencies/yrl_complin-ud-test.conllu
Original file line number Diff line number Diff line change
Expand Up @@ -1062,8 +1062,8 @@
13 ukwá kwá VERB V Person=3|VerbForm=Fin 11 xcomp _ TokenRange=72:76
14 aité aité PRON EMP PronType=Emp 16 det _ TokenRange=77:81
15 kwá kwá DET DEMX Deixis=Prox|Number=Sing|PronType=Dem 16 det _ TokenRange=82:85
16 nheenga nheenga NOUN N Number=Sing 13 obl _ TokenRange=86:93
17 resewara resewara ADP ADP Rel=Cont 16 case _ SpaceAfter=No|TokenRange=94:102
16 nheenga nheenga NOUN N Number=Sing 17 nmod:poss _ TokenRange=86:93
17 resewara sesewara NOUN N Number=Sing|Rel=Cont 13 obj _ SpaceAfter=No|TokenRange=94:102
18 , , PUNCT PUNCT _ 7 punct _ TokenRange=102:103
19 [...] [...] PUNCT ELIP PunctType=Elip 7 punct _ SpaceAfter=No|TokenRange=104:109
20 . . PUNCT PUNCT _ 2 punct _ SpaceAfter=No|TokenRange=109:110
Expand Down Expand Up @@ -4009,10 +4009,10 @@
# text_por = Despede-te desta terra, porque nunca mais pisarás nela.
# text_source = Amorim, 445, adap.
1 Rembeú mbeú VERB V Number=Sing|Person=2|VerbForm=Fin 0 root _ TokenRange=0:6
2 ne ne PRON PRON2 Case=Gen|Number=Sing|Person=2|PronType=Prs 1 obl _ TokenRange=7:9
3 resewara resewara ADP ADP Rel=Cont 2 case _ TokenRange=10:18
2 ne ne PRON PRON2 Case=Gen|Number=Sing|Person=2|Poss=Yes|PronType=Prs 3 nmod:poss _ TokenRange=7:9
3 resewara sesewara NOUN N Number=Sing|Rel=Cont 1 obj _ TokenRange=10:18
4 kwá kwá DET DEMX Deixis=Prox|Number=Sing|PronType=Dem 5 det _ TokenRange=19:22
5 tetama tetama NOUN N Number=Sing|Rel=Abs 1 obl _ TokenRange=23:29
5 tetama tetama NOUN N Number=Sing|Rel=Abs 1 iobj _ TokenRange=23:29
6 supé supé ADP ADP _ 5 case _ SpaceAfter=No|TokenRange=30:34
7 , , PUNCT PUNCT _ 12 punct _ TokenRange=34:35
8 maãresé maãresé SCONJ SCONJ _ 12 mark _ TokenRange=36:43
Expand Down Expand Up @@ -6557,6 +6557,27 @@
23 waá-itá waá PRON REL Number=Plur|PronType=Rel 22 nsubj _ SpaceAfter=No|TokenRange=124:131
24 . . PUNCT PUNCT _ 1 punct _ SpaceAfter=No|TokenRange=131:132

# sent_id = Avila2021:0:0:318
# text = Kunhã-itá, te peyawáu mukũisawa, te pemuirawa se piá pe resewara, [...].
# text_eng = Women, do not run away a second time, do not make my heart bitter against you, [...].
# text_por = Mulheres, não fujam uma segunda vez, não façam meu coração amargo contra vocês, [...].
# text_source = Amorim, 25-6, adap.
1 Kunhã-itá kunhã NOUN N Number=Plur 4 vocative _ SpaceAfter=No|TokenRange=0:9
2 , , PUNCT PUNCT _ 1 punct _ TokenRange=9:10
3 te te PART NEG Mood=Imp|PartType=Neg|Polarity=Neg 4 advmod _ TokenRange=11:13
4 peyawáu yawáu VERB V Number=Plur|Person=2|VerbForm=Fin 0 root _ TokenRange=14:21
5 mukũisawa mukũisawa ADV ADVO NumType=Ord 4 advmod _ SpaceAfter=No|TokenRange=22:31
6 , , PUNCT PUNCT _ 8 punct _ TokenRange=31:32
7 te te PART NEG Mood=Imp|PartType=Neg|Polarity=Neg 8 advmod _ TokenRange=33:35
8 pemuirawa muirawa VERB V Number=Plur|Person=2|VerbForm=Fin 4 parataxis _ TokenRange=36:45
9 se se PRON PRON2 Case=Gen|Number=Sing|Person=1|Poss=Yes|PronType=Prs 10 nmod:poss _ TokenRange=46:48
10 piá piá NOUN N Number=Sing 8 obj _ TokenRange=49:52
11 pe pe PRON PRON2 Case=Gen|Number=Plur|Person=2|PronType=Prs 8 obl _ TokenRange=53:55
12 resewara resewara ADP ADP Rel=Cont 11 case _ SpaceAfter=No|TokenRange=56:64
13 , , PUNCT PUNCT _ 8 punct _ TokenRange=64:65
14 [...] [...] PUNCT ELIP PunctType=Elip 4 punct _ SpaceAfter=No|TokenRange=66:71
15 . . PUNCT PUNCT _ 4 punct _ SpaceAfter=No|TokenRange=71:72

# sent_id = NT:0:0:1
# text = Ti pe sikari kirimbawa pembaú arama peú arama yuíri ti pe yuka pe piá aintá resé.
# text_eng = And do not seek what you are to eat and what you are to drink, nor be worried.
Expand Down
77 changes: 62 additions & 15 deletions data/glossary.json
Original file line number Diff line number Diff line change
Expand Up @@ -1606,11 +1606,6 @@
"pos": "prep. / sconj. pré.",
"gloss": "até"
},
{
"lemma": "",
"pos": "prep. / sconj. pré.",
"gloss": "var. até"
},
{
"lemma": "tikanga",
"pos": "v.",
Expand Down Expand Up @@ -2344,6 +2339,31 @@
"pos": "num. ord.",
"gloss": "segundo"
},
{
"lemma": "mukũisawa",
"pos": "adv. ord.",
"gloss": "pela segunda vez"
},
{
"lemma": "maasiwera",
"pos": "s. / adj.",
"gloss": "doente"
},
{
"lemma": "masiwera",
"pos": "s. / adj.",
"gloss": "var. maasiwera"
},
{
"lemma": "maasí",
"pos": "s.",
"gloss": "doença"
},
{
"lemma": "masí",
"pos": "s.",
"gloss": "var. maasí"
},
{
"lemma": "mukuna",
"pos": "v.",
Expand Down Expand Up @@ -3028,6 +3048,11 @@
"pos": "s.",
"gloss": "pai"
},
{
"lemma": "kaú",
"pos": "v.",
"gloss": "embriagar-se"
},
{
"lemma": "payé",
"pos": "s.",
Expand Down Expand Up @@ -3352,8 +3377,8 @@
},
{
"lemma": "pitua",
"pos": "adj.",
"gloss": "fraco; covarde"
"pos": "s. / adj.",
"gloss": "var. pitúa"
},
{
"lemma": "pitúa",
Expand Down Expand Up @@ -5050,27 +5075,44 @@
]
},
{
"lemma": "",
"pos": "adv.",
"gloss": "mesmo, é que",
"var": 1
"lemma": "te",
"pos": "part. neg.",
"gloss": "não (com o imperativo negativo)"
},
{
"lemma": "",
"pos": "adv.",
"gloss": "não (com o imperativo negativo)",
"lemma": "tẽ",
"pos": "part. neg.",
"gloss": "var. te",
"var": 2
},
{
"lemma": "tẽ",
"pos": "part. foco",
"gloss": "mesmo, é que"
"gloss": "mesmo, é que",
"var": 1
},
{
"lemma": "",
"pos": "part. foco",
"gloss": "var. tẽ 1",
"var": 1
},
{
"lemma": "",
"pos": "prep. / sconj. pré.",
"gloss": "var. até",
"var": 2
},
{
"lemma": "teité",
"pos": "interj. / adj. / s.",
"gloss": "coitado"
},
{
"lemma": "muirawa",
"pos": "v.",
"gloss": "amargar"
},
{
"lemma": "tembiiwa",
"pos": "s.",
Expand Down Expand Up @@ -6545,6 +6587,11 @@
"pos": "v.",
"gloss": "amarrar-se"
},
{
"lemma": "pukwari",
"pos": "v.",
"gloss": "amarrar"
},
{
"lemma": "yupukwáu",
"pos": "v.",
Expand Down
19 changes: 14 additions & 5 deletions data/glossary.txt
Original file line number Diff line number Diff line change
Expand Up @@ -310,7 +310,6 @@ maã 3 (s.) - coisa ● maã aíwa - coisa ruim, i.e., o diabo
maã 4 (v.) - ver, olhar
maã 5 (part. cond.) - expressa o condicional
até (prep. / sconj. pré.) - até
té (prep. / sconj. pré.) - var. até
tikanga 1 (v.) - secar
tikanga 2 (adj.) - seco
waturá (s.) - tipo de cesto
Expand Down Expand Up @@ -455,6 +454,11 @@ mukũipú (num. card.) - dez
mukũipusawa (num. ord.) - décimo
mukũipuyepesawa (num. ord.) - décimo primeiro
mukũisawa (num. ord.) - segundo
mukũisawa (adv. ord.) - pela segunda vez
maasiwera (s. / adj.) - doente
masiwera (s. / adj.) - var. maasiwera
maasí (s.) - doença
masí (s.) - var. maasí
mukuna (v.) - engolir
mukwara (v.) - furar
mukwekatú (v.) - agradecer
Expand Down Expand Up @@ -654,7 +658,7 @@ pitera (s.) - meio, metade
pitérupi (posp.) - no meio de
pitimú (v.) - ajudar
pitimũ (v.) - ajudar
pitua (adj.) - fraco; covarde
pitua (s. / adj.) - var. pitúa
pitúa (s. / adj.) - fraco, frágil, covarde
pituna (s.) - noite
pitunawasú (s.) - escuridão
Expand Down Expand Up @@ -720,6 +724,7 @@ purasisawa (s.) - dança
purasí (v.) - dançar
puri (v.) - pular
puruã (adj.) - grávida

puru (adv.) - apenas, completamente
purungitá (v.) - falar
pururé (s.) - enxada
Expand Down Expand Up @@ -981,10 +986,13 @@ tatú (s.) - tatu
tawa (s.) - cidade
-tawa (suf.) - var. -sawa
tayera (rayera, tayera) (s.) - filha (de h.)
té 1 (adv.) - mesmo, é que
té 2 (adv.) - não (com o imperativo negativo)
tẽ (part. foco) - mesmo, é que
te (part. neg.) - não (com o imperativo negativo)
tẽ 2 (part. neg.) - var. te
tẽ 1 (part. foco) - mesmo, é que
té 1 (part. foco) - var. tẽ 1
té 2 (prep. / sconj. pré.) - var. até
teité (interj. / adj. / s.) - coitado
muirawa (v.) - amargar
tembiiwa (rembiiwa, sembiiwa) (s.) - margem, orla, beira
tembiwa (rembiwa, sembiwa) (s.) - var. tembiiwa
tendawa (rendawa, sendawa) (s.) - 1. comunidade; 2. sítio, fazenda; 3. lugar
Expand Down Expand Up @@ -1257,6 +1265,7 @@ yupirú (v.) - começar
yupisirú (v.) - salvar-se
-yu- (pref.) 1. (refl. / recípr.) - se; um(uns) ao(s) outro(s); 2. part. de voz passiva
yupukwari (v.) - amarrar-se
pukwari (v.) - amarrar
yupukwáu (v.) - acostumar-se
yupukwá (v.) - var. yupukwáu
yupukwawa (v.) - var. yupukwáu
Expand Down
Loading

0 comments on commit 2f2ccd9

Please sign in to comment.