Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

implementar função para gerar traços com prefixo "ModernForm" #378

Closed
2 tasks done
leoalenc opened this issue Apr 7, 2024 · 2 comments
Closed
2 tasks done

implementar função para gerar traços com prefixo "ModernForm" #378

leoalenc opened this issue Apr 7, 2024 · 2 comments
Assignees
Labels
enhancement New feature or request tools This issue relates to Python code UD Annotation This issue relates to Universal Dependencies annotation

Comments

@leoalenc
Copy link
Contributor

leoalenc commented Apr 7, 2024

  • implementar função para gerar pares de atributos e valores do campo MISC com prefixo ModernForm
  • construir função que possa ser executada a partir de etiqueta precedida por =, por exemplo, ne/=mf:l|indé, onde l indica o lema no padrão atual.

https://universaldependencies.org/misc.html#modernform

Avila (2021):

ne (pron. 2ª cl.) 1) (pron. pess. de 2ª p. do sing.): a) (pron. suj.:) tu [utiliza-se como se fosse um pref. núm.-pess. dos verbos da 2ª classe]: Ne isí será? (Magalhães, 30, adap.) - Tens sede?; Ne resarái wã se rera! - Já esqueceste o meu nome!; Te kurí ne riái retana reyasuka riré! - Não vai te suar demais depois de tomar banho!; b) [hist.] (pron. obj.) te, ti [precede a forma verbal, que neste caso ocorre sem a flexão núm.-pess.] (Hartt, 320, 340, 370; Magalhães, 130; Rodrigues, 109, 139, 258, 292, 314, 315, 319): Mamé asika, indé kurí resika, panhẽ kurí ne sendú. (Rodrigues, 109, adap.) - Aonde eu chegar, tu chegarás, todos te ouvirão.; Ixé ti ne rasú-kwáu. (Hartt, 320, adap.) - Eu não posso te levar.; Murukututú, ne manha ne renúi. (Rodrigues, 292, adap.) - Murucututu, tua mãe te chama. {v. tb.: indé 1b}; c) (pron. regido por todas as posposições ― com exceção de arama e supé) ti: Ti asikié ne suí. - Não tenho medo de ti; Ti ayumusarái ne irumu. (Hartt, 371, adap.) - Não estou brincando contigo.; Mairamé reputari ayuri ne piri? (Hartt, 337, adap.) - Quando queres que eu venha ter contigo? 2) (poss. de 2ª p. do sing.) teu (s, a, as) [sempre acompanha o substantivo que determina, como um pronome adjetivo]: Mamé taá ne kupixawa, se aría? (Rodrigues, 79. adap.) - Onde é a tua roça, minha avó?; Remaité será apekatú uikú? Remaité será, se ruái, uka upé ne rimirikú uikú? (Rodrigues, 74, adap.). - Pensas que está longe? Pensas, meu cunhado, que tua esposa está em casa?; Remumbawa ana será ne purakisawa? (Hartt, 319, adap.) - Já acabaste teu serviço? [...]

Exemplo do corpus:

# sent_id = Avila2021:0:0:512
# text = Mamé asika, indé kurí resika, panhẽ kurí ne sendú.
# text_eng = Where I arrive, you will arrive, everyone will hear you.
# text_por = Onde eu chegar, tu chegarás, todos te ouvirão. [Corr. transl.]
# text_por_orig = Aonde eu chegar, tu chegarás, todos te ouvirão.
# text_source = Rodrigues, 109, adap.
# text_prim = Mamé cha u cyca indé curi re cyca, u ponhê curi ne cenu.
# text_por_prim = Onde eu chegar tu chegarás, todos te ouvirão.
# text_annotator = LFdeA

1	Mamé	mamé	ADV	ADVLC	AdvType=Loc|PronType=Rel	6	advmod	_	TokenRange=0:4
2	asika	sika	VERB	V	Number=Sing|Person=1|VerbForm=Fin	1	advcl:relcl	_	SpaceAfter=No|TokenRange=5:10
3	,	,	PUNCT	PUNCT	_	1	punct	_	TokenRange=10:11
4	indé	indé	PRON	PRON	Number=Sing|Person=2|PronType=Prs	6	nsubj	_	TokenRange=12:16
5	kurí	kurí	PART	FUT	Tense=Fut	6	advmod	_	TokenRange=17:21
6	resika	sika	VERB	V	Number=Sing|Person=2|VerbForm=Fin	0	root	_	SpaceAfter=No|TokenRange=22:28
7	,	,	PUNCT	PUNCT	_	11	punct	_	TokenRange=28:29
8	panhẽ	panhẽ	PRON	TOT	PronType=Tot	11	nsubj	_	TokenRange=30:35
9	kurí	kurí	PART	FUT	Tense=Fut	11	advmod	_	TokenRange=36:40
10	ne	ne	PRON	PRON2	Case=Gen|Number=Sing|Person=2|PronType=Prs|Style=Arch	11	obj	_	ModernCase=Acc,Nom|ModernForm=indé|ModernLemma=indé|TokenRange=41:43
11	sendú	sendú	VERB	V	Style=Arch|VerbForm=Inf	6	parataxis	_	ModernForm=usendú|ModernPerson=3|ModernVerbForm=Fin|SpaceAfter=No|TokenRange=44:49
12	.	.	PUNCT	PUNCT	_	6	punct	_	SpaceAfter=No|TokenRange=49:50
@leoalenc leoalenc added enhancement New feature or request tools This issue relates to Python code UD Annotation This issue relates to Universal Dependencies annotation labels Apr 7, 2024
@leoalenc leoalenc self-assigned this Apr 7, 2024
leoalenc added a commit that referenced this issue Apr 23, 2024
@leoalenc
Copy link
Contributor Author

leoalenc commented Jun 3, 2024

Relaciona-se com #407 e #404 . Este commit implementou função para análise de algumas formas históricas.

leoalenc added a commit that referenced this issue Jun 4, 2024
@leoalenc
Copy link
Contributor Author

Repete em parte #436. Resolvida com 5dd4dde.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request tools This issue relates to Python code UD Annotation This issue relates to Universal Dependencies annotation
Projects
None yet
Development

No branches or pull requests

1 participant