Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Nynorsk ud #73

Merged
merged 34 commits into from
May 8, 2023
Merged

Nynorsk ud #73

merged 34 commits into from
May 8, 2023

Conversation

Ingerid
Copy link
Contributor

@Ingerid Ingerid commented May 4, 2023

Denne PR-en introduserer endringer i grew-reglene slik at den nynorske delen av NDT konverteres uten valideringsfeil.

  • nynorsk rettskriving av ulike lemma i convert_morph.py, slik at "verte" og "vere" blir AUX og ikke VERB. Kvantorer slik som "eit", "ein","einkvan", "nokon", "samtlege" er lagt til slik at disse får POS-tag DET og ikke NUM.
  • grs-filene er kopiert og navngitt med språkkode, slik at vi har ulike regelfiler for nynorsk (v2.13, disse endringene kommer ikke med før i november 2023) og bokmål (v2.12, som allerede er i data freeze). I release av v2.13 vil det være naturlig å flette sammen disse filene igjen, og heller skille mellom skrivestandardene på regel- eller strategi-nivå innad i filene.
  • En del nye setningsspesifikke regler som fikser bl.a ikke-projektiv tegnsetting, partisipp-feature på adjektiv i passivkonstruksjon, POS-tag og lemma for feilannoteringer m.m.
  • Nynorsk rettskriving av lemma i node-søk i reverse_heads.grs: "viss", "ikkje", "vilje", "vere"
  • Spesifikke regler + sekvensstrategi for flere koordinerende "/"-symboler og substantiver.
  • NYTT: Markere passive subjekter og hjelpeverb med :pass. OBS! Dette håndteres ikke i bokmål v2.12. Anbefaler derfor at reglene i rules/rename_deprel_nn.grs (passive_lex_aux_bli, passive_subject_verbform, passive_subject_periphrastic ) også brukes på bokmål for v2.13.
  • NYTT: Markere possessive pronomen med :poss. Dette har jeg registrert som gyldig relasjon for norsk, og er strengt tatt valgfritt. Kan enkelt fjernes igjen fra nynorsk, evt. legges til for bokmål, slik at de benytter de samme relasjonene for tilsvarende strukturer i v2.13.
  • NYTT: FLAT blir flat:foreign for upos=X. Dette bør også inn i bokmål.
  • NYTT: Håndteringen av PAR: parataxis der "referanse-frasen" (med hode "si", "mene", "tenke", "tro") forekommer i parentes, mellom komma midt i setningen, eller mellom hodet til "PAR"-relasjonen og en annen dependent. Bokmål fikk muligens i overkant mange ccomp-relasjoner som følge av endringen i UDs retningslinjer.

Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
…ordinating conjunction role

Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
…with subordinating conjunction role"

This reverts commit 47e7bbd.
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
@Ingerid Ingerid changed the base branch from main to nynorsk May 5, 2023 06:25
@Ingerid Ingerid changed the base branch from nynorsk to main May 5, 2023 06:25
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
Signed-off-by: Ingerid Dale <ingerid.dale@nb.no>
@Ingerid Ingerid requested a review from peresolb May 5, 2023 15:35
@Ingerid Ingerid self-assigned this May 5, 2023
Copy link
Contributor

@peresolb peresolb left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Ser bra ut, tusen takk! De endringene i bokmål som du nevner at bør gjøres i PR-teksten, kan du lage issues på dem? Da kan vi ta dem når det passer i løpet av året

@Ingerid Ingerid linked an issue May 8, 2023 that may be closed by this pull request
@Ingerid Ingerid merged commit 558b254 into main May 8, 2023
@Ingerid Ingerid deleted the nynorsk_ud branch May 8, 2023 09:42
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

Gentitiv med relasjon detskal være nmod:poss
2 participants