Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Gjør analysen av de/den/det lik på tvers av skandinaviske trebanker #81

Open
6 tasks done
peresolb opened this issue Nov 21, 2023 · 1 comment
Open
6 tasks done

Comments

@peresolb
Copy link
Contributor

peresolb commented Nov 21, 2023

Dan Zeman påpekte i denne tråden at morfologien og lemma for de/den/det varierer ganske mye internt i de skandinaviske trebankene og på tvers av trebankene. For en oversikt over analysene per i dag, se her (fra Zemans opprinnelige spørsmål:
Bokmål:

ADV de de _
DET de de Number=Plur|PronType=Dem
DET den den Gender=Fem|Number=Sing|PronType=Dem
DET den den Gender=Fem|Number=Sing|PronType=Prs
DET den den Gender=Masc|Number=Sing|PronType=Dem
DET den Den Gender=Masc|Number=Sing|PronType=Dem
DET den det Gender=Masc|Number=Sing|PronType=Dem
DET det de Number=Plur|PronType=Dem
DET det det Gender=Neut|Number=Sing|PronType=Dem
DET dét det Gender=Neut|Number=Sing|PronType=Dem
PRON de de Case=Nom|Number=Plur|Person=3|PronType=Prs
PRON de De Case=Nom|Number=Plur|Person=3|PronType=Prs
PRON dem de Case=Acc|Number=Plur|Person=3|PronType=Prs
PRON den den Gender=Fem,Masc|Number=Sing|Person=3|PronType=Prs
PRON det det Gender=Neut|Number=Sing|Person=3|PronType=Prs
PRON dét det Gender=Neut|Number=Sing|Person=3|PronType=Prs

Nynorsk:

ADJ d. d. Abbr=Yes
ADV de de _
ADV det da _
DET de de PronType=Prs
DET den den Gender=Fem|PronType=Dem
DET den den Gender=Masc|PronType=Dem
DET det den Number=Plur|PronType=Dem
DET det det Gender=Neut|PronType=Dem
DET dét det Gender=Neut|PronType=Dem
DET det det Gender=Neut|PronType=Prs
PRON d. d. Abbr=Yes|PronType=Prs
PRON de de Animacy=Hum|Case=Nom|Number=Plur|Person=2|PronType=Prs
PRON den den Gender=Fem,Masc|Person=3|PronType=Prs
PRON dén den Gender=Fem,Masc|Person=3|PronType=Prs
PRON dét det Gender=Neut|Number=Sing|Person=3|PronType=Prs
PRON det det Gender=Neut|Person=3|PronType=Prs
PRON dét det Gender=Neut|Person=3|PronType=Pr

Etter å ha lest diskusjonen og deltatt i den, tror jeg det er fint om vi gjør de følgende endringene til releasen av v. 2.14 i mai 2024:

  • Alle formene (de/den/det/dét) skal ha PronType=Art dersom postag er DET
  • Alle formene skal ha lemma "den" dersom postag er DET. Det skal altså ikke være en de/den/det-kontrast i lemmaene for denne ordklassen. Merk at det også fins tilfeller med feilaktig stor bokstav i lemma.
    Korreksjon: Gjelder for Number=Sing. Det skal være en kontrast mellom de og den/det i lemmaene for denne ordklassen.
  • Formene "den", "det", "d." og "dét" som er tagga som PRON, skal ha lemma "den".
    Korreksjon: Gjelder for Number=Sing. "dem" med POS-tag "PRON" skal ha lemma "de".
  • Formen "de" og "dem" med postag `PRON" skal ha lemma "de". Det har de per i dag, men det fins tilfeller med stor bokstav i lemma, "De", som må rettes.
  • Nynorsk: "dei" skal ha lemma "dei", med POS-tag PRON.
  • Nynorsk: "det/den" får lemma "den". "dei" med POS-tag DET får lemma "dei".

Gender=Fem,mask bør også endres til Gender=Com, men det gjelder for flere ord enn disse, så jeg lager et eget issue på det.

@peresolb peresolb added this to the v. 2.14 milestone Nov 21, 2023
@Ingerid Ingerid added the v2.14 label Jan 8, 2024
@Ingerid Ingerid added the v2.15 label May 10, 2024
@Ingerid
Copy link
Contributor

Ingerid commented May 10, 2024

Alle formene skal ha lemma "den" dersom postag er DET. Det skal altså ikke være en de/den/det-kontrast i lemmaene for denne ordklassen. Merk at det også fins tilfeller med feilaktig stor bokstav i lemma.

Endring (10.05.2024):

  • Use the lemma "den" for all singular forms and the lemma "de" for all plural forms.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

When branches are created from issues, their pull requests are automatically linked.

2 participants