Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

اصلاح برچسب‌های اجزای سخن #2

Open
nournia opened this issue Feb 24, 2014 · 2 comments
Open

اصلاح برچسب‌های اجزای سخن #2

nournia opened this issue Feb 24, 2014 · 2 comments

Comments

@nournia
Copy link
Member

nournia commented Feb 24, 2014

برچسب‌های پیکره بیجن‌خان متفاوت هست با برچسب‌های دادگان و ما می‌خوایم یک سری برچسب داشته باشیم. من فکر می‌کنم این مجموعه برچسب عمومی که در زبان‌های مختلف تست شده، گزینه مناسبی هست:

NOUN
VERB
ADJ
ADV
PRON
DET
ADP
NUM
CONJ
PRT
.
X

همه برچسب‌های پیکره بیجن‌خان:

ADJ
ADJ_CMPR
ADJ_INO
ADJ_ORD
ADJ_SIM
ADJ_SUP
ADV
ADV_EXM
ADV_I
ADV_NEGG
ADV_NI
ADV_TIME
AR
CON
DEFAULT
DELM
DET
IF
INT
MORP
MQUA
MS
N_PL
N_SING
NN
NP
OH
OHH
P
PP
PRO
PS
QUA
SPEC
V_AUX
V_IMP
V_PA
V_PRE
V_PRS
V_SUB

برچسب‌های درشت پیکره دادگان:

ADJ
ADR
ADV
CONJ
IDEN
N
PART
POSNUM
POSTP
PR
PREM
PRENUM
PREP
PSUS
PUNC
V
SUBR
@nournia
Copy link
Member Author

nournia commented Feb 24, 2014

لطفا نگاه کنید @mrs818

@fatemehniknezhad
Copy link

از کجا متوجه بشیم که هر برچسب نشان دهنده چه نقشی است؟
من از postagger استفاده کردم و لیست برچسب ها حدود 23 تا بود توی دیتاست من، اما بعضی هاش نمیدونم به معنای چه نقشی هستند. از کجا لیست نقش هارو پیدا کنم؟
'n', 'ne', 'p', 'v', 'conj', 'punc', 'aj', 'pro', 'aje', 'det', 'pe', 'num', 'adv', 'postp', 'dete', 'nume', 'res', 'cl', 'adve', 'rese', 'proe', 'conje', 'int'

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants