Skip to content

upi-0/stemmid

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Stemmid

Proyek ini adalah implementasi stemmer Bahasa Indonesia berbasis daftar kata dasar. Stemmer digunakan untuk mengubah kata berimbuhan menjadi bentuk dasarnya.

Perbedaan dengan PySastrawi:

  • Source Code 100x lebih pendek.
  • Algoritma yang digunakan berbeda.
  • Lebih cepat hingga 10%.
  • Kustomisasi kamus yang lebih uwaw.

Install

pip install git+https://github.com/Malykz/stemmid

Usage

Initial

>>> from stemmid import Stemmer
>>> Stemmer().load("menangis")
    "tangis"

Menambah kata ke Kamus

>>> Stemmer().load("belajarlah")
    "belajarlah"
>>> Stemmer(inc=["belajar"]).load("belajarlah")
    "belajar"

Mengecualikan Kata

>>> Stemmer().load("menyusui")
    "susu"
>>> Stemmer(exc=["susu"]).load("menyusui")
    "menyusui"

Menggunakan Kalimat

>>> Stemmer().loads("Kehilangan Permainan") 
    "hilang main"

Test

Test dengan 1825 kata :

  • sastrawi = 0.03424
  • stemmid = 0.02081

Test 1.825.000 kata (Cache) :

  • sastrawi = 1.20500
  • stemmid = 0.97979

About

stemming indonesian sentence.

Topics

Resources

Stars

Watchers

Forks

Languages