Proyek ini adalah implementasi stemmer Bahasa Indonesia berbasis daftar kata dasar. Stemmer digunakan untuk mengubah kata berimbuhan menjadi bentuk dasarnya.
Perbedaan dengan PySastrawi:
- Source Code 100x lebih pendek.
- Algoritma yang digunakan berbeda.
- Lebih cepat hingga 10%.
- Kustomisasi kamus yang lebih uwaw.
pip install git+https://github.com/Malykz/stemmid>>> from stemmid import Stemmer
>>> Stemmer().load("menangis")
"tangis">>> Stemmer().load("belajarlah")
"belajarlah"
>>> Stemmer(inc=["belajar"]).load("belajarlah")
"belajar">>> Stemmer().load("menyusui")
"susu"
>>> Stemmer(exc=["susu"]).load("menyusui")
"menyusui">>> Stemmer().loads("Kehilangan Permainan")
"hilang main"Test dengan 1825 kata :
- sastrawi = 0.03424
- stemmid = 0.02081
Test 1.825.000 kata (Cache) :
- sastrawi = 1.20500
- stemmid = 0.97979