A kamufalu egy nem létező magyar falunév generátor, melynek az alapját a Google TensorFlow LSTM[1][2] modellje adja.
- A main.ipynb-ben van a lényeg. 😉
- Mivel ez egy kísérleti projekt, az algoritmus közel sem tökéletes. További optimalizásra szorul, hiszen jelenlegi formájában ki kell halászni a jól hangzó szavakat az eredményből.
- A "faluneveklistaja.txt" a fő corpus, mely ezen a Wikipédia oldalon alapul. Viszont ez közel sem bizonyul teljesenek.
- A "hatarontuli_lista.txt" tovább bővíti ezt határontúli települések magyar neveivel. Forrása az adatbank.ro.
- A "leggyakoribb_magyar_szavak.txt" tovább magyarosítja a corpus-t, mellyel javul a modell teljesítménye. Forrása ez a Wikipédia cikk.
Használd, módosítsd, írj hozzá, törölj belőle. De nevezd meg az eredeti projektet, a @kamufalu twitter oldalát vagy ezt a GitHub oldalt, amin most vagy. Köszi! ❤️