Skip to content

jirateep-dev/pythainlp

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

PyThaiNLP Logo

PyThaiNLP

Codacy Badgepypi Build Status Build status Coverage Status

Thai natural language processing in Python.

PyThaiNLP is a python module similar to nltk , but it's working primarily on Thai language instead of English.

It supports both Python 3.4+

Capability

  • Thai word segmentation
  • Thai wordnet
  • Thai Character Clusters (TCC) and ETCC
  • Thai stop word
  • Thai meta sound
  • Thai soundex
  • Thai postaggers
  • Thai romanization
  • Thai misspellings detection and correction

and much more.

Install

using pip.

$ pip install pythainlp

Documentation

Read on https://github.com/PyThaiNLP/pythainlp/tree/dev/docs

License

Apache Software License 2.0

ภาษาไทย

ประมวลภาษาธรรมชาติภาษาไทยในภาษา Python

Natural language processing หรือ การประมวลผลภาษาธรรมชาติ โมดูล PyThaiNLP เป็นโมดูลที่ถูกพัฒนาขึ้นเพื่อพัฒนาการประมวลผลภาษาธรรมชาติภาษาไทยในภาษา Python และมันฟรี (ตลอดไป) เพื่อคนไทยและชาวโลกทุกคน !

เพราะโลกขับเคลื่อนต่อไปด้วยการแบ่งปัน

รองรับ Python 3.4 ขึ้นไป

ความสามารถ

  • ตัดคำภาษาไทย
  • ถอดเสียงภาษาไทยเป็น Latin
  • Postaggers ภาษาไทย
  • อ่านตัวเลขเป็นข้อความภาษาไทย
  • เรียงจำนวนคำของประโยค
  • แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา
  • เช็คคำผิดในภาษาไทย
  • รองรับ Thai Character Clusters (TCC) และ ETCC
  • Thai WordNet
  • Stop Word ภาษาไทย
  • Meta Sound ภาษาไทย
  • Thai Soundex
  • และอื่น ๆ

ติดตั้ง

รองรับ Python 3.4 ขึ้นไป

รุ่นเสถียร

$ pip install pythainlp

รุ่นกำลังพัฒนา

$ pip install https://github.com/PyThaiNLP/pythainlp/archive/dev.zip

เอกสารการใช้งาน

อ่านได้ที่ https://github.com/PyThaiNLP/pythainlp/tree/dev/docs

License

Apache Software License 2.0

พัฒนาโดย PyThaiNLP

Logo

ออกแบบโดยคุณ วรุตม์ พสุธาดล จากการประกวดที่ https://www.facebook.com/groups/408004796247683/permalink/475864542795041/ และ https://www.facebook.com/groups/408004796247683/permalink/474262752955220/

สนับสนุน

คุณสามารถร่วมพัฒนาโครงการนี้ได้ โดยการ Fork และส่ง pull requests กลับมา

About

Thai natural language processing in Python.

Resources

License

Apache-2.0, Apache-2.0 licenses found

Licenses found

Apache-2.0
LICENSE
Apache-2.0
LICENSE.txt

Contributing

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 95.3%
  • Shell 3.5%
  • Makefile 1.2%