Skip to content

mymemory/pythainlp

 
 

Repository files navigation

PyThaiNLP

[PyPI Downloads] pypi Build Status Build statusCode IssuesCoverage Status

English

Thai natural language processing in Python.

PyThaiNLP is python module like nltk , but It's working with thai language.

It's support python 3.4 +.

Project status

Developing

Version

1.4

Capability

  • Thai segment
  • Thai wordnet
  • Thai Character Clusters (TCC) and ETCC
  • Thai stop word
  • Thai meta sound
  • Thai soundex
  • Thai postaggers
  • Thai romanization
  • Check the wrong words in Thai.

and much more.

Install

using pip.

$ pip install pythainlp

Install in Windows

download pyicu from http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyicu than install pyicu. install pythainlp using pip.

pip install pythainlp

Install in MacOS

$ brew install icu4c --force
$ brew link --force icu4c
$ CFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib pip install pythainlp

Documentation

Read on https://github.com/wannaphongcom/pythainlp/blob/pythainlp1.4/docs/pythainlp-1-4-eng.md

License

Apache Software License 2.0

ภาษาไทย

[PyPI Downloads] pypi Build Status Build statusCode IssuesCoverage Status

ประมวลภาษาธรรมชาติภาษาไทยในภาษา Python

Natural language processing หรือ การประมวลภาษาธรรมชาติ โมดูล PyThaiNLP เป็นโมดูลที่ถูกพัฒนาขึ้นเพื่อพัฒนาการประมวลภาษาธรรมชาติภาษาไทยในภาษา Python และมันฟรี (ตลอดไป) เพื่อคนไทยและชาวโลกทุกคน !

เพราะโลกขับเคลื่อนต่อไปด้วยการแบ่งปัน

รองรับ Python 3.4 ขึ้นไป

สถานะโครงการ

กำลังพัฒนา

Version

1.4

สิ่งใหม่ที่เพิ่มเข้ามาใน PyThaiNLP 1.4

  • รองรับ Thai Character Clusters (TCC) และ ETCC
  • Thai WordNet ตัวใหม่
  • เพิ่มหลักเกณฑ์การถอดอักษรไทยเป็นอักษรโรมัน ฉบับราชบัณฑิตยสถาน
  • เพิ่ม Meta Sound ภาษาไทย
  • เพิ่ม Thai Soundex

ความสามารถ

  • ตัดคำภาษาไทย
  • ถอดเสียงภาษาไทยเป็น Latin
  • Postaggers ภาษาไทย
  • อ่านตัวเลขเป็นข้อความภาษาไทย
  • เรียงจำนวนคำของประโยค
  • แก้ไขปัญหาการพิมพ์ลืมเปลี่ยนภาษา
  • เช็คคำผิดในภาษาไทย
  • รองรับ Thai Character Clusters (TCC) และ ETCC
  • Thai WordNet
  • Stop Word ภาษาไทย
  • Meta Sound ภาษาไทย
  • Thai Soundex
  • และอื่น ๆ

ติดตั้ง

รองรับ Python 3.4 ขึ้นไป

รุ่นเสถียร

$ pip install pythainlp

วิธีติดตั้งสำหรับ Windows

ให้ทำการติดตั้ง pyicu โดยใช้ไฟล์ .whl จาก http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyicu

หากใช้ python 3.5 64 bit ให้โหลด PyICU‑1.9.7‑cp35‑cp35m‑win_amd64.whl แล้วเปิด cmd ใช้คำสั่ง

pip install PyICU‑1.9.7‑cp35‑cp35m‑win_amd64.whl

แล้วจึงใช้

pip install pythainlp

ติดตั้งบน Mac

$ brew install icu4c --force
$ brew link --force icu4c
$ CFLAGS=-I/usr/local/opt/icu4c/include LDFLAGS=-L/usr/local/opt/icu4c/lib pip install pythainlp

ข้อมูลเพิ่มเติม คลิกที่นี้

เอกสารการใช้งาน

อ่านได้ที่ https://github.com/wannaphongcom/pythainlp/blob/pythainlp1.4/docs/pythainlp-1-4-thai.md

License

Apache Software License 2.0

พัฒนาโดย นาย วรรณพงษ์ ภัททิยไพบูลย์

สนับสนุน

คุณสามารถร่วมพัฒนาโครงการนี้ได้ โดยการ Fork และส่ง pull requests กลับมา

About

Thai NLP in Python Package.

Resources

License

Unknown, Apache-2.0 licenses found

Licenses found

Unknown
LICENSE
Apache-2.0
LICENSE.txt

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 94.6%
  • Shell 3.4%
  • Makefile 1.9%
  • Batchfile 0.1%