Starting date: 2019/05/19
Themes: opendata, machine learning, NLP
-
Siam-IPA: ซึ่ง คือ Homebrew tap ที่รวม libraries และ MacOS applications สำหรับคนไทย ตอนนี้ มี 2 Formulas คือ
- Thai-Eng Dict
- 13 ฟอนต์แห่งชาติจาก SIPA
โดยสิ่งที่อยากทำเพิ่มคือ เพิ่ม Fomula ของ Thai fonts จาก f0nt.com
-
Databuri: ตัวโปรเจ็คนี้จะเป็น Python Package ที่รวม datasets ที่เกี่ยวข้องกับประเทศไทย ไว้ในที่เดียวกัน และเป็น Proxy สำหรับ APIs ต่างๆ ที่ทางภาครัฐมี
-
Hanuman: อีกโปรเจ็คที่อยากทำคือ Python Package ที่ใช้สำหรับ run command ตาม template เช่น เรามี parameters คือ
algorithm={ fast_alg, slow_alg }
กับdataset={ big, small}
แล้วอยากรันคำสั่งtrain.py -a <ALG> -d <DATASET>
ของ ทุก algorithm x datasetซึ่งเบื้องต้นคิดว่า ตัว command template, parameters จะอยู่ใน config file แล้วเรียนผ่าน
hanuman --config something.yml
-
Contributions to PyThaiNLP and other ML projects.
- Current WIP: PyThaiNLP/pythainlp-webdemo#3
- Dataset เกี่ยวกับ ดูดวง เผื่อทำ conditional text generation
- Wisesight sentiment analysis with explainable prediction
- ...
TBD.