หลายคนแม้แต่ในหน่วยวิจัยเดียวกันมักจะถามผมว่าใช้โปรแกรมตัดคำตัวไหนอยู่. โปรแกรมตัดคำตัวที่ผมใช้เป็นหลักชื่อว่า KUCut จาก NAiST @KUมี license แบบ GPL และ download ได้จาก http://naist.cpe.ku.ac.th/pkg/kucut-1.2.2_python25_fix.zip. โปรแกรมตัดคำตัวนี้เขียนด้วยภาษา Python. หลักการที่แปลกจากตัวอื่นคือใช้เทคนิค unsupervised machine learning ด้วย อ่านเพิ่มได้จาก “การตัดคําภาษาไทยดวยเทคนิคการเรียนรูแบบไมใชตัวอยาง”.
ส่วน Python sdk และ runtime (ภาษาเรียกแบบ Java :-P) สามารถ download ได้จาก http://www.python.org/download/
[...] เอาไว้ตัดคำโดยใช้ kucut [...]
Pingback โดย เตรียม parallel corpus สำหรับ word alignment จาก .po « वीर — 4 มีนาคม 2008 @ 10:10