वीर

20 กุมภาพันธ์ 2008

KUCut – โปรแกรมตัดคำ ที่เขียนด้วย Python

Filed under: Uncategorized — Tags: , , , , — वीर @ 10:49

หลายคนแม้แต่ในหน่วยวิจัยเดียวกันมักจะถามผมว่าใช้โปรแกรมตัดคำตัวไหนอยู่. โปรแกรมตัดคำตัวที่ผมใช้เป็นหลักชื่อว่า KUCut จาก NAiST @KUมี license แบบ GPL และ download ได้จาก http://naist.cpe.ku.ac.th/pkg/kucut-1.2.2_python25_fix.zip. โปรแกรมตัดคำตัวนี้เขียนด้วยภาษา Python. หลักการที่แปลกจากตัวอื่นคือใช้เทคนิค unsupervised machine learning ด้วย อ่านเพิ่มได้จาก “การตัดคําภาษาไทยดวยเทคนิคการเรียนรูแบบไมใชตัวอยาง”.

ส่วน Python sdk และ runtime (ภาษาเรียกแบบ Java :-P) สามารถ download ได้จาก http://www.python.org/download/

มี 1 ความคิดเห็น »

  1. [...] เอาไว้ตัดคำโดยใช้  kucut [...]

    Pingback โดย เตรียม parallel corpus สำหรับ word alignment จาก .po « वीर — 4 มีนาคม 2008 @ 10:10


RSS feed สำหรับความคิดเห็นในกระทู้นี้ TrackBack URI

เขียนความคิดเห็นของคุณ

บลอกที่ WordPress.com .