หลังจากที่ได้ word list จาก au8ust มาผมก็ยังไม่ได้ทำอะไรกับ word list เลย. แต่เท่าที่ดูแล้วโปรแกรมที่แก้แล้วน่าจะมีประโยชน์กับหลายๆโปรแกรมน่าจะเป็น icu. อย่างเช่น OpenOffice.org เป็นต้น (แต่ก็ไม่รู้ว่าจริงหรือเปล่า)
หลังจากที่ดูคร่าวๆ แล้วไฟล์แรกที่น่าจะต้องแก้น่าจะเป็น source/common/dictbe.h ที่ในนั้นมี ThaiBreakEngine อยู่ ก็เลยคิดว่าก็คงต้องมี LaoBreakEngine ด้วยเหมือนกัน แก้กฎข้างในเล็กๆ น้อยๆ พวกไม้ยมก ก็คงจะไม่เหมือนกันหรือเปล่า … อันนี้ก็ไปแก้ใน source/common/dictbe.cpp
ตอนนี้แผนต่อไปก็คงต้องลงมือทำดูพร้อมเขียน test อะไรประมาณนั้น
ป.ล. libthai ก็ดูน่าสนใจดี มีใช้หลายโปรแกรมเหมือนกัน แต่ libthai ตัดคำภาษาลาวด้วยก็ดูแปลกๆ หรือเปล่า?
word list อันนั้น based on libthai ผมได้ทำการแก้ไขบางส่วนไปแล้ว แต่ดูเหมือนจะยังไม่สมบูรณ์เสียทีเดียว คงต้องปรับแก้กันอีกสักพักกระมัง แต่เบื้องต้นคงต้องรบกวนคุณวีทดสอบดูก่อน ว่ามันทำงานได้ตามที่คาดหวังหรือเปล่า
ป.ล. คนถัดไปคิดว่า?
ความเห็น โดย au8ust — 19 มิถุนายน 2008 @ 10:03
เป็น แนวทางที่ดี ครับ
ตอนนี้ผม ยัง ไม่มีฟามรู้อะไรเลย เอาไว้แล้วผมจะ เดีนตามไป ไปช้าๆ
อิอิ
ขอบใจ พี่ วีครับ
ความเห็น โดย Os555 — 19 มิถุนายน 2008 @ 10:44
ยังงง กับ word list ???
ความเห็น โดย Chatsiri — 19 มิถุนายน 2008 @ 13:32
อาจจะมองว่าเป็นพจนานุกรมที่มีแต่ headword ก็ได้
ความเห็น โดย वीर — 19 มิถุนายน 2008 @ 13:47
เฮ้ กำลังจะทำใน libthai อยู่เลยครับ แต่อยากปรับเพิ่มขนาด index ของ datrie ก่อน
แต่ภาษาลาว เคยเห็นคนลาวอธิบายว่าสามารถใช้ rule-based ได้เลยนี่ครับ
ความเห็น โดย thep — 19 มิถุนายน 2008 @ 14:28
ถ้า libthai ใช้ได้ด้วยก็จะครบเลย … firefox, qt4 ก็น่าจะใช้ได้ตามไปด้วย
ความเห็น โดย वीर — 19 มิถุนายน 2008 @ 15:05
น่าจะตัดตามกฎในนี้ได้ ftp://ftp.imag.fr/pub/bibliotheque/theses/2004/Berment.Vincent/these.dir/these.pdf
ความเห็น โดย वीर — 19 มิถุนายน 2008 @ 15:07
ผมหมายถึงแบบนี้น่ะ:
http://www.panl10n.net/english/outputs/Working%20Papers/Laos/Microsoft%20Word%20-%206_E_N_296.pdf
ความเห็น โดย thep — 20 มิถุนายน 2008 @ 01:32
ตัดพยางค์ก็พอสำหรับทำ line break แล้วหรือเปล่าครับ?
ความเห็น โดย वीर — 20 มิถุนายน 2008 @ 09:05