PyThaiNLP 1.6
มีอะไรใหม่ใน PyThaiNLP 1.6
- ตัวตัดคำ newmm ถูกเขียนขึ้นใหม่โดยใช้หลัก Maximum Matching algorithm และ TCC เพื่อแก้ไขข้อผิดพลาดจากการตัดคำที่ไม่มีในฐานข้อมูลโดยคุณ @korakot และตัดคำได้รวดเร็วยิ่งขึ้น
- เพิ่ม cutkum (https://github.com/pucktada/cutkum) เข้ามาเป็นส่วนหนึ่งของระบบตัดคำ
- เพิ่ม syllable_tokenize ระบบตัดพยางค์ภาษาไทยโดยใช้ dict ในการตัดพยางค์
- เพิ่ม dict_word_tokenize สำหรับใช้เป็นฐานข้อมูลตัดคำได้ตามที่ต้องการ
- pythainlp.romanization โดยใช้ royin ถูกเขียนขึ้นใหม่
- pythainlp.sentiment ถูก Train ใหม่โดยใช้ตัวตัดคำ newmm ทำให้ได้ผลลัพธ์ที่แม่นยำขึ้นมากกว่าเดิม
- เพิ่ม pythainlp.word_vector.thai2vec โดยสามารถนำ https://github.com/cstorm125/thai2vec ของคุณ @cstorm125 ไปใช้งานได้
- เพิ่มระบบเก็บไฟล์ไว้ใน pythainlp-data สำหรับใช้เก็บข้อมูลต่าง ๆ ของ PyThaiNLP
- ติดตั้งได้สะดวกยิ่งขึ้นด้วยการเขียนโค้ดทดแทน pyicu ทำให้ไม่จำเป็นต้องติดตั้ง pyicu อีกต่อไป
เอกสารการใช้งาน https://github.com/PyThaiNLP/pythainlp/blob/pythainlp1.6/docs/pythainlp-1-6-thai.md
แล้วติดตั้งได้ด้วยคำสั่ง pip install -U pythainlp