OpenThaiGPT โครงการโมเดล LLM ภาษาไทยที่ร่วมก่อตั้งโดยสมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT) และสมาคมปัญญาประดิษฐ์ประเทศไทย (AIAT) และได้รับการสนับสนุนจากหน่วยงานใหญ่ในไทยรายหลาย ได้เปิดตัว OpenThaiGPT เวอร์ชัน 1.0.0 แล้ว โดยมีโมเดลขนาด 7,000 ล้าน, 13,000 ล้าน, และ 70,000 ล้านพารามิเตอร์ให้ดาวน์โหลดไปใช้งานกันได้ฟรี
OpenThaiGPT 1.0.0 เป็นโมเดล LLM ที่ถูกพัฒนาขึ้นต่อยอดจากโมเดลโอเพ่นซอร์ส LLaMA v2 จาก Meta ให้มีความสามารถในการทำความเข้าใจ เขียน และสนทนาโต้ตอบเป็นภาษาไทยได้ โดยโมเดลนี้เปิดให้ใช้งานกันแบบโอเพ่นซอร์สและสามารถนำไปใช้งานเชิงพาณิชย์ได้ผ่าน Apache 2.0 License
จุดเด่นของ OpenThaiGPT 1.0.0
- เป็นโมเดล LLM ภาษาไทยแบบเปิดที่ทำข้อสอบภาษาไทยได้ดีกว่าโมเดลภาษาไทยแบบเปิดอื่นๆในปัจจุบัน
- มีขนาดใหญ่สูงสุดถึง 70,000 ล้านพารามิเตอร์
- รองรับการทำงานร่วมกับ Prompt ยาวๆได้อย่างมีประสิทธิภาพ
- ตอบคำถามได้อย่างรวดเร็วด้วยการเสริมข้อมูลคำไทย 10,000 คำลงไปในพจนานุกรมของโมเดล
- พัฒนาขึ้นมาจากการเรียนรู้ภาษาไทยกว่า 65,000 ล้านคำที่ผ่านการ Deduplicated มาแล้ว และมีการ Fine tuning ภาษาไทยจากข้อมูล 1 ล้านตัวอย่าง
- เข้าใจและประมวลผลภาษาไทยจากบริบทได้ดี
- ทำงานร่วมกับภาษาไทยได้ดีกว่า GPT 3.5, Gemini, และ Claude 3 Haiku
และสำหรับผู้ใช้งานทั่วไป ทีมงาน OpenThaiGPT เตรียมเปิดให้บริการหน้าเว็บไซต์พูดคุยกับ AI เร็วๆนี้
ศึกษารายละเอียดเพิ่มเติมเกี่ยวกับ OpenThaiGPT 1.0.0 และร่วมสมัครเป็นส่วนหนึ่งของการพัฒนาโมเดลนี้ได้ที่หน้าเว็บไซต์ https://openthaigpt.aieat.or.th/