Mistral เปิดตัวโมเดล Small 3 ขนาดเล็ก ประสิทธิภาพสูง ราคาประหยัด

Mistral AI สตาร์ทอัพด้าน AI จากยุโรป เปิดตัวโมเดลภาษาใหม่ขนาด 24 พันล้านพารามิเตอร์ ที่มีประสิทธิภาพเทียบเท่าโมเดลขนาดใหญ่กว่า 3 เท่า พร้อมลดต้นทุนการประมวลผลอย่างมีนัยสำคัญ

Mistral Small 3 บรรลุความแม่นยำ 81% ในการทดสอบมาตรฐาน โดยประมวลผลได้ 150 โทเคนต่อวินาที และเผยแพร่ภายใต้ใบอนุญาต Apache 2.0 ที่อนุญาตให้องค์กรต่างๆ สามารถปรับแต่งและนำไปใช้งานได้อย่างอิสระ Guillaume Lample หัวหน้าฝ่ายวิทยาศาสตร์ของ Mistral เปิดเผยว่าโมเดลนี้มีประสิทธิภาพดีที่สุดในกลุ่มโมเดลที่มีขนาดต่ำกว่า 70 พันล้านพารามิเตอร์ และมีความสามารถใกล้เคียงกับ Llama 3.3 70B ของ Meta ที่มีขนาดใหญ่กว่า

การพัฒนาของ Mistral มุ่งเน้นที่ประสิทธิภาพมากกว่าขนาด โดยใช้เทคนิคการฝึกฝนที่ดีขึ้นแทนการเพิ่มกำลังประมวลผล โมเดลถูกฝึกฝนด้วยข้อมูล 8 ล้านล้านโทเคน เทียบกับโมเดลคู่แข่งที่ใช้ 15 ล้านล้านโทเคน และไม่ได้ใช้เทคนิค Reinforcement Learning หรือข้อมูลสังเคราะห์ในการฝึกฝน ซึ่งช่วยลดความเอนเอียงที่ไม่พึงประสงค์ในโมเดล รูปแบบการทำงานนี้เหมาะสำหรับองค์กรที่ต้องการใช้งาน AI ในระบบภายในเพื่อความเป็นส่วนตัวและความน่าเชื่อถือ โดยสามารถทำงานบน GPU เพียงหนึ่งตัวและรองรับการใช้งานทั่วไปในธุรกิจได้ 80-90%

ที่มา: https://venturebeat.com/ai/mistral-small-3-brings-open-source-ai-to-the-masses-smaller-faster-and-cheaper/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Elastic 9.4 ออกแล้ว

Elastic ได้ออกมาประกาศเปิดตัว Elastic 9.4 อย่างเป็นทางการ โดยเพิ่มความสามารถในการตรวจสอบการทำงานของ Context Engineering, Application และ Infrastructure เพิ่มเติม, เสริม AI ในการรักษาความมั่นคงปลอดภัย และเพิ่มความสามารถอื่นๆ อีกมากมาย ดังนี้

VMware เปิดตัว VCF 9.1 ยกระดับ Private Cloud เพิ่มความคุ้มค่าและความปลอดภัย ตอบโจทย์ยุค AI

VMware ได้ประกาศเปิดตัว VMware Cloud Foundation หรือ VCF 9.1 อย่างเป็นทางการ หวังยกระดับ Private Cloud ให้เป็นแพลตฟอร์มที่บริหารจัดการได้ง่าย คุ้มค่าต่อการลงทุน และมาพร้อมกับระบบรักษาความปลอดภัยที่แข็งแกร่งตั้งแต่ระดับโครงสร้างพื้นฐาน …