Mistral เปิดตัวโมเดล Small 3 ขนาดเล็ก ประสิทธิภาพสูง ราคาประหยัด

Mistral AI สตาร์ทอัพด้าน AI จากยุโรป เปิดตัวโมเดลภาษาใหม่ขนาด 24 พันล้านพารามิเตอร์ ที่มีประสิทธิภาพเทียบเท่าโมเดลขนาดใหญ่กว่า 3 เท่า พร้อมลดต้นทุนการประมวลผลอย่างมีนัยสำคัญ

Mistral Small 3 บรรลุความแม่นยำ 81% ในการทดสอบมาตรฐาน โดยประมวลผลได้ 150 โทเคนต่อวินาที และเผยแพร่ภายใต้ใบอนุญาต Apache 2.0 ที่อนุญาตให้องค์กรต่างๆ สามารถปรับแต่งและนำไปใช้งานได้อย่างอิสระ Guillaume Lample หัวหน้าฝ่ายวิทยาศาสตร์ของ Mistral เปิดเผยว่าโมเดลนี้มีประสิทธิภาพดีที่สุดในกลุ่มโมเดลที่มีขนาดต่ำกว่า 70 พันล้านพารามิเตอร์ และมีความสามารถใกล้เคียงกับ Llama 3.3 70B ของ Meta ที่มีขนาดใหญ่กว่า

การพัฒนาของ Mistral มุ่งเน้นที่ประสิทธิภาพมากกว่าขนาด โดยใช้เทคนิคการฝึกฝนที่ดีขึ้นแทนการเพิ่มกำลังประมวลผล โมเดลถูกฝึกฝนด้วยข้อมูล 8 ล้านล้านโทเคน เทียบกับโมเดลคู่แข่งที่ใช้ 15 ล้านล้านโทเคน และไม่ได้ใช้เทคนิค Reinforcement Learning หรือข้อมูลสังเคราะห์ในการฝึกฝน ซึ่งช่วยลดความเอนเอียงที่ไม่พึงประสงค์ในโมเดล รูปแบบการทำงานนี้เหมาะสำหรับองค์กรที่ต้องการใช้งาน AI ในระบบภายในเพื่อความเป็นส่วนตัวและความน่าเชื่อถือ โดยสามารถทำงานบน GPU เพียงหนึ่งตัวและรองรับการใช้งานทั่วไปในธุรกิจได้ 80-90%

ที่มา: https://venturebeat.com/ai/mistral-small-3-brings-open-source-ai-to-the-masses-smaller-faster-and-cheaper/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Stripe ยกระดับระบบชำระเงินสู่โครงสร้างพื้นฐานสำหรับ Machine-to-Machine รับยุค Agentic AI

Stripe เปิดตัวผลิตภัณฑ์ใหม่ 288 รายการ พร้อมส่งแผนพลิกโฉมระบบชำระเงินจากเดิมที่เป็นโครงสร้างพื้นฐานในการทำธุรกรรมสำหรับมนุษย์ ให้กลายเป็นโครงสร้างพื้นฐานที่สามารถตั้งโปรแกรมได้และทำงานอย่างต่อเนื่องเพื่อรองรับธุรกกรรมแบบ Machine-to-Machine ถือเป็นการปูทางเข้าสู่ระบบเศรษฐกิจแบบ Agentic AI อย่างเต็มรูปแบบ