Alibaba เปิดตัวโมเดล AI Qwen3 ตระกูลใหม่ที่สามารถทำงานได้ทั้งแบบคิดวิเคราะห์อย่างละเอียดและตอบสนองอย่างรวดเร็ว พร้อมให้ดาวน์โหลดภายใต้ลิขสิทธิ์แบบเปิด

Alibaba เปิดตัว Qwen3 โมเดล AI ใหม่ มีประสิทธิภาพเทียบเท่าหรือในบางกรณีดีกว่าโมเดลที่ดีที่สุดของ Google และ OpenAI โมเดลส่วนใหญ่พร้อมให้ดาวน์โหลดแล้วภายใต้ลิขสิทธิ์แบบเปิดบน Hugging Face และ GitHub โดยมีขนาดตั้งแต่ 0.6 พันล้านถึง 235 พันล้านพารามิเตอร์ ซึ่งโดยทั่วไปโมเดลที่มีพารามิเตอร์มากกว่าจะมีความสามารถในการแก้ปัญหาที่ดีกว่า การเพิ่มขึ้นของโมเดลจากจีนเช่น Qwen สร้างแรงกดดันให้แล็บ AI อเมริกาอย่าง OpenAI พัฒนาเทคโนโลยีที่มีความสามารถมากขึ้น และนำไปสู่การใช้มาตรการจำกัดความสามารถของบริษัท AI จีนในการเข้าถึงชิปที่จำเป็นสำหรับการฝึกฝนโมเดล
Qwen3 เป็นโมเดลแบบ “hybrid” ที่สามารถใช้เวลาคิดวิเคราะห์ปัญหาซับซ้อนหรือตอบคำของ่ายๆ ได้อย่างรวดเร็ว โดยช่วยให้โมเดลตรวจสอบข้อเท็จจริงได้ด้วยตนเองคล้ายกับ o3 ของ OpenAI แต่แลกมาด้วยความล่าช้า นอกจากนี้ บางโมเดลยังใช้สถาปัตยกรรม mixture of experts (MoE) ที่แบ่งงานออกเป็นงานย่อยและมอบหมายให้ “ผู้เชี่ยวชาญ” เฉพาะด้านที่เล็กกว่า เพิ่มประสิทธิภาพการประมวลผล Qwen3 รองรับ 119 ภาษา ผ่านการฝึกฝนบนชุดข้อมูล 36 ล้านล้านโทเค็น ด้วยตำราเรียน ข้อมูลคำถาม-คำตอบ โค้ด และข้อมูลที่สร้างโดย AI

การปรับปรุงนี้ช่วยให้โมเดล Qwen3 ขนาดใหญ่สุดอย่าง Qwen-3-235B-A22B เอาชนะ OpenAI o3-mini และ Google Gemini 2.5 Pro บนแพลตฟอร์มการแข่งขันโปรแกรมมิ่ง Codeforces รวมถึงทำคะแนนดีกว่าในเกณฑ์มาตรฐานคณิตศาสตร์ AIME และการทดสอบการให้เหตุผล BFCL ขณะที่โมเดล Qwen3-32B ยังคงแข่งขันได้กับโมเดลเปิดและปิดหลายตัว รวมถึง DeepSeek R1 และเหนือกว่า o1 ของ OpenAI ในหลายการทดสอบ โดยเฉพาะอย่างยิ่งในเกณฑ์มาตรฐานการเขียนโค้ด LiveCodeBench นอกจากมีโมเดลสำหรับดาวน์โหลดได้ฟรีแล้ว Qwen3 ยังมีให้บริการผ่านผู้ให้บริการคลาวด์ทั้ง Fireworks AI และ Hyperbolic
ที่มา: https://techcrunch.com/2025/04/28/alibaba-unveils-qwen-3-a-family-of-hybrid-ai-reasoning-models/