Alibaba ปล่อยโมเดล Open Source ใหม่ “QwQ-32B” เทียบชั้น DeepSeek-R1 แต่เล็กกว่า

AI จีนยังคงเดินหน้าอย่างต่อเนื่อง ล่าสุด Alibaba ได้ปล่อยโมเดล Open Source ใหม่ “QwQ-32B” โมเดล LLM แบบ Open Source ขนาด 32B ในตระกูล Qwen ที่ออกแบบมาเพื่อปรับปรุงประสิทธิภาพและแก้ไขปัญหาที่ซับซ้อนได้ด้วยเทคนิค Reinforcement Learning (RL) ที่เทียบชั้น DeepSeek-R1 แต่ขนาดเล็กกว่า

โดย QwQ นั้นย่อมาจาก Qwen-with-Questions ที่ทาง Alibaba เปิดตัวออกมาในช่วงพฤศจิกายน 2024 ที่ผ่านมา ซึ่ง ณ ตอนนั้นเป็นการเปิดตัวเพื่อแข่งขันกัน o1-preview ของ OpenAI หากแต่ล่าสุดได้กลายเป็น Open-Source ภายใต้ Apache 2.0 ที่เปิดเป็น Open-Weight บน Hugging Face และ ModelScope เป็นที่เรียบร้อย ซึ่งสามารถนำไปใช้งานในเชิงพาณิชย์หรืองานวิจัยได้เลย

จุดที่น่าสนใจคือประสิทธิภาพของโมเดลที่เรียกได้ว่าเทียบเคียงกับ DeepSeek-R1 ในหลาย ๆ ชุดการทดสอบ โดย DeepSeek-R1 มีขนาด 671 พันล้านพารามิเตอร์ในขณะที่ QwQ ที่มีขนาด 32 พันล้านพารามิเตอร์นั้นสามารถดำเนินการได้ใกล้เคียงกันหรือเหนือกว่า แต่จะเห็นได้ว่าขนาดเล็กกว่าอย่างมีนัยสำคัญ แปลว่ามีความต้องการใช้หน่วยประมวลผลที่น้อยกว่ามาก

ดูเหมือนว่า โมเดล Open-Source จากจีนอาจจะกำลังเริ่มเป็นที่จับตามองมากขึ้นเรื่อย ๆ ไม่ว่าจะเป็นเรื่องค่าใช้จ่ายและประสิทธิภาพ ซึ่งไม่แน่ว่าองค์กรที่กำลังมองหาโซลูชัน AI ในการแก้ไขปัญหาที่ซับซ้อน หรือต้องการสร้างผู้ช่วยเขียนโค้ด สร้างโมเดลทางการเงิน หรือ กระบวนการให้บริการลูกค้าแบบอัตโนมัติ ตัวเลือก QwQ-32B อาจจะน่าสนใจในการเริ่มต้น

สำหรับรายละเอียดอื่น ๆ ของ QwQ-32B สามารถอ่านเพิ่มเติมได้ที่ GitHub ของ Qwen Team จาก Alibaba 

ที่มา: https://venturebeat.com/ai/alibabas-new-open-source-model-qwq-32b-matches-deepseek-r1-with-way-smaller-compute-requirements/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้