Alibaba ปล่อยโมเดล Open Source ใหม่ “QwQ-32B” เทียบชั้น DeepSeek-R1 แต่เล็กกว่า

AI จีนยังคงเดินหน้าอย่างต่อเนื่อง ล่าสุด Alibaba ได้ปล่อยโมเดล Open Source ใหม่ “QwQ-32B” โมเดล LLM แบบ Open Source ขนาด 32B ในตระกูล Qwen ที่ออกแบบมาเพื่อปรับปรุงประสิทธิภาพและแก้ไขปัญหาที่ซับซ้อนได้ด้วยเทคนิค Reinforcement Learning (RL) ที่เทียบชั้น DeepSeek-R1 แต่ขนาดเล็กกว่า

โดย QwQ นั้นย่อมาจาก Qwen-with-Questions ที่ทาง Alibaba เปิดตัวออกมาในช่วงพฤศจิกายน 2024 ที่ผ่านมา ซึ่ง ณ ตอนนั้นเป็นการเปิดตัวเพื่อแข่งขันกัน o1-preview ของ OpenAI หากแต่ล่าสุดได้กลายเป็น Open-Source ภายใต้ Apache 2.0 ที่เปิดเป็น Open-Weight บน Hugging Face และ ModelScope เป็นที่เรียบร้อย ซึ่งสามารถนำไปใช้งานในเชิงพาณิชย์หรืองานวิจัยได้เลย

จุดที่น่าสนใจคือประสิทธิภาพของโมเดลที่เรียกได้ว่าเทียบเคียงกับ DeepSeek-R1 ในหลาย ๆ ชุดการทดสอบ โดย DeepSeek-R1 มีขนาด 671 พันล้านพารามิเตอร์ในขณะที่ QwQ ที่มีขนาด 32 พันล้านพารามิเตอร์นั้นสามารถดำเนินการได้ใกล้เคียงกันหรือเหนือกว่า แต่จะเห็นได้ว่าขนาดเล็กกว่าอย่างมีนัยสำคัญ แปลว่ามีความต้องการใช้หน่วยประมวลผลที่น้อยกว่ามาก

ดูเหมือนว่า โมเดล Open-Source จากจีนอาจจะกำลังเริ่มเป็นที่จับตามองมากขึ้นเรื่อย ๆ ไม่ว่าจะเป็นเรื่องค่าใช้จ่ายและประสิทธิภาพ ซึ่งไม่แน่ว่าองค์กรที่กำลังมองหาโซลูชัน AI ในการแก้ไขปัญหาที่ซับซ้อน หรือต้องการสร้างผู้ช่วยเขียนโค้ด สร้างโมเดลทางการเงิน หรือ กระบวนการให้บริการลูกค้าแบบอัตโนมัติ ตัวเลือก QwQ-32B อาจจะน่าสนใจในการเริ่มต้น

สำหรับรายละเอียดอื่น ๆ ของ QwQ-32B สามารถอ่านเพิ่มเติมได้ที่ GitHub ของ Qwen Team จาก Alibaba 

ที่มา: https://venturebeat.com/ai/alibabas-new-open-source-model-qwq-32b-matches-deepseek-r1-with-way-smaller-compute-requirements/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

AMD เปิดตัวการ์ดเน็ตเวิร์กระดับ 400Gbps ตัวแรกของโลกที่เปิดให้โปรแกรมเองได้

AMD Pollara 400 หรือโซลูชัน NIC ใหม่จาก AMD ซึ่งจุดเด่นคือการเปิดให้มีการโปรแกรมการใช้งานเพิ่มเองได้ และรองรับมาตรฐานจาก Ultra Ethernet Consortium (UEC) ได้ด้วย

Cloudflare เสริมแกร่งโซลูชัน Zero Trustเพิ่มการป้องกันการโจมตีจากควอนตัมในรูปแบบคลาวด์-เนทีฟ เป็นรายแรกของวงการ [PR]

คลาวด์แฟลร์ หรือ Cloudflare, Inc. (NYSE: NET) บริษัทชั้นนำด้านคลาวด์เพื่อการเชื่อมต่อระหว่างเครือข่าย (Connectivity Cloud) ประกาศเพิ่มการสนับสนุนครบวงจรเกี่ยวกับการเข้ารหัสแบบโพสต์ควอนตัม (post-quantum cryptography) หรือการเข้ารหัสที่สามารถรับมือกับการโจมตีจากควอนตัมได้ ไว้ในโซลูชัน Zero Trust Network Access ของบริษัทฯ ซึ่งพร้อมใช้งานแล้ว สามารถช่วยองค์กรกำหนดเส้นทางสื่อสารที่ปลอดภัยจากทุกเว็บเบราว์เซอร์ไปยังเว็บแอปพลิเคชันต่าง …