โมเดล Qwen ของ Alibaba Cloud คืออะไร ?

Tongyi Qianwen (通义千问, pinyin : Tōngyì qiān wèn) หรือ Qwen คือโมเดล LLM ที่เป็น Foundation Model ของทาง Alibaba Cloud ที่ออกแบบมาเพื่อให้มีความสามารถที่จะเข้าใจ วิเคราะห์ หรือว่าสร้างข้อความที่มีลักษณะเหมือนกับมนุษย์ได้ ซึ่งสามารถทำงานได้หลากหลายรูปแบบ ไม่ว่าจะเป็นการสร้างและประมวลผลข้อความ การเขียนโปรแกรม การแปลภาษา หรือการทำ Data Visualization 

ภายในโมเดลซีรีส์ Qwen นี้มีหลากหลายรูปแบบ ไม่ว่าจะเป็น

  • Qwen โมเดล Pre-trained ด้วยข้อมูลคุณภาพสูงที่รองรับ Context Length ได้สูงสุดถึง 128k Token ที่สามารถทำงานได้หลากหลายรูปแบบ
  • Qwen-VL โมเดล Large Language Vision สำหรับงานด้านการประมวลผลภาพโดยเฉพาะ ที่สามารถสร้างเนื้อหาภาพจากข้อความได้ทั้งภาาอังกฤษและภาษาจีน
  • Qwen-Audio โมเดล Large Language Audio Model สำหรับงานด้านเสียงโดยเฉพาะ ที่รองรับข้อความและไฟล์เสียงได้หลากหลายรูปแบบ 
  • Qwen-Coder โมเดลที่มีทักษะความสามารถในการเขียนโค้ดที่ Open Source ซึ่งรองรับภาษาเขียนโปรแกรมได้ถึง 92 ภาษา ในการทำ Code Generation, Code Completion หรือ Code-Repair
  • Qwen-Math โมเดลด้านคณิตศาสตร์โดยเฉพาะที่สนับสนุนได้ทั้งภาษาอังกฤษและภาษาจีน ที่มีความสามารถในการทำ Chain-of-Thought (CoT) และ Tool-Integrated Reasoning (TIR) ได้
  • Qwen-Plus โมเดลที่ผสมผสานในเรื่องประสิทธิภาพ ความเร็ว และราคาให้มีความสมดุลเพื่อให้สามารถจัดการงานที่ซับซ้อนได้อย่างลงตัว
  • Qwen-Turbo โมเดลที่เน้นเรื่องความเร็วและราคาที่ต่ำเป็นหลัก ที่เหมาะกับงานง่าย ๆ ไม่มีความซับซ้อนมากจนเกินไป

โดย Alibaba Cloud ได้ปล่อยโมเดล Qwen2.0 ในช่วงปี 2023 และอัปเดตมาเป็น Qwen2.5 ในปี 2024 และวันหยุดตรุษจีนปลายมกราคมปี 2025 ได้ปล่อยโมเดล “Qwen2.5-Max” ออกมาเพื่อแข่งขันกับโมเดลชั้นนำจากฟากตะวันตก ตามหลัง DeepSeek ของจีนที่เปิดตัว DeepSeek-R1 ออกมาเป็น Open Source ซึ่งเคลมว่ามีประสิทธิภาพเหนือกว่า OpenAI-o1 และ Alibaba Cloud ปล่อย Qwen2.5-Max ออกมาตามกันติด ๆ แถมยังเคลมว่าเหนือกว่า GPT-4o, DeepSeek-V3 และ Llama3.1-405B อีกด้วย

Credit : Qwen

สำหรับผู้ที่สนใจรายละเอียดเกี่ยวกับ Qwen สามารถอ่านเพิ่มเติมได้ที่เว็บไซต์ของ Alibaba Cloud หรือที่ GitHub รวมทั้งติดตามอัปเดตเพิ่มเติมได้ที่ X.com รวมทั้งสามารถลองเล่นโมเดล Qwen ได้ที่ Playground 

ที่มา:

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

Elastic 9.4 ออกแล้ว

Elastic ได้ออกมาประกาศเปิดตัว Elastic 9.4 อย่างเป็นทางการ โดยเพิ่มความสามารถในการตรวจสอบการทำงานของ Context Engineering, Application และ Infrastructure เพิ่มเติม, เสริม AI ในการรักษาความมั่นคงปลอดภัย และเพิ่มความสามารถอื่นๆ อีกมากมาย ดังนี้

ข้อมูลลับองค์กรธุรกิจตกอยู่ในความเสี่ยง: แคสเปอร์สกี้รายงานการโจมตีด้วยสปายแวร์เพิ่มขึ้น 18% ในเอเชียตะวันออกเฉียงใต้ [PR]

การโจมตีด้วยสปายแวร์ที่เพิ่มขึ้นทำให้องค์กรธุรกิจในภูมิภาคเอเชียตะวันออกเฉียงใต้ตกอยู่ในความเสี่ยงมากขึ้น ตามรายงานของแคสเปอร์สกี้ บริษัทด้านความปลอดภัยทางไซเบอร์และความเป็นส่วนตัวทางดิจิทัลระดับโลก