โมเดล Qwen ของ Alibaba Cloud คืออะไร ?

Tongyi Qianwen (通义千问, pinyin : Tōngyì qiān wèn) หรือ Qwen คือโมเดล LLM ที่เป็น Foundation Model ของทาง Alibaba Cloud ที่ออกแบบมาเพื่อให้มีความสามารถที่จะเข้าใจ วิเคราะห์ หรือว่าสร้างข้อความที่มีลักษณะเหมือนกับมนุษย์ได้ ซึ่งสามารถทำงานได้หลากหลายรูปแบบ ไม่ว่าจะเป็นการสร้างและประมวลผลข้อความ การเขียนโปรแกรม การแปลภาษา หรือการทำ Data Visualization 

ภายในโมเดลซีรีส์ Qwen นี้มีหลากหลายรูปแบบ ไม่ว่าจะเป็น

  • Qwen โมเดล Pre-trained ด้วยข้อมูลคุณภาพสูงที่รองรับ Context Length ได้สูงสุดถึง 128k Token ที่สามารถทำงานได้หลากหลายรูปแบบ
  • Qwen-VL โมเดล Large Language Vision สำหรับงานด้านการประมวลผลภาพโดยเฉพาะ ที่สามารถสร้างเนื้อหาภาพจากข้อความได้ทั้งภาาอังกฤษและภาษาจีน
  • Qwen-Audio โมเดล Large Language Audio Model สำหรับงานด้านเสียงโดยเฉพาะ ที่รองรับข้อความและไฟล์เสียงได้หลากหลายรูปแบบ 
  • Qwen-Coder โมเดลที่มีทักษะความสามารถในการเขียนโค้ดที่ Open Source ซึ่งรองรับภาษาเขียนโปรแกรมได้ถึง 92 ภาษา ในการทำ Code Generation, Code Completion หรือ Code-Repair
  • Qwen-Math โมเดลด้านคณิตศาสตร์โดยเฉพาะที่สนับสนุนได้ทั้งภาษาอังกฤษและภาษาจีน ที่มีความสามารถในการทำ Chain-of-Thought (CoT) และ Tool-Integrated Reasoning (TIR) ได้
  • Qwen-Plus โมเดลที่ผสมผสานในเรื่องประสิทธิภาพ ความเร็ว และราคาให้มีความสมดุลเพื่อให้สามารถจัดการงานที่ซับซ้อนได้อย่างลงตัว
  • Qwen-Turbo โมเดลที่เน้นเรื่องความเร็วและราคาที่ต่ำเป็นหลัก ที่เหมาะกับงานง่าย ๆ ไม่มีความซับซ้อนมากจนเกินไป

โดย Alibaba Cloud ได้ปล่อยโมเดล Qwen2.0 ในช่วงปี 2023 และอัปเดตมาเป็น Qwen2.5 ในปี 2024 และวันหยุดตรุษจีนปลายมกราคมปี 2025 ได้ปล่อยโมเดล “Qwen2.5-Max” ออกมาเพื่อแข่งขันกับโมเดลชั้นนำจากฟากตะวันตก ตามหลัง DeepSeek ของจีนที่เปิดตัว DeepSeek-R1 ออกมาเป็น Open Source ซึ่งเคลมว่ามีประสิทธิภาพเหนือกว่า OpenAI-o1 และ Alibaba Cloud ปล่อย Qwen2.5-Max ออกมาตามกันติด ๆ แถมยังเคลมว่าเหนือกว่า GPT-4o, DeepSeek-V3 และ Llama3.1-405B อีกด้วย

Credit : Qwen

สำหรับผู้ที่สนใจรายละเอียดเกี่ยวกับ Qwen สามารถอ่านเพิ่มเติมได้ที่เว็บไซต์ของ Alibaba Cloud หรือที่ GitHub รวมทั้งติดตามอัปเดตเพิ่มเติมได้ที่ X.com รวมทั้งสามารถลองเล่นโมเดล Qwen ได้ที่ Playground 

ที่มา:

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Stripe ยกระดับระบบชำระเงินสู่โครงสร้างพื้นฐานสำหรับ Machine-to-Machine รับยุค Agentic AI

Stripe เปิดตัวผลิตภัณฑ์ใหม่ 288 รายการ พร้อมส่งแผนพลิกโฉมระบบชำระเงินจากเดิมที่เป็นโครงสร้างพื้นฐานในการทำธุรกรรมสำหรับมนุษย์ ให้กลายเป็นโครงสร้างพื้นฐานที่สามารถตั้งโปรแกรมได้และทำงานอย่างต่อเนื่องเพื่อรองรับธุรกกรรมแบบ Machine-to-Machine ถือเป็นการปูทางเข้าสู่ระบบเศรษฐกิจแบบ Agentic AI อย่างเต็มรูปแบบ