ผงาด DeepSeek เคลมเหนือชั้นแถมปล่อย Open Source สะเทือนทั้งวงการ AI

เรียกได้ว่าเป็นอีกเหตุการณ์พลิกโลกที่เกิดขึ้นมาตามหลังจาก ChatGPT ได้กำเนิดขึ้นมาก็ว่าได้ หลังจากที่ “DeepSeek-R1” โมเดล AI สัญชาติจีนที่ปล่อยออกมาเมื่อต้นสัปดาห์ที่แล้วนั้นมีประสิทธิภาพที่เหนือกว่า OpenAI-o1 และที่สำคัญคือ “Open Source” เอาไปใช้ต่อยอดได้เลยอีกด้วย

บทความนี้จะพามารู้จักกับ DeepSeek ที่เปิดตัวโมเดลออกมาภายในช่วงเวลาเพียงแค่สัปดาห์นิด ๆ ที่ผ่านมาเท่านั้นก็ได้ทำให้วงการ AI สั่นสะเทือนและทำให้ราคาหุ้นเทคโนโลยีในสหรัฐโดยเฉพาะ NVIDIA ที่ร่วงลงมาอย่างหนักภายในเวลาไม่กี่วัน

DeepSeek คือบริษัท AI สัญชาติจีนที่ก่อตั้งขึ้นมาในปี 2023 โดยคุณ Liang Wenfeng ที่เมืองหางโจว ช่วงตอนตะวันออกเฉียงใต้ของประเทศจีน โดยคุณ Liang Wenfeng เรียนจบในสาขาวิศวกรรมอิเล็กทรอนิกส์และสารสนเทศ (Information and Electronic Engineering)

ปัจจุบัน DeepSeek มีโมเดลหลากหลายรูปแบบให้บริการ อาทิ

  • DeepSeek V3โมเดลที่ปล่อยออกมาเมื่อปลายปีที่แล้ว ที่ชี้ให้เห็นถึงขีดความสามารถอันทรงพลังไม่แพ้โมเดลชั้นนำ ซึ่งได้คะแนนที่เหนือกว่าในหลาย ๆ Benchmark ในขณะที่ชุดทดสอบอื่น ๆ ก็ยังได้คะแนนระดับกลาง ๆ หรือสูสีที่อาจจะเบียดขึ้นเป็นผู้นำได้ไม่ช้านี้
  • DeepSeek Coder ที่ประกอบไปด้วยโมเดลเขียนโค้ดโปรแกรม ที่สามารถช่วยเติมเต็มการเขียนโค้ดได้ในหลายภาษาชั้นนำ เช่น Python, Java, C, PHP, R, Shell, Solidity, Yaml เป็นต้น
  • DeepSeek Math โมเดลที่ใช้แก้ไขปัญหาทางคณิตศาสตร์โดยเน้นที่ทักษะในการแก้ไขได้ด้วยตนเองโดยที่ไม่ขึ้นกับเครื่องมือภายนอกแต่อย่างใด

และโมเดลที่ทำให้ทั้งโลกและวงการ AI สั่นสะเทือนภายในช่วงสัปดาห์ที่ผ่านมา คือ “DeepSeek-R1 ที่เพิ่งปล่อยออกมาสด ๆ ร้อน ๆ เมื่อวันที่ 20 ม.ค.2025 ที่ผ่านมา” โดยบริษัทได้ชี้ให้เห็นถึงประสิทธิภาพที่เหนือกว่า OpenAI-o1 คู่แข่งคนสำคัญในหลาย ๆ Benchmark 

จุดสำคัญคือ DeepSeek ได้ปล่อยให้โมเดล DeepSeek-R1 เป็น Open Source (MIT License) พร้อมเปิดรายงานเชิงเทคนิคออกมาเต็มรูปแบบ ซึ่งทำให้องค์กรสามารถนำไปใช้ต่อยอดกันในเชิงพาณิชย์ได้อย่างอิสระอีกด้วย 

Credit : X.com

สิ่งที่เกิดขึ้นได้ทำให้ทั้งโลกเบนเข็มไปที่ DeepSeek เพื่อทดลองใช้งาน รวมทั้งหน้าสื่อชั้นนำทั้งไทยและต่างประเทศล้วนพูดถึงและวิเคราะห์กันมากมาย และด้วยการเปิดให้เข้าใช้งานได้ “ฟรี” จึงทำให้มีผู้ใช้จำนวนมากเข้าไปเริ่มต้นใช้งาน DeepSeek จนกระทั่ง DeepSeek ได้ออกมาเปิดเผยว่าเว็บไซต์เผยว่าถูกโจมตี Malicious Attack จึงอาจจะทำให้การสมัครเข้าทดลองใช้งานช้าสักเล็กน้อย

ทั้งนี้ เมื่อสถานการณ์กลับมาปกติแล้ว หากใครสนใจอยากทดลองใช้งาน DeepSeek-R1 สามารถลองใช้ DeepThink ได้ที่ chat.deepseek.com รวมทั้งหากใครสนใจรายละเอียดเกี่ยวกับ DeepSeek-R1 สามารถอ่านเพิ่มเติมได้ที่งานตีพิมพ์

สิ่งที่เกิดขึ้นได้ทำให้โลก AI สั่นสะเทือนไปทั่วโลกภายในเวลาอันสั้น นอกจากเรื่องประสิทธิภาพแล้ว ยังมีเรื่องความเป็น Open Source และ “เม็ดเงินลงทุน” ที่มีรายงานว่าใช้เม็ดเงินราว 5.58 ล้านดอลลาร์สหรัฐในการ Train โมเดล ซึ่งอาจเป็นเพียงแค่เสี้ยวเล็ก ๆ ของเงินทุนที่เจ้าอื่นใช้ 

แต่ถ้าเทียบอุปกรณ์ที่ใช้เทรนอย่าง NVIDIA GPU ซึ่ง DeepSeek ใช้เพียง 50,000 ตัว ในขณะที่ OpenAI อาจใช้ไปราว 500,000 กว่าตัว ก็ชัดเจนว่าเม็ดเงินลงทุนในการสร้าง AI อันทรงประสิทธิภาพนั้นอาจจะสามารถมีต้นทุนที่ถูกมาก ๆ ได้ ด้วยเทคโนโลยีการวิจัยพัฒนาที่พัฒนาไปอย่างก้าวกระโดด

และนั่นหมายความว่าอุตสาหกรรม AI อาจจะไม่ได้จำเป็นต้องใช้หน่วยประมวลผลที่ทรงพลังจำนวนมาก ๆ อย่างที่คาดการณ์กันไว้ก่อนหน้านี้ จึงทำให้ราคาหุ้นในตลาด Nasdaq หลาย ๆ ตัว เช่น NVIDIA, Broadcom, Microsoft, Alphabet เป็นต้น ร่วงลงมาตาม ๆ กัน โดยเฉพาะ NVIDIA ที่ร่วงมา 14.83% ภายใน 5 วันที่ผ่านมา

Credit : Google

ที่สำคัญคือ “ราคา” ที่จะเห็นว่า DeepSeek ให้บริการด้วยราคาที่ต่ำกว่ามาก ๆ เมื่อเทียบกับเจ้าอื่น ๆ ในอเมริกา เช่น ค่าบริการจาก OpenAI หรือ Claude ของ Anthropic สิ่งที่เกิดขึ้นอาจจะทำให้นักลงทุนเกิดคำถามในอุตสาหกรรม AI ของสหรัฐจนทำให้เกิดเหตุการณ์ราคาหุ้นดิ่งลงภายในเวลาอันสั้น ก็เป็นได้

สิ่งที่เกิดขึ้นอาจเรียกได้ว่าเป็นสัญญาณของบริษัท AI ฝั่งจีนที่ดูเหมือนจะก้าวตามทันผู้นำ AI อย่างสหรัฐอเมริกามากขึ้นเรื่อย ๆ แล้ว หากแต่สิ่งที่เกิดใหม่อย่าง DeepSeek ก็อาจจะยังคงต้องใช้เวลาในการพิสูจน์หลังจากมีผู้ใช้งานจริงในจำนวนมาก ๆ ว่าประสิทธิภาพจะเป็นไปดังที่เคลมหรือไม่ รวมทั้งจะสามารถยืนระยะความเชื่อมั่นในเวทีโลกได้หรือไม่ต่อไป

และสุดท้ายนี้ ต้องติดตามทางฟากบริษัท AI ฝั่งสหรัฐอเมริกาด้วยว่าจะมีการปล่อยของหรือนวัตกรรมอะไรใหม่ ๆ ออกมาเพื่อแข่งขันกับ DeepSeek ในเร็ว ๆ นี้หรือไม่ หากแต่ก็ไม่แน่ว่า DeepSeek อาจจะมีไม้เด็ดที่รอปล่อยออกมาในเร็ว ๆ นี้อีก ก็เป็นได้

ที่มา: 

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

Google Cloud เพิ่ม BigQuery datasets บน Marketplace แล้ว

Google Cloud ประกาศเปิดให้ผู้ใช้งานสามารถเข้าถึงชุดข้อมูล BigQuery datasets ผ่าน Google Cloud Marketplace ด้วยการผสานการทำงานร่วมกับ BigQuery Analytics Hub เพื่อเพิ่มช่องทางการเข้าถึงข้อมูลสำหรับองค์กร

Goldman Sachs คาดการณ์การใช้พลังงานของศูนย์ข้อมูลจะเพิ่มขึ้นกว่า 2 เท่าภายในปี 2030 เหตุจาก AI

การแข่งขันด้าน AI ส่งผลให้ความต้องการใช้พลังงานในศูนย์ข้อมูลทั่วโลกพุ่งสูงขึ้นอย่างมาก โดย Goldman Sachs คาดว่าจะเพิ่มขึ้นจาก 55 GW เป็น 122 GW ภายในปี 2030