มีรายงานว่า DeepSeek ห้องปฏิบัติการปัญญาประดิษฐ์สัญชาติจีน สามารถระดมทุนรอบใหม่ได้กว่า 5 หมื่นล้านหยวน หรือคิดเป็นเงินประมาณ 7.4 พันล้านดอลลาร์สหรัฐ

สำนักข่าว The Information และ The Wall Street Journal ได้อ้างอิงแหล่งข่าวว่า มูลค่าประเมินของบริษัท DeepSeek ในปัจจุบันได้พุ่งทะลุ 5 หมื่นล้านดอลลาร์สหรัฐเป็นที่เรียบร้อย ซึ่งรายงานระบุว่าตัวเลขดังกล่าวส่งผลให้ DeepSeek ก้าวขึ้นเป็นสตาร์ทอัพด้าน AI ที่มีมูลค่าสูงที่สุดในประเทศจีน
รายงานระบุเพิ่มเติมว่า Liang Wenfeng ผู้ก่อตั้งและประธานเจ้าหน้าที่บริหารของ DeepSeek ได้ร่วมลงขันในเงินทุนรอบนี้ด้วยตัวเองถึง 3 พันล้านดอลลาร์สหรัฐ (หรือประมาณ 2 หมื่นล้านหยวน) ขณะที่เมื่อช่วงต้นเดือนที่ผ่านมา สำนักข่าว Reuters รายงานว่า Tencent Holdings กำลังพิจารณาที่จะเข้าร่วมลงทุนเป็นจำนวนเงินประมาณ 1.48 พันล้านดอลลาร์เช่นกัน ทั้งนี้ ผู้เข้าร่วมลงทุนส่วนใหญ่ในรอบนี้ได้ตกลงนำเงินทุนไปฝากไว้ในรูปแบบห้างหุ้นส่วนจำกัดที่บริหารจัดการโดย Liang เพื่อช่วยให้ตัวผู้ก่อตั้งยังคงสามารถรักษาอำนาจในการควบคุมและบริหารจัดการบริษัทเอาไว้ได้อย่างเบ็ดเสร็จ
DeepSeek (หรือชื่อจดทะเบียนอย่างเป็นทางการคือ Hangzhou DeepSeek Artificial Intelligence Basic Technology Research) เป็นบริษัทในเครือของกองทุนบริหารความเสี่ยงที่ชื่อว่า High-Flyer โดยห้องปฏิบัติการ AI แห่งนี้ก้าวขึ้นมามีชื่อเสียงโด่งดังในระดับโลกเมื่อเดือนมกราคม 2025 หลังจากประกาศเปิดซอร์สโมเดลการใช้เหตุผลขั้นสูงที่ชื่อว่า R1 ซึ่งการเปิดตัวในครั้งนั้นได้สร้างความสั่นสะเทือนจนเกิดการเทขายหุ้นในกลุ่มผู้ผลิตชิปอย่างหนัก และส่งผลให้มูลค่าหลักทรัพย์ตามราคาตลาดของ Nvidia ลดลงชั่วคราวถึง 15% ในเวลานั้น
โมเดล R1 มีความสามารถในการประมวลผลผลลัพธ์ที่ใกล้เคียงกับ o1 ซึ่งเป็นโมเดลเชิงเหตุผลที่ OpenAI Group ปล่อยออกมาในเดือนธันวาคม 2024 ทว่าจุดเด่นของ DeepSeek คือโมเดลของพวกเขาสามารถทำการประมวลผลผลลัพธ์ได้โดยใช้ฮาร์ดแวร์เพียงเศษเสี้ยวเดียวเมื่อเทียบกับคู่แข่ง ซึ่งการเปิดตัวโมเดลที่ใช้งานฮาร์ดแวร์ได้อย่างมีประสิทธิภาพสูงนี้ทำให้นักลงทุนเกิดความกังวลว่าความต้องการใช้งานตัวเร่งความเร็ว AI ในตลาดอาจลดน้อยลงในอนาคต
หลังจากนั้นในเดือนเมษายน DeepSeek ได้เปิดตัวโมเดลรุ่นถัดมาในชื่อ DeepSeek-V4-Pro ซึ่งมาพร้อมกับขนาด 1.6 ล้านล้านพารามิเตอร์ ซึ่งมากกว่ารุ่นก่อนหน้าถึงสองเท่า โดยใช้สถาปัตยกรรมแบบผสมผสานผู้เชี่ยวชาญ (Mixture-of-Experts) ที่จะเปิดทำงานจริงเพียง 2.84 แสนล้านพารามิเตอร์เท่านั้นในการตอบคำสั่งผู้ใช้ ทั้งนี้ DeepSeek ได้ฝึกฝนโมเดลดังกล่าวด้วยชุดข้อมูลที่มีขนาดใหญ่มากกว่า 32 ล้านล้านโทเคน
โดยทั่วไปแล้ว เครือข่ายประสาทเทียมจะใช้โครงสร้างข้อมูลที่เรียกว่า KV cache ในการประมวลผลผลลัพธ์ ซึ่งโมเดล V4-Pro ตัวใหม่นี้สามารถประมวลผลคำสั่งที่มีความยาวถึง 1 ล้านโทเคนได้โดยใช้ขนาด KV cache เพียง 1 ใน 10 ของโมเดลรุ่นก่อนหน้าอย่าง DeepSeek-V3.2 ส่งผลให้สามารถลดการใช้หน่วยความจำลงได้อย่างมหาศาล และช่วยประหยัดต้นทุนในขั้นตอนการประมวลผลผลลัพธ์ได้อย่างมีนัยสำคัญ
ความคุ้มค่าด้านต้นทุนของอัลกอริทึมจาก DeepSeek ได้ไปเข้าตาบริษัทยักษ์ใหญ่อย่าง Microsoft โดยสำนักข่าว Axios รายงานว่า ยักษ์ใหญ่ด้านเทคโนโลยีรายนี้อาจจะนำโมเดลของ DeepSeek เวอร์ชันปรับแต่งเฉพาะ เข้าไปเชื่อมต่อใช้งานร่วมกับแอปพลิเคชัน Cowork Copilot ซึ่งเพิ่งเปิดให้ใช้งานทั่วไป โดยมีเป้าหมายเพื่อนำเสนอทางเลือกที่มีต้นทุนต่ำกว่าเมื่อเทียบกับการใช้อัลกอริทึมของ OpenAI และ Anthropic ที่ขับเคลื่อนซอฟต์แวร์ดังกล่าวอยู่ในปัจจุบัน
มีรายงานว่า Microsoft วางแผนที่จะใช้โมเดล DeepSeek V4 เวอร์ชันปรับแต่งหรือโมเดลโอเพนซอร์สตัวอื่น ๆ โดยกระบวนการปรับแต่งคือขั้นตอนที่นักพัฒนาจะเข้ามาปรับ AI ให้เหมาะสมกับภารกิจเฉพาะเจาะจง ซึ่งจะช่วยเพิ่มทั้งคุณภาพและความเร็วในการประมวลผลผลลัพธ์ คาดว่า Microsoft จะเริ่มทยอยเปิดตัวโมเดลเวอร์ชันปรับแต่งนี้ในอีกไม่กี่สัปดาห์ข้างหน้า
ที่มา: https://siliconangle.com/2026/06/16/chinas-deepseek-reportedly-raises-7-4b-funding-50b-valuation/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






