NVIDIA, Hugging Face และ ServiceNow ร่วมกันเปิดตัว StarCoder2 โมเดล AI ช่วยเขียนโค้ด

NVIDIA, Hugging Face และ ServiceNow ร่วมกันเปิดตัว StarCoder2 LLM โมเดล AI ช่วยเขียนโค้ดรุ่นใหม่ เทรนจากภาษาโปรแกรมกว่า 619 ภาษา

Credit: Hugging Face

NVIDIA, Hugging Face และ ServiceNow ได้ออกมาประกาศเปิดตัว StarCoder2 โมเดล AI ตัวใหม่ที่ออกแบบมาสำหรับนักพัฒนาซอฟต์แวร์โดยเฉพาะ โมเดลถูกพัฒนาภายใต้โครงการความร่วมมือ BigCode Project เน้นความสามารถในการทำ Code Generation เป็นหลัก ถูกเทรนด้วยภาษาโปรแกรมมากกว่า 619 ภาษา ซึ่งใน StarCoder เวอร์ชันแรก 15B-parameter ถูกเทรนด้วยภาษาเพียงแค่ 80 ภาษาเท่านั้น

StarCoder2 มีโมเดลให้ใช้งานด้วยกัน 3 ขนาดตามจำนวน Parameter ได้แก่ 3B, 7B และ 15B ถูกเทรนด้วย ServiceNow Fast LLM framework, Hugging Face nanotron framework และ NVIDIA NeMo ตามลำดับ ใช้การเทรนด้วยเทคนิคใหม่เพื่อให้รองรับภาษาชนิด Low-resource เช่น COBAL ซึ่ง StarCoder2 3B นั้นมีประสิทธิภาพเทียบเท่า StarCoder LLM 15B รุ่นแรก

สำหรับผู้ที่สนใจสามารถเริ่มต้นใช้งาน StarCoder2 ได้แล้วภายใต้ Open RAIL-M license โดยสามารถดาวน์โหลดโมเดลทั้งสามรุ่นได้ผ่านทาง Hugging Face

ที่มา: https://venturebeat.com/ai/nvidia-hugging-face-and-servicenow-release-new-starcoder2-llms-for-code-generation/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Stripe ยกระดับระบบชำระเงินสู่โครงสร้างพื้นฐานสำหรับ Machine-to-Machine รับยุค Agentic AI

Stripe เปิดตัวผลิตภัณฑ์ใหม่ 288 รายการ พร้อมส่งแผนพลิกโฉมระบบชำระเงินจากเดิมที่เป็นโครงสร้างพื้นฐานในการทำธุรกรรมสำหรับมนุษย์ ให้กลายเป็นโครงสร้างพื้นฐานที่สามารถตั้งโปรแกรมได้และทำงานอย่างต่อเนื่องเพื่อรองรับธุรกกรรมแบบ Machine-to-Machine ถือเป็นการปูทางเข้าสู่ระบบเศรษฐกิจแบบ Agentic AI อย่างเต็มรูปแบบ