Google เปิดตัวโมเดล Gemma ใหม่ สำหรับงานช่วยเขียนโค้ดและงานวิจัย

Google เปิดตัว AI โมเดลในตระกูล Gemma ใหม่อีก 2 ตัว ใช้สำหรับงานช่วยเขียนโค้ดและงานวิจัย

Credit: Google

เมื่อช่วงเดือนกุมภาพันธ์ที่ผ่านมา Google ได้ประกาศเปิดตัว Gemma โมเดล AI ใหม่เป็นครั้งแรก โดยเป็นโมเดลแบบเปิดซึ่งใช้งานวิจัยและเทคโนโลยีเดียวกันกับโมเดล Gemini ล่าสุด Google ได้เปิดตัวโมเดลใหม่ในตระกูล Gemma อีก 2 ตัว ได้แก่ CodeGemma และ RecurrentGemma

CodeGemma นั้นมีโมเดลให้เลือกใช้งานด้วยกัน 2 ตัว ได้แก่ 7B ทั้งแบบ Pretrained และ Instuction-tuned ซึ่งเหมาะสำหรับการทำ Code Completion และ Code Generation และ 2B เหมาะสำหรับการทำ Code Completion ที่เน้นความเร็ว ตอบโจทย์การนำมาใช้งานแบบ Local จุดเด่นคือการเทรนผ่านโทเคนขนาด 500 พันล้านโทเคน โดยใช้ภาษาอังกฤษ, ข้อมูลด้านคณิตศาตร์และซอร์สโค้ด ทำให้สามารถช่วยสร้างโค้ดที่ทำความเข้าใจได้ง่าย ช่วยลดข้อผิดพลาดลง รองรับภาษาหลักหลายตัว เช่น Python, JavaScript และ Java

CodeGemma Benchmark
Credit: Google

ในด้าน RecurrentGemma นั้นถูกพัฒนาขึ้นมาสำหรับนักวิจัยโดยเฉพาะ มีการใช้งาน Recurrent Neural Networks และ Local Attention เพื่อช่วยปรับปรุงการใช้งานหน่วยความจำให้มีประสิทธิภาพ ในขณะเดียวกันให้ประสิทธิภาพที่ใกล้เคียงกับโมเดล Gemma 2B จุดเด่นคือรองรับการนำไปใช้งานในอุปกรณ์หรือระบบที่มีหน่วยความจำจำกัด และให้ Throughput ของ Tokens per second ที่สูงกว่าโมเดลทั่วไป แสดงให้เห็นถึงความก้าวหน้าของงานวิจัยด้าน Deep learning ที่ใช้โมเดลแบบ non-transformer

นอกจากนี้ Google ยังออกอัปเดตโมเดล Gemma 1.1 เน้นการเพิ่มประสิทธิภาพและแก้ไขบั๊ก ผู้ที่สนใจสามารถใช้งาน Gemma และโมเดลใหม่ได้แล้วผ่านทาง Kaggle, Hugging Face และ Vertex AI Model Garden

ที่มา: https://developers.googleblog.com/2024/04/gemma-family-expands.html

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce

Cisco ออกแพตช์แก้ช่องโหว่ Zero-day บน Catalyst SD-WAN Manager ที่ถูกใช้โจมตียกระดับสิทธิ์เป็น root

Cisco ปล่อยอัปเดตด้านความปลอดภัยแก้ช่องโหว่บน Catalyst SD-WAN Manager (เดิมคือ SD-WAN vManage) หลังพบว่าถูกใช้โจมตีจริงในลักษณะ Zero-day เพื่อยกระดับสิทธิ์เป็น root บนระบบที่ได้รับผลกระทบ