Google เปิดตัว Gemma โมเดล LLM แบบ Open-source ตัวใหม่

Google เปิดตัว Gemma โมเดล LLM แบบ Open-source ตัวใหม่ ประสิทธิภาพดีกว่า Llama-2

Credit: Google

Gemma เป็น Large Language Model (LLM) ที่ใช้การพัฒนาด้วยเทคโนโลยีและงานวิจัยเดียวกันกับโมเดล Gemini ซึ่ง Google ได้เปิดให้ Gemma เป็น Open-source แบบเต็มตัว ทำให้นักพัฒนาสามารถนำไปปรับแต่งและต่อยอดเพื่อใช้งานบนแอพพลิเคชันของตนเองได้ ปัจจุบัน Google ได้ปล่อยออกมาสองขนาดคือ Gemma 2B และ Gemma 7B ซึ่งเป็นโมเดลที่ผ่านการเทรนมาเรียบร้อยแล้ว จากผลการทดสอบ Gemma 7B สามารถเอาชนะโมเดล Llama-2 7B และ 13B ของ Meta ได้ในทุกด้าน

Gemma Benchmark
Credit: Google

นอกจากนี้ Gemma มีเครื่องมือ Toolchains สำหรับการทำ Inference และ Supervised fine-tuning (SFT) มาให้บน JAX, PyTorch และ TensorFlow โดยยังมีการร่วมมือกับ NVIDIA ในการรองรับการใช้งานโมเดลนี้บน NVIDIA RTX GPU อีกด้วย พร้อมทั้งมีการปรับแต่งการทำงานบน Google Cloud มาให้แล้ว นักพัฒนาที่สนใจสามารถเริ่มต้นใช้งาน Gemma ได้แล้วผ่านทาง Colab และ Kaggle Notebook รวมทั้ง Hugging Face และ NVIDIA Nemo

ที่มา: https://blog.google/technology/developers/gemma-open-models/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce

Cisco ออกแพตช์แก้ช่องโหว่ Zero-day บน Catalyst SD-WAN Manager ที่ถูกใช้โจมตียกระดับสิทธิ์เป็น root

Cisco ปล่อยอัปเดตด้านความปลอดภัยแก้ช่องโหว่บน Catalyst SD-WAN Manager (เดิมคือ SD-WAN vManage) หลังพบว่าถูกใช้โจมตีจริงในลักษณะ Zero-day เพื่อยกระดับสิทธิ์เป็น root บนระบบที่ได้รับผลกระทบ