Google เปิดตัว Gemma โมเดล LLM แบบ Open-source ตัวใหม่ ประสิทธิภาพดีกว่า Llama-2

Gemma เป็น Large Language Model (LLM) ที่ใช้การพัฒนาด้วยเทคโนโลยีและงานวิจัยเดียวกันกับโมเดล Gemini ซึ่ง Google ได้เปิดให้ Gemma เป็น Open-source แบบเต็มตัว ทำให้นักพัฒนาสามารถนำไปปรับแต่งและต่อยอดเพื่อใช้งานบนแอพพลิเคชันของตนเองได้ ปัจจุบัน Google ได้ปล่อยออกมาสองขนาดคือ Gemma 2B และ Gemma 7B ซึ่งเป็นโมเดลที่ผ่านการเทรนมาเรียบร้อยแล้ว จากผลการทดสอบ Gemma 7B สามารถเอาชนะโมเดล Llama-2 7B และ 13B ของ Meta ได้ในทุกด้าน

Credit: Google
นอกจากนี้ Gemma มีเครื่องมือ Toolchains สำหรับการทำ Inference และ Supervised fine-tuning (SFT) มาให้บน JAX, PyTorch และ TensorFlow โดยยังมีการร่วมมือกับ NVIDIA ในการรองรับการใช้งานโมเดลนี้บน NVIDIA RTX GPU อีกด้วย พร้อมทั้งมีการปรับแต่งการทำงานบน Google Cloud มาให้แล้ว นักพัฒนาที่สนใจสามารถเริ่มต้นใช้งาน Gemma ได้แล้วผ่านทาง Colab และ Kaggle Notebook รวมทั้ง Hugging Face และ NVIDIA Nemo
ที่มา: https://blog.google/technology/developers/gemma-open-models/