IBM Flashsystem

Google เปิดตัว Gemma โมเดล LLM แบบ Open-source ตัวใหม่

Google เปิดตัว Gemma โมเดล LLM แบบ Open-source ตัวใหม่ ประสิทธิภาพดีกว่า Llama-2

Credit: Google

Gemma เป็น Large Language Model (LLM) ที่ใช้การพัฒนาด้วยเทคโนโลยีและงานวิจัยเดียวกันกับโมเดล Gemini ซึ่ง Google ได้เปิดให้ Gemma เป็น Open-source แบบเต็มตัว ทำให้นักพัฒนาสามารถนำไปปรับแต่งและต่อยอดเพื่อใช้งานบนแอพพลิเคชันของตนเองได้ ปัจจุบัน Google ได้ปล่อยออกมาสองขนาดคือ Gemma 2B และ Gemma 7B ซึ่งเป็นโมเดลที่ผ่านการเทรนมาเรียบร้อยแล้ว จากผลการทดสอบ Gemma 7B สามารถเอาชนะโมเดล Llama-2 7B และ 13B ของ Meta ได้ในทุกด้าน

Gemma Benchmark
Credit: Google

นอกจากนี้ Gemma มีเครื่องมือ Toolchains สำหรับการทำ Inference และ Supervised fine-tuning (SFT) มาให้บน JAX, PyTorch และ TensorFlow โดยยังมีการร่วมมือกับ NVIDIA ในการรองรับการใช้งานโมเดลนี้บน NVIDIA RTX GPU อีกด้วย พร้อมทั้งมีการปรับแต่งการทำงานบน Google Cloud มาให้แล้ว นักพัฒนาที่สนใจสามารถเริ่มต้นใช้งาน Gemma ได้แล้วผ่านทาง Colab และ Kaggle Notebook รวมทั้ง Hugging Face และ NVIDIA Nemo

ที่มา: https://blog.google/technology/developers/gemma-open-models/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่ Cupertino, CA แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Cloudflare ยืนยัน 1.1.1.1 ล่มจากการตั้งค่าผิด ไม่ใช่การโจมตีหรือ BGP Hijack

Cloudflare ออกมาชี้แจงว่าเหตุการณ์บริการ 1.1.1.1 Resolver ล่มเมื่อวันที่ 14 กรกฎาคมที่ผ่านมา เกิดจากการตั้งค่าภายในผิดพลาด ไม่ใช่การโจมตีทางไซเบอร์หรือ BGP hijack อย่างที่หลายคนเข้าใจผิด

AWS เปิดตัวเครื่องมือพัฒนา AI และระบบจัดเก็บข้อมูล Vector ใหม่

Amazon Web Services ประกาศเปิดตัวชุดเครื่องมือใหม่สำหรับพัฒนา AI Agent พร้อมทั้ง Amazon S3 Vectors ระบบจัดเก็บข้อมูล Vector ที่ประหยัดต้นทุนได้ถึง 90%