Google เปิดตัว Gemma โมเดล LLM แบบ Open-source ตัวใหม่

Google เปิดตัว Gemma โมเดล LLM แบบ Open-source ตัวใหม่ ประสิทธิภาพดีกว่า Llama-2

Credit: Google

Gemma เป็น Large Language Model (LLM) ที่ใช้การพัฒนาด้วยเทคโนโลยีและงานวิจัยเดียวกันกับโมเดล Gemini ซึ่ง Google ได้เปิดให้ Gemma เป็น Open-source แบบเต็มตัว ทำให้นักพัฒนาสามารถนำไปปรับแต่งและต่อยอดเพื่อใช้งานบนแอพพลิเคชันของตนเองได้ ปัจจุบัน Google ได้ปล่อยออกมาสองขนาดคือ Gemma 2B และ Gemma 7B ซึ่งเป็นโมเดลที่ผ่านการเทรนมาเรียบร้อยแล้ว จากผลการทดสอบ Gemma 7B สามารถเอาชนะโมเดล Llama-2 7B และ 13B ของ Meta ได้ในทุกด้าน

Gemma Benchmark
Credit: Google

นอกจากนี้ Gemma มีเครื่องมือ Toolchains สำหรับการทำ Inference และ Supervised fine-tuning (SFT) มาให้บน JAX, PyTorch และ TensorFlow โดยยังมีการร่วมมือกับ NVIDIA ในการรองรับการใช้งานโมเดลนี้บน NVIDIA RTX GPU อีกด้วย พร้อมทั้งมีการปรับแต่งการทำงานบน Google Cloud มาให้แล้ว นักพัฒนาที่สนใจสามารถเริ่มต้นใช้งาน Gemma ได้แล้วผ่านทาง Colab และ Kaggle Notebook รวมทั้ง Hugging Face และ NVIDIA Nemo

ที่มา: https://blog.google/technology/developers/gemma-open-models/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้