Meta ได้ประกาศเปิดตัว Llama 3 โมเดล AI รุ่นใหม่ ประสิทธิภาพดีกว่า GPT-3.5, Claude 3 Sonnet และ Mistral

Llama 3 ประกอบด้วยโมเดลย่อย 2 รุ่น ได้แก่ Llama 3 8B และ Llama 3 70B พารามิเตอร์ ถูกเทรนด้วย GPU Cluster พิเศษขนาด 24,000 GPU ใช้ข้อมูล Dataset ที่มีขนาดใหญ่ถึง 15 ล้านล้านโทเคน ซึ่งใหญ่กว่าข้อมูลที่ใช้เทรน Llama 2 ถึง 7 เท่า นอกจากนี้ยังมีข้อมูลภาษาอื่นนอกเหนือจากภาษาอังกฤษถูกนำมาเทรนด้วยถึง 30 ภาษา โดย Meta กล่าวว่า Llama 3 เป็นโมเดลที่มีประสิทธิภาพสูงสุดในกลุ่ม Open Model ในตอนนี้ มีการทดสอบตาม AI Benchmark หลายตัว เช่น MMLU, ARC และ DROP เพื่อใช้วัดความสามารถในหลายด้าน Llama 3 8B สามารถเอาชนะโมเดลหลายตัว เช่น Mistral 7B และ Gemma 7B ส่วน Llama 3 70B สามารถเอาชนะได้ทั้ง GPT-3.5, Gemini 1.5 Pro และ Claude 3 Sonnet

ปัจจุบันโมเดล Llama 3 เปิดให้ผู้ใช้งานทั่วไปสามารถดาวน์โหลดไปใช้งานได้แล้ว โดย Meta ยังนำโมเดลนี้ไปอัปเกรดให้กับบริการ Meta AI assistant บน Facebook, Instagram และ WhatsApp อีกด้วย และในอนาคตจะมีการเปิดให้บริการผ่านผู้ให้บริการ Cloud หลายราย ได้แก่ AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM และ Snowflake นอกจากนี้จะมีการเปิดตัวโมเดลขนาด 400B พารามิเตอร์ออกมาในอนาคต
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






