AWS เปิดให้ใช้งาน Llama 3.3 70B บน Amazon SageMaker JumpStart

AWS ประกาศเปิดให้ใช้งานโมเดลภาษา Llama 3.3 70B จาก Meta บนแพลตฟอร์ม Amazon SageMaker JumpStart โดยโมเดลใหม่นี้มีประสิทธิภาพใกล้เคียงกับ Llama 3.1 405B แต่ใช้ทรัพยากรน้อยกว่าถึง 5 เท่า

Credit: AWS

โมเดล Llama 3.3 70B ได้รับการพัฒนาโดยใช้สถาปัตยกรรม Transformer ที่ได้รับการปรับแต่งจาก Meta พร้อมกลไก Attention Mechanism ที่ปรับปรุงใหม่ ช่วยลดต้นทุนการประมวลผลได้อย่างมีนัยสำคัญ โมเดลผ่านการฝึกฝนด้วยข้อมูลขนาดใหญ่กว่า 15 ล้านล้านโทเค็น รวมถึงตัวอย่างสังเคราะห์กว่า 25 ล้านตัวอย่าง ผลการทดสอบพบว่าสามารถทำงานได้ใกล้เคียงกับ Llama 3.1 405B โดยมีผลต่างน้อยกว่า 2% ในการทดสอบ 6 จาก 10 รายการ

ผู้ใช้งานสามารถเริ่มใช้งาน Llama 3.3 70B บน SageMaker JumpStart หรือใช้ SageMaker Python SDK นอกจากนี้ยังรองรับฟีเจอร์ขั้นสูงของ SageMaker AI เช่น Fast Model Loader สำหรับโหลดโมเดลเร็วขึ้น, Container Caching เพื่อเพิ่มประสิทธิภาพการปรับขนาด และ Scale to Zero เพื่อประหยัดค่าใช้จ่ายเมื่อไม่มีการใช้งาน

ที่มา: https://aws.amazon.com/blogs/machine-learning/llama-3-3-70b-now-available-in-amazon-sagemaker-jumpstart/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Ericsson เปิดตัวโซลูชัน AI in RAN ยกระดับ 5G ไปอีกขั้นด้วยโครงข่ายที่ฝัง AI อยู่ภายใน

Ericsson เปิดตัว AI in RAN ซอฟต์แวร์แบบ Subscription ล่าสุดที่ฝัง AI ลงในแพลตฟอร์ม Radio Access Network (RAN) โดยตรง …

ERP on Cloud เทรนด์ใหม่อุตสาหกรรมการผลิตไทย : Digiwin Thailand จับมือ GWS CLOUD โชว์โซลูชันในงาน ME EXPO 2026 [Guest Post]

Digiwin Thailand และ GWS CLOUD เตรียมเข้าร่วมจัดแสดงโซลูชัน “Digiwin ERP on GWS CLOUD” ซึ่งถือเป็นเทรนด์ใหม่ในอุตสาหกรรมการผลิตไทย เป็นครั้งแรก ในงาน ME …