AWS เปิดให้ใช้งาน Llama 3.3 70B บน Amazon SageMaker JumpStart

AWS ประกาศเปิดให้ใช้งานโมเดลภาษา Llama 3.3 70B จาก Meta บนแพลตฟอร์ม Amazon SageMaker JumpStart โดยโมเดลใหม่นี้มีประสิทธิภาพใกล้เคียงกับ Llama 3.1 405B แต่ใช้ทรัพยากรน้อยกว่าถึง 5 เท่า

Credit: AWS

โมเดล Llama 3.3 70B ได้รับการพัฒนาโดยใช้สถาปัตยกรรม Transformer ที่ได้รับการปรับแต่งจาก Meta พร้อมกลไก Attention Mechanism ที่ปรับปรุงใหม่ ช่วยลดต้นทุนการประมวลผลได้อย่างมีนัยสำคัญ โมเดลผ่านการฝึกฝนด้วยข้อมูลขนาดใหญ่กว่า 15 ล้านล้านโทเค็น รวมถึงตัวอย่างสังเคราะห์กว่า 25 ล้านตัวอย่าง ผลการทดสอบพบว่าสามารถทำงานได้ใกล้เคียงกับ Llama 3.1 405B โดยมีผลต่างน้อยกว่า 2% ในการทดสอบ 6 จาก 10 รายการ

ผู้ใช้งานสามารถเริ่มใช้งาน Llama 3.3 70B บน SageMaker JumpStart หรือใช้ SageMaker Python SDK นอกจากนี้ยังรองรับฟีเจอร์ขั้นสูงของ SageMaker AI เช่น Fast Model Loader สำหรับโหลดโมเดลเร็วขึ้น, Container Caching เพื่อเพิ่มประสิทธิภาพการปรับขนาด และ Scale to Zero เพื่อประหยัดค่าใช้จ่ายเมื่อไม่มีการใช้งาน

ที่มา: https://aws.amazon.com/blogs/machine-learning/llama-3-3-70b-now-available-in-amazon-sagemaker-jumpstart/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้