AWS เปิดตัว Amazon EC2 Capacity Blocks for ML

AWS เปิดตัว Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML ให้ผู้ใช้งานสามารถจองทรัพยากร GPU ได้

Credit: AWS

Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML เป็นบริการใหม่ที่ช่วยให้องค์กรสามารถจองทรัพยากร GPU เพื่อใช้งานในระยะสั้น สำหรับระบบ Machine Learning ต่างๆ เช่น Large Language Model ซึ่งจำเป็นต้องทำงานบนระบบ GPS ขนาดใหญ่ โดยจะช่วยลดค่าใช้จ่ายที่ต้องเสียไปในการใช้งาน Instance แบบระยะยาวได้ บริการนี้มี Amazon EC2 P5 instances ซึ่งติดตั้ง NVIDIA H100 Tensor Core GPU ให้ใช้งาน รองรับการใช้งานตั้งแต่ 1 – 64 Instance ซึ่งแต่ละ Instance ประกอบด้วย GPU จำนวน 8 ตัว ผู้ใช้งานสามารถสำรองระยะเวลาการใช้งานได้สูงสุด 14 วัน โดยสามารถขอเพิ่มได้ครั้งละ 1 วัน และจองได้ไม่เกิน 8 อาทิตย์ล่วงหน้า หลังจากหมดระยะเวลาที่กำหนด ระบบจะทำการปิด Instance ให้แบบอัตโนมัติ

บริการนี้ช่วยตอบโจทย์องค์กรที่สามารถประเมินระยะเวลาการใช้งานและจำนวน GPU ที่ต้องการได้ ขณะเดียวกันก็จะช่วยให้ AWS สามารถจัดสรรบริการ GPU ที่มีอยู่อย่างจำกัดได้ดียิ่งขึ้น อย่างไรก็ตามค่าใช้จ่ายบริการนี้จะขึ้นอยู่กับอุปสงค์และอุปทานของการใช้งาน GPU ในแต่ละช่วงเวลา โดย AWS เริ่มเปิดให้ใช้งานบริการนี้แล้วใน Region US East (Ohio) และจะขยายบริการไปยัง Region อื่นๆในอนาคต

ที่มา: https://techcrunch.com/2023/11/01/new-aws-service-lets-customers-rent-nvidia-gpus-for-quick-ai-projects/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Elastic 9.4 ออกแล้ว

Elastic ได้ออกมาประกาศเปิดตัว Elastic 9.4 อย่างเป็นทางการ โดยเพิ่มความสามารถในการตรวจสอบการทำงานของ Context Engineering, Application และ Infrastructure เพิ่มเติม, เสริม AI ในการรักษาความมั่นคงปลอดภัย และเพิ่มความสามารถอื่นๆ อีกมากมาย ดังนี้

Extreme Networks เปิดตัว Wi-Fi 7 AP รุ่นใหม่ พร้อม Agentic AI สำหรับบริหารจัดการระบบเครือข่ายแบบอัตโนมัติ

Extreme Networks ได้ออกมาประกาศถึงอัปเดตครั้งใหญ่ โดยเปิดตัว Wi-Fi 7 Access Point รุ่นใหม่ล่าสุด 5 รุ่น พร้อมนวัตกรรมใหม่ในการบริหารจัดการระบบเครือข่ายด้วย AI Agent เพื่อดูแลรักษาระบบเครือข่ายขององค์กรให้ทำงานได้อย่างต่อเนื่องโดยอัตโนมัติ