AWS เปิดตัว Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML ให้ผู้ใช้งานสามารถจองทรัพยากร GPU ได้
Amazon Elastic Compute Cloud (EC2) Capacity Blocks for ML เป็นบริการใหม่ที่ช่วยให้องค์กรสามารถจองทรัพยากร GPU เพื่อใช้งานในระยะสั้น สำหรับระบบ Machine Learning ต่างๆ เช่น Large Language Model ซึ่งจำเป็นต้องทำงานบนระบบ GPS ขนาดใหญ่ โดยจะช่วยลดค่าใช้จ่ายที่ต้องเสียไปในการใช้งาน Instance แบบระยะยาวได้ บริการนี้มี Amazon EC2 P5 instances ซึ่งติดตั้ง NVIDIA H100 Tensor Core GPU ให้ใช้งาน รองรับการใช้งานตั้งแต่ 1 – 64 Instance ซึ่งแต่ละ Instance ประกอบด้วย GPU จำนวน 8 ตัว ผู้ใช้งานสามารถสำรองระยะเวลาการใช้งานได้สูงสุด 14 วัน โดยสามารถขอเพิ่มได้ครั้งละ 1 วัน และจองได้ไม่เกิน 8 อาทิตย์ล่วงหน้า หลังจากหมดระยะเวลาที่กำหนด ระบบจะทำการปิด Instance ให้แบบอัตโนมัติ
บริการนี้ช่วยตอบโจทย์องค์กรที่สามารถประเมินระยะเวลาการใช้งานและจำนวน GPU ที่ต้องการได้ ขณะเดียวกันก็จะช่วยให้ AWS สามารถจัดสรรบริการ GPU ที่มีอยู่อย่างจำกัดได้ดียิ่งขึ้น อย่างไรก็ตามค่าใช้จ่ายบริการนี้จะขึ้นอยู่กับอุปสงค์และอุปทานของการใช้งาน GPU ในแต่ละช่วงเวลา โดย AWS เริ่มเปิดให้ใช้งานบริการนี้แล้วใน Region US East (Ohio) และจะขยายบริการไปยัง Region อื่นๆในอนาคต