รายงาน Uptime Institute ชี้ดาต้าเซ็นเตอร์ล่มน้อยลง แต่เมื่อล่มแต่ละครั้งรุนแรงขึ้นและค่าเสียหายสูงขึ้น

Uptime Institute เผยรายงาน Annual Outage Analysis ฉบับล่าสุด ระบุว่าดาต้าเซ็นเตอร์มีความน่าเชื่อถือดีขึ้นในช่วง 5 ปีที่ผ่านมา แต่เมื่อเกิดเหตุขัดข้องขึ้นจริง กลับใช้เวลาแก้ไขนานขึ้นและมีค่าเสียหายสูงขึ้นอย่างมีนัยสำคัญ

จากผลสำรวจพบว่ามีเพียงครึ่งหนึ่งของผู้ให้บริการที่รายงานว่าเคยประสบเหตุขัดข้องระดับร้ายแรงในช่วง 3 ปีที่ผ่านมา ซึ่งถือเป็นตัวเลขต่ำสุดนับตั้งแต่ปี 2020 และสะท้อนแนวโน้มที่ดีขึ้นอย่างต่อเนื่อง อย่างไรก็ตาม อัตราการลดลงของเหตุขัดข้องกลับชะลอตัวลง ซึ่งชี้ว่าความพยายามปรับปรุง Resiliency ที่ทำอยู่อาจเริ่มถึงจุดกลับตัวแล้ว ทั้งนี้ ปัจจัยที่ฉุดรั้งการปรับปรุงไม่ได้เกิดจากความประมาท แต่เป็นเพราะความซับซ้อนของระบบที่เพิ่มขึ้นจากการ Deploy โครงสร้างพื้นฐานที่ใช้พลังงานสูงสำหรับงาน AI Training และ Inference โดย Uptime Institute เตือนว่า Rack Density ที่สูงขึ้น ภาระงานที่ผันผวน และการใช้พลังงานใกล้ขีดจำกัด อาจเพิ่มความเสี่ยงของการล้มเหลวแบบลูกโซ่ได้

ปัญหาด้านระบบไฟฟ้ายังคงเป็นสาเหตุหลักของเหตุขัดข้องระดับรุนแรง แต่สัดส่วนลดลงจาก 54% ในปี 2024 เหลือ 45% ในปี 2025 ขณะเดียวกันการขาดแคลนอุปกรณ์โครงสร้างพื้นฐานที่สำคัญ เช่น Generator, Switchgear และ Transformer ทำให้ผู้ให้บริการบางรายต้องหันไปใช้อุปกรณ์มือสองหรืออุปกรณ์ที่ยังไม่ผ่านการพิสูจน์ ซึ่งเชื่อว่าเป็นปัจจัยที่ทำให้เกิดเหตุขัดข้องในบางดาต้าเซ็นเตอร์ นอกจากนี้ ปัญหาจากภายนอกอย่างสายไฟเบอร์ขาดและเครือข่ายขัดข้องก็กลายเป็นสาเหตุที่พบบ่อยขึ้น โดย Networking ยังคงเป็นปัจจัยที่ถูกอ้างถึงมากที่สุดในกรณี IT Service Disruption ถึงแม้ว่าตัวดาต้าเซ็นเตอร์เองจะไม่ได้ล่มก็ตาม

ข่าวดีคือการนำ Software-defined Networking และระบบ Automated Traffic Rerouting มาใช้อย่างแพร่หลาย ช่วยลดผลกระทบจากเหตุขัดข้องเฉพาะจุดได้ดีขึ้น โดย 20% ของผู้ตอบแบบสำรวจระบุว่าไม่เคยเกิด IT Service Outage เลยในช่วง 3 ปีที่ผ่านมา ซึ่งดีขึ้น 9% จากปี 2024 อย่างไรก็ตาม เมื่อเหตุขัดข้องเกิดขึ้น กลับใช้เวลาแก้ไขนานขึ้น โดยสัดส่วนของเหตุขัดข้องที่ยาวนานกว่า 48 ชั่วโมงเพิ่มขึ้นเป็นปีที่สองติดต่อกัน และ 1 ใน 5 ของเหตุขัดข้องมีค่าเสียหายรวมเกิน 1 ล้านดอลลาร์ ซึ่ง Uptime Institute คาดว่าตัวเลขนี้จะยังคงเพิ่มสูงขึ้นต่อไปในอนาคต

ที่มา: https://www.theregister.com/on-prem/2026/05/13/datacenters-are-having-fewer-but-bigger-failures/5239951

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Microsoft AI เปิดตัว 7 โมเดลใหม่ตระกูล MAI พร้อม Frontier Tuning สำหรับองค์กร

Microsoft AI เปิดตัวโมเดล AI ตระกูล MAI จำนวน 7 รุ่น ครอบคลุม Reasoning, Coding, Image, Transcription และ …

JupiterOne เปิดตัว Continuous Controls Monitoring สำหรับทดสอบมาตรการควบคุมความมั่นคงปลอดภัยด้วยข้อมูลสินทรัพย์แบบเรียลไทม์

JupiterOne ผู้ให้บริการแพลตฟอร์มจัดการความเสี่ยงด้านปัญญาประดิษฐ์ ประกาศเปิดตัว “JupiterOne Continuous Controls Monitoring” (CCM) ผลิตภัณฑ์ใหม่ที่ทำหน้าที่ทดสอบว่ามาตรการควบคุมความมั่นคงปลอดภัยและการปฏิบัติตามกฎระเบียบกำลังทำงานอย่างถูกต้องบนสภาพแวดล้อมคลาวด์ บริการซอฟต์แวร์ และไฮบริดหรือไม่