Firmware ระบบ Switchgear: หนึ่งเคล็ดลับที่ทำให้ Data Center ของ AWS ทนทานกว่า Data Center ทั่วไป

John Hamilton ผู้ดำรงตำแหน่ง VP แห่ง Amazon Web Services (AWS) ได้ออกมาเขียนใน Blog ส่วนตัวของเขาถึงเหตุการณ์ที่สายการบินรายใหญ่แห่งหนึ่งไฟดับจนเกิดปัญหากับการให้บริการเป็นวงกว้างก่อนหน้านี้ ว่าจุดหนึ่งที่ทำให้ Data Center ของ AWS แตกต่างกับ Data Center ขององค์กรทั่วไปนั้นก็คือ Firmware ของระบบ Switchgear ที่ทำให้ Data Center ของ AWS นั้นมี Uptime ที่สูงกว่าอย่างชัดเจน

Credit: Wikipedia

 

Hamilton อธิบายว่า Firmware ของระบบ Switchgear ส่วนใหญ่นั้นถูกออกแบบมาเพื่อปกป้องไม่ให้ระบบ Power Generator ขององค์กรพังในกรณีที่เกิดไฟดับขึ้นมาจริงๆ แต่ในมุมของ AWS ที่ต้องให้บริการ Cloud แก่องค์กรทั่วโลกนั้นกลับมองว่าข้อมูลและการทำงานของระบบทั้งหมดภายใน Data Center นั้นมีความสำคัญกว่า Power Generator เป็นอย่างมาก ทำให้ AWS นั้นต้องทำการออกแบบและพัฒนาระบบ Firmware ของ Switchgear ใหม่เพื่อตอบโจทย์นี้โดยเฉพาะ เพราะถึงแม้ระบบ Power Generator มูลค่า 1 ล้านเหรียญจะพังไปเมื่อเกิดเหตุในแต่ละครั้ง แต่ค่าใช้จ่ายเหล่านี้ก็ยังถือว่าถูกมากเมื่อเทียบกับ Downtime ที่จะเกิดขึ้นกับบริการต่างๆ หรือข้อมูลที่อาจสูญหายในระหว่างที่ไฟดับนั่นเอง

อีกสาเหตุหนึ่งที่ AWS ต้องพัฒนาระบบ Firmware เหล่านี้เอง ก็เพราะเมื่อ AWS ได้อธิบายเหตุผลเหล่านี้แก่เหล่าผู้ผลิต Swithgear เพื่อให้พัฒนา Firmware ให้ตรงกับความต้องการของ AWS แล้ว เหล่าผู้ผลิตเหล่านั้นก็ออกมาปฏิเสธกันทั้งหมดด้วย

Hamilton ได้ออกมาสรุปทิ้งท้ายว่า เขาโชคดีที่ได้ทำงานในธุรกิจผู้ให้บริการขนาดใหญ่ที่การทำวิศวกรรมเพื่อแก้ไขปัญหาที่เกิดได้ยากแม้เพียงปัญหาเดียวก็ยังถือว่าคุ้มค่าต่อการลงทุน ทำให้เขาสามารถแก้ไขปัญหาและหลีกเลี่ยงความเสี่ยงเหล่านี้ได้

 

ที่มา: http://www.datacenterknowledge.com/archives/2017/04/07/how-amazon-prevents-data-center-outages-like-deltas-150m-meltdown/

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้