เมื่อระบบ IT มีความซับซ้อนมากยิ่งขึ้น การดูแลรักษาระบบเหล่านี้ให้ยังคงทำงานได้ต่อเนื่อง มีประสิทธิภาพ และส่งมอบประสบการณ์ที่ดีให้กับผู้ใช้งานได้นั้นก็กลายเป็นโจทย์ที่ท้าทายสำหรับผู้ดูแลระบบ IT ทั้งในไทยและทั่วโลก ส่งผลให้การนำ AI มาใช้ในการดูแลรักษาระบบ IT หรือที่เรียกว่า AIOps ที่สามารถดูแลรักษาระบบขนาดใหญ่และตอบสนองได้ในแบบ Real-Time นั้นกลายเป็นแนวคิดของการบริหารจัดการระบบ IT แห่งอนาคตไปแล้ว
IBM AIOps Platform คือระบบ AI สำหรับตอบโจทย์ด้านการทำ AIOps โดยเฉพาะ ที่ถูกออกแบบมาให้ครอบคลุมทั้งการดูแลรักษาระบบ IT Infrastructure และการรับประกันประสบการณ์ในการใช้งานที่ดีทั้งสำหรับลูกค้าและพนักงานภายในองค์กร โดยมีจุดเด่นด้านการรองรับการใช้งานบนระบบได้อย่างหลากหลายไม่ว่าจะเป็น On-Premises, Cloud, VM หรือ Container ก็ตาม
ในบทความนี้เราจะพาทุกท่านไปรู้จักกับแนวคิด AIOps และความสามารถของ IBM AIOps Platform ซึ่งกำลังถูกใช้งานโดยธุรกิจองค์กรขนาดใหญ่ทั่วโลกกันครับ
AIOps: ก้าวสู่ขั้นสุดของการบริหารจัดการระบบ IT ด้วยพลังของ AI
ที่ผ่านมา ธุรกิจส่วนใหญ่มักจะทำการตรวจสอบดูแลรักษาระบบ IT ด้วย Application Performance Management หรือ APM ที่มีความสามารถในการรวบรวมข้อมูลทั้งในเชิงของการทำงานเบื้องหลังภายใน IT Infrastructure ของระบบ และประสบการณ์ที่ผู้ใช้งานได้สัมผัสในการใช้งานจริง

อย่างไรก็ดี APM เองก็ยังคงมีจุดที่ควรพัฒนาหลายประการ ไม่ว่าจะเป็นการที่ระบบไม่สามารถรวมศูนย์สำหรับการบริหารจัดการ Application จำนวนมหาศาลหลายร้อยหรือหลายพันรายการได้อย่างง่ายดาย, การตรวจสอบแก้ไขปัญหาที่เกิดขึ้นในเชิงประสิทธิภาพซึ่งยังคงต้องอาศัยบุคลากรฝ่าย IT ในการจัดการปัญหาเองแบบ Manual, การรองรับ Application ที่เกิดขึ้นใหม่ในทุกๆ วันพร้อมระบบ IT Infrastructure เบื้องหลังที่เพิ่มลดขนาดอยู่ตลอด ไปจนถึงการรวบรวมข้อมูลจากระบบ Application ที่มีองค์ประกอบจำนวนมากและทำงานร่วมกันอย่างซับซ้อน
ด้วยเหตุนี้ ทำให้เทคโนโลยีอีกกลุ่มหนึ่งอย่าง Application Resource Management หรือ ARM นั้นเริ่มได้รับความสนใจมากขึ้น เพื่อให้การติดตามด้านการใช้ทรัพยากรภายในระบบ IT Infrastructure ที่มีการเพิ่มลดอย่างยืดหยุ่นให้สอดคล้องต่อความต้องการในการใช้งานที่แตกต่างกันในแต่ละช่วงขณะเป็นไปได้อย่างมีประสิทธิภาพ แต่ทั้งหมดนี้ก็ยังไม่ได้แก้ปัญหาทั้งหมดที่ APM ยังเผชิญได้อยู่ดี
AIOps จึงกลายเป็นเทคโนโลยีที่ถูกนำเสนอเพื่อตอบโจทย์ปัญหาเหล่านี้ ด้วยการนำ AI เข้าไปใช้เสริมความสามารถให้กับทั้ง APM และ ARM รวมถึงผสานทั้งสองระบบเข้าด้วยกัน ทำให้ระบบสามารถรับข้อมูลในหลากหลายรูปแบบมากขึ้นมาทำการวิเคราะห์ และตอบสนองในแบบ Real-Time ได้
โดยรวมแล้ว AIOps ที่ดีจะมีความสามารถทั้งการทำ APM และ ARM ในหนึ่งเดียว เพื่อให้ผู้ดูแลระบบ IT มีข้อมูลที่ครบถ้วนทั้งในแง่ของประสิทธิภาพ ความมั่นคงทนทาน และประสบการณ์ของผู้ใช้งาน และระบบสามารถตอบสนองต่อทุกเหตุการณ์ได้โดยอัตโนมัติด้วยข้อมูล รวมถึงสามารถติดตั้งใช้งานได้บนทุกสถาปัตยกรรมไม่ว่าจะเป็น On-Premises หรือ Cloud เพื่อตอบโจทย์การลดค่าใช้จ่ายและเพิ่มประสิทธิภาพการทำงานได้อย่างยืดหยุ่น
IBM ได้แบ่งระดับของการทำ ITOps ตั้งแต่การดูแลระบบ IT ในแบบดั้งเดิมจนก้าวมาสู่การใช้ AIOps ได้อย่างเต็มรูปแบบด้วยกัน 5 ระดับ ดังนี้
- จัดการระบบแบบอัตโนมัติได้เพียงบางระบบเป็นก้าวแรกในการปรับจากการดูแลระบบ IT แบบ Manual มาใช้เครื่องมืออัตโนมัติในการจัดการบางระบบที่สำคัญเท่านั้น
- ใช้ APM ดูแลเพียงบางระบบเริ่มมีการนำ APM มาใช้เพื่อจัดการด้านประสิทธิภาพและประสบการณ์สำหรับระบบงานที่มีความสำคัญ
- ใช้ ARM ดูแลเพียงบางระบบเริ่มมีการนำ ARM มาใช้เพื่อจัดการด้านทรัพยากรสำหรับระบบงานที่มีความสำคัญ
- ใช้ APM และ ARM ร่วมกันเริ่มมีการใช้งานทั้ง APM และ ARM ในการจัดการกับหลายระบบมากยิ่งขึ้น ลดปริมาณของเครื่องมือที่ต้องใช้ดูแลระบบในภาพรวมลงได้
- ใช้ AIOps ดูแลทุกระบบร่วมกันใช้ AI ในการทำงานด้าน APM และ ARM ทั้งหมด ทำให้ระบบ AI เดียวสามารถครอบคลุมการจัดการได้ครบทุกระบบในองค์กร และบริหารจัดการได้จากศูนย์กลางอย่างแท้จริง
จากแนวทางดังกล่าวจะเห็นได้ว่าการใช้ AIOps นี้ถือเป็นปลายทางในปัจจุบันสำหรับเทรนด์ด้านการบริหารจัดการระบบ IT หรือ ITOps ที่จะช่วยให้การดูแลรักษาระบบ IT ที่มีความหลากหลายและซับซ้อนสำหรับรองรับ Application จำนวนหลายร้อยหรือหลายพันรายการเป็นไปได้อย่างมีประสิทธิภาพ ยืดหยุ่น และรองรับการเติบโตในอนาคตได้อย่างต่อเนื่อง
Application Performance Observability ก้าวถัดไปของการทำ Application Performance Monitoring
การมาของ AIOps นี้จะช่วยวิวัฒน์ให้การทำ Application Performance Monitoring เปลี่ยนไปสู่ภาพของการทำ Application Performance Observability แทน ซึ่งจะช่วยให้การดูแลรักษาระบบ Application ภายในองค์กรเป็นไปได้อย่างสมบูรณ์ยิ่งขึ้นด้วยความสามารถดังต่อไปนี้
- รวบรวมข้อมูลอย่างครบถ้วน ด้วยการเก็บรายละเอียดข้อมูลชี้วัดค่าต่างๆ Log, Trace, Dependency, Relationship และ Configuration State อย่างต่อเนื่อง เพื่อให้มีข้อมูลของความเปลี่ยนแปลงที่เกิดขึ้นทั้งหมดในระบบ
- มีการเก็บข้อมูลอย่างถูกต้อง เพื่อให้มั่นใจว่าทุกๆ ข้อมูลของเหตุการณ์ที่เกิดขึ้นในระบบจะถูกบันทึกเอาไว้ทั้งหมด ไม่ได้เก็บเป็นเพียงแค่ข้อมูลตัวอย่างบางส่วนหรือข้อมูลเชิงสถิติเท่านั้น
- ติดตั้งใช้งานได้อย่างอัตโนมัติ โดยสามารถทำการตรวจสอบถึงการทำงานในแต่ละ Container เพื่อทำการรวบรวมข้อมูลที่เหมาะสมและจำเป็นได้ด้วยตนเอง โดยไม่ต้องให้ผู้ดูแลระบบทำการกำหนดค่าแต่อย่างใด
- วิเคราะห์และค้นหาข้อมูลได้อย่างแม่นยำ เพื่อให้การนำข้อมูลปริมาณมหาศาลที่ถูกรวบรวมเอาไว้มาใช้เป็นไปได้อย่างมีประสิทธิภาพ
- จัดเก็บข้อมูลขนาดใหญ่ได้ในแบบ Real-Time โดยมีการออกแบบระบบเบื้องหลังให้รองรับต่อความต้องการนี้ได้
- รองรับวิธีการเชื่อมต่อกับระบบอื่นๆ ได้อย่างหลากหลาย เพื่อให้สามารถทำการรวบรวมข้อมูลและทำงานร่วมกับระบบต่างๆ ได้อย่างครอบคลุม โดยเฉพาะอย่างยิ่งเมื่อองค์กรมีการใช้งานระบบใหม่ๆ เพิ่มเติมในอนาคต
- วิเคราะห์หาสาเหตุของปัญหาได้จาก AI และการวิเคราะห์ความสัมพันธ์ เพื่อให้สามารถค้นหาเหตุการณ์ผิดปกติและข้อมูลแวดล้อมที่เกี่ยวข้องได้อย่างรวดเร็วและแม่นยำที่สุด
IBM AIOps Platform
โซลูชัน IBM AIOps ได้ถูกออกแบบและพัฒนามาตามแนวคิดของการทำ Application Performance Observability เพื่อให้ธุรกิจองค์กรสามารถนำไปปรับใช้และวางรากฐานของการดูแลรักษาระบบ Application สำคัญได้อย่างครบถ้วนและเป็นอัตโนมัติได้ทันที โดยภายใน IBM AIOps Platform จะรวบรวมเอาสองเทคโนโลยีหลักเข้าไว้ด้วยกัน ดังนี้
1. Instana – Observability Platform
Instana คือโซลูชัน APM แรกที่สามารถทำงานได้แบบอัตโนมัติอย่างครบวงจรซึ่งถูกออกแบบมาสำหรับ Application ที่ใช้สถาปัตยกรรมแบบ Microservices และ Cloud-Native โดยเฉพาะ โดยมีความสามารถที่โดดเด่นได้แก่

- Enterprise Observability วิเคราะห์จำแนกเหตุการณ์แวดล้อมโดยอัตโนมัติเพื่อค้นหาสาเหตุ และนำเสนอวิธีการแก้ไขปัญหาที่เหมาะสม
- Application & Services Monitoring สามารถวิเคราะห์ข้อมูลประสิทธิภาพของระบบได้ในแบบ Real-Time โดยมองเห็นถึงความสัมพันธ์ของระบบย่อยภายในทั้งหมด
- Websites End User Monitoring รวบรวมข้อมูลประสบการณ์ในฝั่งของผู้ใช้งานเพื่อนำมาวิเคราะห์หาปัญหาและสาเหตุเชิงประสบการณ์ในการส่งมอบระบบได้
- Infrastructure, Containers & Kubernetes Monitoring สามารถตรวจสอบและบริหารจัดการระบบที่เกี่ยวข้องกับ Container ได้อย่างครอบคลุมในระดับรายวินาที
- Performance & Trace Analytics ทำการวิเคราะห์รวบรวมข้อมูลเชิงประสิทธิภาพในแบบครบวงจร
- Alerting & Root Cause Analysis ทำการแจ้งเตือนพร้อมนำเสนอข้อมูลผลการวิเคราะห์หาสาเหตุของปัญหาพร้อมข้อมูลแวดล้อมที่เกี่ยวข้อง
- Dev Pipeline & CI/CD Feedback วิเคราะห์เปรียบเทียบระหว่าง Software รุ่นก่อนหน้าและรุ่นล่าสุด เพื่อให้เห็นถึงสาเหตุของปัญหาและตัดสินใจ Roll Back หรือ Release ได้ง่ายขึ้น
- Service Dependencies & Context วิเคราะห์ข้อมูลในระดับ Dependency ของระบบเพื่อให้เข้าใจปัญหาได้อย่างแม่นยำ
- Use Case-Based SmartAlerts ทำการแจ้งเตือนถึง Best Practice และ Configuration ที่เหมาะสมโดยอัตโนมัติต่อการใช้งานระบบในแต่ละรูปแบบ
ผู้ที่สนใจรายละเอียดเพิ่มเติมเกี่ยวกับ Instana สามารถศึกษาข้อมูลได้ที่ https://www.ibm.com/cloud/instana
2. Turbonomic – Application Resource Management
Turbonomic คือระบบ ARM ที่ขับเคลื่อนด้วย AI เพื่อใช้ในการปรับปรุงระบบในเชิงประสิทธิภาพ การบังคับใช้ข้อกำหนดกฎหมาย และการควบคุมค่าใช้จ่ายไปพร้อมๆ กัน โดย Turbonomic จะทำการตรวจสอบและบริหารจัดการระบบเบื้องหลัง Application ทั้งหมดโดยอัตโนมัติ ทำให้การบริหารจัดการทรัพยากรภายในระบบให้สอดคล้องต่อความต้องการในการใช้งานนั้นเกิดขึ้นอยู่ตลอดเวลาอย่างต่อเนื่อง

ความสามารถของ Turbonomic ที่น่าสนใจนั้นได้แก่
- Comprehensive Visibility ระบบจะทำการวิเคราะห์หาความสัมพันธ์ระหว่าง Container, VM, Cloud, Server, Storage, Network และอื่นๆ ที่มีการใช้งานภายใน Application ทั้งหมด เพื่อให้สามารถบริหารจัดการ Resource Supply Chain ได้อย่างแม่นยำ
- Application-Driven Prioritization สามารถจัดระดับความสำคัญของ Application และ Transaction ที่เกิดขึ้นในระบบ พร้อมวิเคราะห์หาความเสี่ยงด้านประสิทธิภาพในระบบได้
- Analytics & Prescribed Actions สามารถนำเสนอแนวทางในการป้องกันความเสี่ยงที่จะเกิดปัญหาด้านการขาดแคลนทรัพยากรของระบบได้อย่างแม่นยำ พร้อมเสนอวิธีการแก้ไขปัญหาแบบอัตโนมัติให้พร้อมใช้งานได้ภายในคลิกเดียว
ผู้ที่สนใจรายละเอียดเพิ่มเติมเกี่ยวกับ Turbonomic สามารถศึกษาข้อมูลได้ที่ https://www.ibm.com/cloud/turbonomic
เข้าร่วม Webinar เพื่อทำความเข้าใจเพิ่มเติมเกี่ยวกับ IBM AIOps
เพื่อให้ทุกท่านที่สนใจในเทคโนโลยี AIOps ได้เห็นภาพกันมากขึ้น ทางทีมงาน Metro Connect ร่วมกับ IBM จึงได้จัดงาน Webinar หัวข้อ Automate IT Operations ในวันที่ 24 มีนาคม 2565 เวลา 10:00 – 11:30 น. เพื่อเจาะลึกถึงโซลูชันและแสดงตัวอย่างการใช้งานจริงให้ทุกท่านได้รับชมกัน โดยผู้ที่สนใจสามารถลงทะเบียนได้โดยไม่มีค่าใช้จ่ายที่ https://tinyurl.com/ybvz5utz
สนใจ IBM AIOps Platform สามารถติดต่อทีมงาน Metro Connect ได้ทันที
สำหรับผู้ที่สนใจโซลูชัน IBM AIOps Platform สามารถติดต่อทีมงาน Metro Connect ได้ทันทีที่ MCCIBMSW@METROCONNECT.CO.TH