“ถ้ารู้ล่วงหน้าก็คงจะดีสินะ” ประโยคนี้มักจะได้ยินกันอยู่บ่อยครั้งเวลาที่เราเจอกับปัญหาที่เราคาดไม่ถึงหรือพบเจอเหตุการณ์บางอย่างที่ไม่ได้คาดการณ์เอาไว้ เพราะเราทุกคนต่างมีสัญชาตญาณของการป้องกันตนเองจากสิ่งต่าง ๆ รอบตัว สังเกตง่าย ๆ จากการที่เราดูพยากรณ์อากาศล่วงหน้าเวลาจะออกจากบ้านหรือวางแผนการท่องเที่ยว ด้วยข้อมูลเหล่านี้จะช่วยให้เราสามารถป้องกันหรือหลีกเลี่ยงเหตุการณ์ที่เกิดขึ้น รวมถึงการเตรียมความพร้อมรับมือต่อเหตุการณ์นั้น ๆ ด้วย
ในสายงานของเทคโนโลยีเองก็คงหลีกเลี่ยงไม่ได้กับประโยคนี้เช่นกันเพราะทุกครั้งที่มีปัญหา ทีม Engineer เองก็มักจะหลุดพูดประโยคนี้ขึ้นมาบ่อย ๆ แม้ว่าองค์กรจะมีเครื่องมือในการมอนิเตอร์หลากหลายขนาดไหนก็ไม่อาจบอกได้ว่าปัญหาอะไรที่กำลังจะเกิดขึ้นหรือส่วนงานไหนที่กำลังจะเกิดปัญหา
ช่วงหลาย ๆ ปีที่ผ่านมา หลายองค์กรมีการปรับเปลี่ยนรูปแบบธุรกิจให้เป็นดิจิทัลมากขึ้น เพื่อให้ตอบสนองต่อความต้องการของลูกค้าหรือผู้ใช้บริการ รวมถึงการสร้างความแตกต่างให้เหนือกว่าคู่แข่งในตลาดเดียวกัน ดังนั้นองค์กรเหล่านั้นจึงนำเทคโนโลยีต่าง ๆ เข้ามามีบทบาทในการขับเคลื่อนธุรกิจ เพื่อสร้างบริการที่ดี และตอบสนองต่อความต้องการของลูกค้าหรือผู้ใช้บริการได้รวดเร็ว สร้างความพึงพอใจแก่ลูกค้าหรือผู้ใช้บริการ ซึ่งความท้าทายเหล่านี้มาพร้อมกับเทคโนโลยีและวิธีการด้านไอทีรูปแบบใหม่ๆ เช่น การขยาย IT Infrastructure ขึ้นไปอยู่บนคลาวด์, การปรับเปลี่ยนสถาปัตยกรรมเป็นแบบ microservices และการเลือกใช้วิธีการในการสร้างแอพพลิเคชันแบบ CI/CD เป็นต้น ทำให้เกิดสภาพแวดล้อมแบบ Hybrid (โครงสร้างอยู่บน Cloud และ On-premise) ที่มีความซับซ้อนมากขึ้นในการบริหารจัดการด้านไอที ส่งผลให้องค์กรจำต้องมีเทคโนโลยีที่ชาญฉลาดในการรับมือกับปริมาณข้อมูลมหาศาล, สามารถวิเคราะห์ปัญหา, คาดการณ์ปัญหาที่อาจเกิดขึ้น และจัดการปัญหาให้อย่างรวดเร็วและมีประสิทธิภาพ
แล้วเทคโนโลยีที่ชาญฉลาดต้องมีคุณสมบัติอย่างไรล่ะ?
อ้างอิงจาก Gartner Market Guide for AIOps Platforms ของ ปี 2021 ได้กล่าวถึงคุณสมบัติของ Platform ที่จะมาช่วยให้องค์กรสามารถบริหารจัดการด้านไอทีได้อย่างชาญฉลาด คาดการณ์ปัญหาที่จะเกิดขึ้นได้ และจัดการปัญหาได้อย่างอัตโนมัติ นั่นคือ เทคโนโลยี AIOps
AIOps มาจากคำว่า AI (Artificial Intelligence) + Ops หรือ IT Operations ง่ายๆก็คือการเอา AI หรือปัญญาประดิษฐ์ มาช่วยในการบริหารจัดการด้านไอที โดยแพลตฟอร์ม AIOps นั้นเป็นการปรับปรุงแนวทางการบริหารจัดการด้านไอที ให้มีความสามารถในการตรวจจับสิ่งผิดปกติ วิเคราะห์ข้อมูลจากข้อมูลปริมาณมหาศาล (Big Data), เชื่อมโยงความสัมพันธ์ของเหตุการณ์ต่าง ๆ, วินิจฉัยถึงสาเหตุของปัญหา (Root Cause Analysis: RCA), คาดการณ์ปัญหาที่จะเกิดขึ้นได้, แจ้งเตือนปัญหาได้อย่างทันท่วงที และมีระบบ Automate ในการจัดการปัญหา
คุณสมบัติหลักของแพลตฟอร์ม AIOps:
- การนำเข้าข้อมูลที่มีความหลากหลายมารวมกัน (Ingestion)
การที่จะนำข้อมูลมาวิเคราะห์ ย่อมต้องมีข้อมูลที่เพียงพอต่อการจะมาคำนวณและประมวลผล ยิ่งมีข้อมูลมากเท่าไหร่การวิเคราะห์ก็ย่อมมีประสิทธิภาพมากขึ้น ก็คงไม่ต่างกับการพยากรณ์อากาศ ที่นักพยากรณ์ก็ต้องเอาข้อมูลต่าง ๆ มารวบรวมทั้งค่าดัชนีความชื้น ปริมาณน้ำฝน หรือข้อมูลในอดีตหลาย ๆ ปีมาประกอบกันเพื่อพยากรณ์อากาศในแต่ละวัน ดังนั้นการที่แพลตฟอร์ม AIOps จะวินิจฉัยถึงสาเหตุของปัญหาหรือคาดการณ์ปัญหาที่จะเกิดขึ้นได้ ก็ต้องรวมรวบข้อมูลจากหลากหลายแหล่งเช่นกัน ทั้งข้อมูลโครงสร้างพื้นฐาน, ข้อมูลเครือข่าย (Network), แอพพลิเคชั่น รวมถึงข้อมูลที่ได้มาจากเครื่องมือในการมอนิเตอร์ โดยแพลตฟอร์ม AIOps จะวิเคราะห์ข้อมูลด้วยการใช้เทคโนโลยี Machine Learning ในการคำนวณและประมวลผลจากข้อมูล 2 ส่วน ได้แก่
* ข้อมูลเรียลไทม์ ณ เวลาที่มีการนำเข้าข้อมูล (streaming analytics)
* ข้อมูลในอดีตที่มีเก็บรวบรวมไว้
- แผนผังโครงสร้างของระบบ (Topology)
แพลตฟอร์ม AIOps ต้องมีความสามารถในการค้นหาและรวบรวม IT Asset และแอพพลิเคชั่นที่เกี่ยวข้องและเชื่อมโยงกัน ทั้งความสัมพันธ์ของ IT Asset และแอพพลิเคชั่น, การพึ่งพากัน หรือ การเชื่อมโยงกันในมิติอื่น ๆ ของ IT Asset และแอพพลิเคชั่น
- การเชื่อมโยงความสัมพันธ์ของเหตุการณ์ต่าง ๆ (Correlation)
การพยากรณ์อากาศ ก็ใช้หลักการการเชื่อมโยงเหตุการณ์อยู่บ่อยครั้ง เช่น เมื่อความชื้นสัมพัทธ์มีค่า 100 % นั่นแปลว่า ฝนกำลังจะตก เป็นต้น ดังนั้นการเชื่อมโยงความสัมพันธ์ของเหตุการณ์ก็เป็นสิ่งจำเป็นกับแพลตฟอร์ม AIOps เช่นกัน เมื่อมีการเชื่อมโยงความสัมพันธ์ของเหตุการณ์ในแง่ของเวลา แผนผังโครงสร้างของระบบ และเหตุการณ์ที่คล้ายคลึง ย่อมช่วยลดภาระของทีมไอทีในการจัดการเหตุการณ์ที่ซ้ำซ้อน ระบุได้ถึงต้นเหตุของปัญหา และยังสามารถคาดการณ์เหตุการณ์ในอนาคตได้ด้วยแพทเทินท์ของเหตุการณ์ในอดีต
- การประมวลผลเหตุการณ์ต่าง ๆ (Recognition)
ด้วยเทคโนโลยีของ Machine Learning และการเรียนรู้พฤติกรรมอย่างต่อเนื่อง ย่อมทำให้การประมวลผลเหตุการณ์ต่าง ๆ มีประสิทธิภาพมากขึ้น และมองเห็นถึงแนวโน้มของความผิดปกติ จากการเปรียบเทียบข้อมูลในอดีต ดังนั้นแพลตฟอร์ม AIOps จึงจำต้องมีความสามารถในการตรวจจับถึงสิ่งผิดปกติ และแจ้งเตือนปัญหาที่จะเกิดขึ้น เพื่อหลีกเลี่ยงความเสียหายที่อาจเกิดขึ้นหรือเตรียมความพร้อมในการรับมือปัญหา
- การจัดการและแก้ไขปัญหา (Remediation)
เมื่อตรวจจับได้ถึงปัญหา แพลตฟอร์ม AIOps สามารถตอบสนองต่อปัญหาตามข้อกำหนดที่ระบุไว้ หรือ อาศัยการสังเกตการณ์ในอดีต และเสนอแนะวิธีการในการจัดการปัญหาหรือตอบสนองต่อการแก้ไขปัญหาแบบอัตโนมัติ
ไม่ว่าจะเป็นการพยากรณ์อากาศหรือการคาดการณ์ปัญหาด้านไอที ก็มีรูปแบบเดียวกัน คือการนำข้อมูลที่เพียงพอจากหลากหลายแหล่ง มาวิเคราะห์ถึงแพทเทินท์ของเหตุการณ์ การเชื่อมโยงกันของเหตุการณ์ต่าง ๆ รวมถึงข้อมูลและเหตุการณ์ในอดีต เพื่อคาดการณ์ถึงเหตุการณ์ในอนาคตหรือตรวจจับความผิดปกติเมื่อเปรียบเทียบกับข้อมูลในอดีต ดังนั้นการรู้ล่วงหน้าของปัญหาด้านไอทีก็ย่อมทำได้ไม่ยาก หากองค์กรมีเครื่องมือที่เหมาะสม และทีมงานที่มีความชำนาญ & เชี่ยวชาญในด้านนี้โดยตรงและพร้อมให้คำปรึกษาในการปรับรูปแบบการบริหารจัดการด้านไอทีขององค์กรเป็น AIOps
สามารถฝากข้อมูลไว้ให้เราติดต่
หรือ สามารถติดต่อมาที่: bsm@mfec.co.th หรือ scan QR code ผ่านช่องทาง LINE OAหรือฝากข้อมูลไว้ให้เราติดต่อกลับ: https://forms.office.com/r/Vus99434wz
อ้างอิง: https://www.gartner.com/en/documents/4000217/market-guide-for-aiops-platforms
เขียนบทความโดย: นางสาวเปี่ยมณัฐดา กันทะวงศ์ MFEC Senior Presales Consultant