[Guest Post] AIOps เทคโนโลยีที่ช่วยให้รู้ปัญหาด้านไอทีล่วงหน้าได้เหมือนกับการพยากรณ์อากาศ

“ถ้ารู้ล่วงหน้าก็คงจะดีสินะ” ประโยคนี้มักจะได้ยินกันอยู่บ่อยครั้งเวลาที่เราเจอกับปัญหาที่เราคาดไม่ถึงหรือพบเจอเหตุการณ์บางอย่างที่ไม่ได้คาดการณ์เอาไว้ เพราะเราทุกคนต่างมีสัญชาตญาณของการป้องกันตนเองจากสิ่งต่าง ๆ รอบตัว สังเกตง่าย ๆ จากการที่เราดูพยากรณ์อากาศล่วงหน้าเวลาจะออกจากบ้านหรือวางแผนการท่องเที่ยว ด้วยข้อมูลเหล่านี้จะช่วยให้เราสามารถป้องกันหรือหลีกเลี่ยงเหตุการณ์ที่เกิดขึ้น รวมถึงการเตรียมความพร้อมรับมือต่อเหตุการณ์นั้น ๆ ด้วย

ในสายงานของเทคโนโลยีเองก็คงหลีกเลี่ยงไม่ได้กับประโยคนี้เช่นกันเพราะทุกครั้งที่มีปัญหา ทีม Engineer เองก็มักจะหลุดพูดประโยคนี้ขึ้นมาบ่อย ๆ แม้ว่าองค์กรจะมีเครื่องมือในการมอนิเตอร์หลากหลายขนาดไหนก็ไม่อาจบอกได้ว่าปัญหาอะไรที่กำลังจะเกิดขึ้นหรือส่วนงานไหนที่กำลังจะเกิดปัญหา

ช่วงหลาย ๆ ปีที่ผ่านมา หลายองค์กรมีการปรับเปลี่ยนรูปแบบธุรกิจให้เป็นดิจิทัลมากขึ้น เพื่อให้ตอบสนองต่อความต้องการของลูกค้าหรือผู้ใช้บริการ รวมถึงการสร้างความแตกต่างให้เหนือกว่าคู่แข่งในตลาดเดียวกัน ดังนั้นองค์กรเหล่านั้นจึงนำเทคโนโลยีต่าง ๆ เข้ามามีบทบาทในการขับเคลื่อนธุรกิจ เพื่อสร้างบริการที่ดี และตอบสนองต่อความต้องการของลูกค้าหรือผู้ใช้บริการได้รวดเร็ว สร้างความพึงพอใจแก่ลูกค้าหรือผู้ใช้บริการ ซึ่งความท้าทายเหล่านี้มาพร้อมกับเทคโนโลยีและวิธีการด้านไอทีรูปแบบใหม่ๆ เช่น การขยาย IT Infrastructure ขึ้นไปอยู่บนคลาวด์, การปรับเปลี่ยนสถาปัตยกรรมเป็นแบบ microservices และการเลือกใช้วิธีการในการสร้างแอพพลิเคชันแบบ CI/CD เป็นต้น ทำให้เกิดสภาพแวดล้อมแบบ Hybrid (โครงสร้างอยู่บน Cloud และ On-premise) ที่มีความซับซ้อนมากขึ้นในการบริหารจัดการด้านไอที ส่งผลให้องค์กรจำต้องมีเทคโนโลยีที่ชาญฉลาดในการรับมือกับปริมาณข้อมูลมหาศาล, สามารถวิเคราะห์ปัญหา, คาดการณ์ปัญหาที่อาจเกิดขึ้น และจัดการปัญหาให้อย่างรวดเร็วและมีประสิทธิภาพ

แล้วเทคโนโลยีที่ชาญฉลาดต้องมีคุณสมบัติอย่างไรล่ะ?

อ้างอิงจาก Gartner Market Guide for AIOps Platforms ของ ปี 2021 ได้กล่าวถึงคุณสมบัติของ Platform ที่จะมาช่วยให้องค์กรสามารถบริหารจัดการด้านไอทีได้อย่างชาญฉลาด คาดการณ์ปัญหาที่จะเกิดขึ้นได้ และจัดการปัญหาได้อย่างอัตโนมัติ นั่นคือ เทคโนโลยี AIOps

AIOps มาจากคำว่า AI (Artificial Intelligence) + Ops หรือ IT Operations ง่ายๆก็คือการเอา AI หรือปัญญาประดิษฐ์ มาช่วยในการบริหารจัดการด้านไอที โดยแพลตฟอร์ม AIOps นั้นเป็นการปรับปรุงแนวทางการบริหารจัดการด้านไอที ให้มีความสามารถในการตรวจจับสิ่งผิดปกติ วิเคราะห์ข้อมูลจากข้อมูลปริมาณมหาศาล (Big Data), เชื่อมโยงความสัมพันธ์ของเหตุการณ์ต่าง ๆ, วินิจฉัยถึงสาเหตุของปัญหา (Root Cause Analysis: RCA), คาดการณ์ปัญหาที่จะเกิดขึ้นได้, แจ้งเตือนปัญหาได้อย่างทันท่วงที และมีระบบ Automate ในการจัดการปัญหา

คุณสมบัติหลักของแพลตฟอร์ม AIOps:

  • การนำเข้าข้อมูลที่มีความหลากหลายมารวมกัน (Ingestion)
    การที่จะนำข้อมูลมาวิเคราะห์ ย่อมต้องมีข้อมูลที่เพียงพอต่อการจะมาคำนวณและประมวลผล ยิ่งมีข้อมูลมากเท่าไหร่การวิเคราะห์ก็ย่อมมีประสิทธิภาพมากขึ้น ก็คงไม่ต่างกับการพยากรณ์อากาศ ที่นักพยากรณ์ก็ต้องเอาข้อมูลต่าง ๆ มารวบรวมทั้งค่าดัชนีความชื้น ปริมาณน้ำฝน หรือข้อมูลในอดีตหลาย ๆ ปีมาประกอบกันเพื่อพยากรณ์อากาศในแต่ละวัน  ดังนั้นการที่แพลตฟอร์ม AIOps จะวินิจฉัยถึงสาเหตุของปัญหาหรือคาดการณ์ปัญหาที่จะเกิดขึ้นได้ ก็ต้องรวมรวบข้อมูลจากหลากหลายแหล่งเช่นกัน ทั้งข้อมูลโครงสร้างพื้นฐาน, ข้อมูลเครือข่าย (Network), แอพพลิเคชั่น รวมถึงข้อมูลที่ได้มาจากเครื่องมือในการมอนิเตอร์ โดยแพลตฟอร์ม AIOps จะวิเคราะห์ข้อมูลด้วยการใช้เทคโนโลยี Machine Learning ในการคำนวณและประมวลผลจากข้อมูล 2 ส่วน ได้แก่
                       * ข้อมูลเรียลไทม์ ณ เวลาที่มีการนำเข้าข้อมูล (streaming analytics)
                       * ข้อมูลในอดีตที่มีเก็บรวบรวมไว้
  • แผนผังโครงสร้างของระบบ (Topology)
    แพลตฟอร์ม AIOps ต้องมีความสามารถในการค้นหาและรวบรวม IT Asset และแอพพลิเคชั่นที่เกี่ยวข้องและเชื่อมโยงกัน ทั้งความสัมพันธ์ของ IT Asset และแอพพลิเคชั่น, การพึ่งพากัน หรือ การเชื่อมโยงกันในมิติอื่น ๆ ของ IT Asset และแอพพลิเคชั่น
  • การเชื่อมโยงความสัมพันธ์ของเหตุการณ์ต่าง ๆ (Correlation)
    การพยากรณ์อากาศ ก็ใช้หลักการการเชื่อมโยงเหตุการณ์อยู่บ่อยครั้ง เช่น เมื่อความชื้นสัมพัทธ์มีค่า 100 % นั่นแปลว่า ฝนกำลังจะตก เป็นต้น ดังนั้นการเชื่อมโยงความสัมพันธ์ของเหตุการณ์ก็เป็นสิ่งจำเป็นกับแพลตฟอร์ม AIOps เช่นกัน เมื่อมีการเชื่อมโยงความสัมพันธ์ของเหตุการณ์ในแง่ของเวลา แผนผังโครงสร้างของระบบ และเหตุการณ์ที่คล้ายคลึง ย่อมช่วยลดภาระของทีมไอทีในการจัดการเหตุการณ์ที่ซ้ำซ้อน ระบุได้ถึงต้นเหตุของปัญหา และยังสามารถคาดการณ์เหตุการณ์ในอนาคตได้ด้วยแพทเทินท์ของเหตุการณ์ในอดีต
  • การประมวลผลเหตุการณ์ต่าง ๆ (Recognition)
    ด้วยเทคโนโลยีของ Machine Learning และการเรียนรู้พฤติกรรมอย่างต่อเนื่อง ย่อมทำให้การประมวลผลเหตุการณ์ต่าง ๆ มีประสิทธิภาพมากขึ้น และมองเห็นถึงแนวโน้มของความผิดปกติ จากการเปรียบเทียบข้อมูลในอดีต ดังนั้นแพลตฟอร์ม AIOps จึงจำต้องมีความสามารถในการตรวจจับถึงสิ่งผิดปกติ และแจ้งเตือนปัญหาที่จะเกิดขึ้น เพื่อหลีกเลี่ยงความเสียหายที่อาจเกิดขึ้นหรือเตรียมความพร้อมในการรับมือปัญหา
  • การจัดการและแก้ไขปัญหา (Remediation)
    เมื่อตรวจจับได้ถึงปัญหา แพลตฟอร์ม AIOps สามารถตอบสนองต่อปัญหาตามข้อกำหนดที่ระบุไว้ หรือ อาศัยการสังเกตการณ์ในอดีต และเสนอแนะวิธีการในการจัดการปัญหาหรือตอบสนองต่อการแก้ไขปัญหาแบบอัตโนมัติ

ไม่ว่าจะเป็นการพยากรณ์อากาศหรือการคาดการณ์ปัญหาด้านไอที ก็มีรูปแบบเดียวกัน คือการนำข้อมูลที่เพียงพอจากหลากหลายแหล่ง มาวิเคราะห์ถึงแพทเทินท์ของเหตุการณ์ การเชื่อมโยงกันของเหตุการณ์ต่าง ๆ รวมถึงข้อมูลและเหตุการณ์ในอดีต เพื่อคาดการณ์ถึงเหตุการณ์ในอนาคตหรือตรวจจับความผิดปกติเมื่อเปรียบเทียบกับข้อมูลในอดีต ดังนั้นการรู้ล่วงหน้าของปัญหาด้านไอทีก็ย่อมทำได้ไม่ยาก หากองค์กรมีเครื่องมือที่เหมาะสม และทีมงานที่มีความชำนาญ & เชี่ยวชาญในด้านนี้โดยตรงและพร้อมให้คำปรึกษาในการปรับรูปแบบการบริหารจัดการด้านไอทีขององค์กรเป็น AIOps

สามารถฝากข้อมูลไว้ให้เราติดต่อกลับได้ที่: https://forms.office.com/r/Vus99434wz 
หรือ สามารถติดต่อมาที่: bsm@mfec.co.th   หรือ scan QR code ผ่านช่องทาง LINE OAหรือฝากข้อมูลไว้ให้เราติดต่อกลับ: https://forms.office.com/r/Vus99434wz

อ้างอิง: https://www.gartner.com/en/documents/4000217/market-guide-for-aiops-platforms

เขียนบทความโดย: นางสาวเปี่ยมณัฐดา กันทะวงศ์ MFEC Senior Presales Consultant

 


About Maylada

Check Also

Red x Blue Pill 2022 โดย 2600 Thailand เปิดให้ซื้อบัตรเข้าร่วมงานแล้ว

2600 Thailand ประกาศจัดงานสัมมนาแบบพบหน้า Red x Blue Pill 2022 ซึ่งเป็นงานสัมมนาที่ได้รับการกล่าวขานว่า “เจาะลึก” ด้าน Computer Security ที่สุดในประเทศไทย โดยรวบรวมเนื้อหาทั้งด้าน …

Microsoft กำลังตรวจสอบปัญหา Remote Desktop บน Windows 11 22H2

Microsoft ได้รับการแจ้งปัญหาการใช้งาน Microsoft Remote Desktop จากผู้ใช้งานหลายรายหลังจากที่อัปเดตเป็น Windows 11 22H2 ว่าพบปัญหาการเชื่อมต่อหลุดเองหรือมีอาการค้างบ่อย ล่าสุด Microsoft กำลังตรวจสอบปัญหานี้