[Guest Post] AIOps เทคโนโลยีที่ช่วยให้รู้ปัญหาด้านไอทีล่วงหน้าได้เหมือนกับการพยากรณ์อากาศ

“ถ้ารู้ล่วงหน้าก็คงจะดีสินะ” ประโยคนี้มักจะได้ยินกันอยู่บ่อยครั้งเวลาที่เราเจอกับปัญหาที่เราคาดไม่ถึงหรือพบเจอเหตุการณ์บางอย่างที่ไม่ได้คาดการณ์เอาไว้ เพราะเราทุกคนต่างมีสัญชาตญาณของการป้องกันตนเองจากสิ่งต่าง ๆ รอบตัว สังเกตง่าย ๆ จากการที่เราดูพยากรณ์อากาศล่วงหน้าเวลาจะออกจากบ้านหรือวางแผนการท่องเที่ยว ด้วยข้อมูลเหล่านี้จะช่วยให้เราสามารถป้องกันหรือหลีกเลี่ยงเหตุการณ์ที่เกิดขึ้น รวมถึงการเตรียมความพร้อมรับมือต่อเหตุการณ์นั้น ๆ ด้วย

ในสายงานของเทคโนโลยีเองก็คงหลีกเลี่ยงไม่ได้กับประโยคนี้เช่นกันเพราะทุกครั้งที่มีปัญหา ทีม Engineer เองก็มักจะหลุดพูดประโยคนี้ขึ้นมาบ่อย ๆ แม้ว่าองค์กรจะมีเครื่องมือในการมอนิเตอร์หลากหลายขนาดไหนก็ไม่อาจบอกได้ว่าปัญหาอะไรที่กำลังจะเกิดขึ้นหรือส่วนงานไหนที่กำลังจะเกิดปัญหา

ช่วงหลาย ๆ ปีที่ผ่านมา หลายองค์กรมีการปรับเปลี่ยนรูปแบบธุรกิจให้เป็นดิจิทัลมากขึ้น เพื่อให้ตอบสนองต่อความต้องการของลูกค้าหรือผู้ใช้บริการ รวมถึงการสร้างความแตกต่างให้เหนือกว่าคู่แข่งในตลาดเดียวกัน ดังนั้นองค์กรเหล่านั้นจึงนำเทคโนโลยีต่าง ๆ เข้ามามีบทบาทในการขับเคลื่อนธุรกิจ เพื่อสร้างบริการที่ดี และตอบสนองต่อความต้องการของลูกค้าหรือผู้ใช้บริการได้รวดเร็ว สร้างความพึงพอใจแก่ลูกค้าหรือผู้ใช้บริการ ซึ่งความท้าทายเหล่านี้มาพร้อมกับเทคโนโลยีและวิธีการด้านไอทีรูปแบบใหม่ๆ เช่น การขยาย IT Infrastructure ขึ้นไปอยู่บนคลาวด์, การปรับเปลี่ยนสถาปัตยกรรมเป็นแบบ microservices และการเลือกใช้วิธีการในการสร้างแอพพลิเคชันแบบ CI/CD เป็นต้น ทำให้เกิดสภาพแวดล้อมแบบ Hybrid (โครงสร้างอยู่บน Cloud และ On-premise) ที่มีความซับซ้อนมากขึ้นในการบริหารจัดการด้านไอที ส่งผลให้องค์กรจำต้องมีเทคโนโลยีที่ชาญฉลาดในการรับมือกับปริมาณข้อมูลมหาศาล, สามารถวิเคราะห์ปัญหา, คาดการณ์ปัญหาที่อาจเกิดขึ้น และจัดการปัญหาให้อย่างรวดเร็วและมีประสิทธิภาพ

แล้วเทคโนโลยีที่ชาญฉลาดต้องมีคุณสมบัติอย่างไรล่ะ?

อ้างอิงจาก Gartner Market Guide for AIOps Platforms ของ ปี 2021 ได้กล่าวถึงคุณสมบัติของ Platform ที่จะมาช่วยให้องค์กรสามารถบริหารจัดการด้านไอทีได้อย่างชาญฉลาด คาดการณ์ปัญหาที่จะเกิดขึ้นได้ และจัดการปัญหาได้อย่างอัตโนมัติ นั่นคือ เทคโนโลยี AIOps

AIOps มาจากคำว่า AI (Artificial Intelligence) + Ops หรือ IT Operations ง่ายๆก็คือการเอา AI หรือปัญญาประดิษฐ์ มาช่วยในการบริหารจัดการด้านไอที โดยแพลตฟอร์ม AIOps นั้นเป็นการปรับปรุงแนวทางการบริหารจัดการด้านไอที ให้มีความสามารถในการตรวจจับสิ่งผิดปกติ วิเคราะห์ข้อมูลจากข้อมูลปริมาณมหาศาล (Big Data), เชื่อมโยงความสัมพันธ์ของเหตุการณ์ต่าง ๆ, วินิจฉัยถึงสาเหตุของปัญหา (Root Cause Analysis: RCA), คาดการณ์ปัญหาที่จะเกิดขึ้นได้, แจ้งเตือนปัญหาได้อย่างทันท่วงที และมีระบบ Automate ในการจัดการปัญหา

คุณสมบัติหลักของแพลตฟอร์ม AIOps:

  • การนำเข้าข้อมูลที่มีความหลากหลายมารวมกัน (Ingestion)
    การที่จะนำข้อมูลมาวิเคราะห์ ย่อมต้องมีข้อมูลที่เพียงพอต่อการจะมาคำนวณและประมวลผล ยิ่งมีข้อมูลมากเท่าไหร่การวิเคราะห์ก็ย่อมมีประสิทธิภาพมากขึ้น ก็คงไม่ต่างกับการพยากรณ์อากาศ ที่นักพยากรณ์ก็ต้องเอาข้อมูลต่าง ๆ มารวบรวมทั้งค่าดัชนีความชื้น ปริมาณน้ำฝน หรือข้อมูลในอดีตหลาย ๆ ปีมาประกอบกันเพื่อพยากรณ์อากาศในแต่ละวัน  ดังนั้นการที่แพลตฟอร์ม AIOps จะวินิจฉัยถึงสาเหตุของปัญหาหรือคาดการณ์ปัญหาที่จะเกิดขึ้นได้ ก็ต้องรวมรวบข้อมูลจากหลากหลายแหล่งเช่นกัน ทั้งข้อมูลโครงสร้างพื้นฐาน, ข้อมูลเครือข่าย (Network), แอพพลิเคชั่น รวมถึงข้อมูลที่ได้มาจากเครื่องมือในการมอนิเตอร์ โดยแพลตฟอร์ม AIOps จะวิเคราะห์ข้อมูลด้วยการใช้เทคโนโลยี Machine Learning ในการคำนวณและประมวลผลจากข้อมูล 2 ส่วน ได้แก่
                       * ข้อมูลเรียลไทม์ ณ เวลาที่มีการนำเข้าข้อมูล (streaming analytics)
                       * ข้อมูลในอดีตที่มีเก็บรวบรวมไว้
  • แผนผังโครงสร้างของระบบ (Topology)
    แพลตฟอร์ม AIOps ต้องมีความสามารถในการค้นหาและรวบรวม IT Asset และแอพพลิเคชั่นที่เกี่ยวข้องและเชื่อมโยงกัน ทั้งความสัมพันธ์ของ IT Asset และแอพพลิเคชั่น, การพึ่งพากัน หรือ การเชื่อมโยงกันในมิติอื่น ๆ ของ IT Asset และแอพพลิเคชั่น
  • การเชื่อมโยงความสัมพันธ์ของเหตุการณ์ต่าง ๆ (Correlation)
    การพยากรณ์อากาศ ก็ใช้หลักการการเชื่อมโยงเหตุการณ์อยู่บ่อยครั้ง เช่น เมื่อความชื้นสัมพัทธ์มีค่า 100 % นั่นแปลว่า ฝนกำลังจะตก เป็นต้น ดังนั้นการเชื่อมโยงความสัมพันธ์ของเหตุการณ์ก็เป็นสิ่งจำเป็นกับแพลตฟอร์ม AIOps เช่นกัน เมื่อมีการเชื่อมโยงความสัมพันธ์ของเหตุการณ์ในแง่ของเวลา แผนผังโครงสร้างของระบบ และเหตุการณ์ที่คล้ายคลึง ย่อมช่วยลดภาระของทีมไอทีในการจัดการเหตุการณ์ที่ซ้ำซ้อน ระบุได้ถึงต้นเหตุของปัญหา และยังสามารถคาดการณ์เหตุการณ์ในอนาคตได้ด้วยแพทเทินท์ของเหตุการณ์ในอดีต
  • การประมวลผลเหตุการณ์ต่าง ๆ (Recognition)
    ด้วยเทคโนโลยีของ Machine Learning และการเรียนรู้พฤติกรรมอย่างต่อเนื่อง ย่อมทำให้การประมวลผลเหตุการณ์ต่าง ๆ มีประสิทธิภาพมากขึ้น และมองเห็นถึงแนวโน้มของความผิดปกติ จากการเปรียบเทียบข้อมูลในอดีต ดังนั้นแพลตฟอร์ม AIOps จึงจำต้องมีความสามารถในการตรวจจับถึงสิ่งผิดปกติ และแจ้งเตือนปัญหาที่จะเกิดขึ้น เพื่อหลีกเลี่ยงความเสียหายที่อาจเกิดขึ้นหรือเตรียมความพร้อมในการรับมือปัญหา
  • การจัดการและแก้ไขปัญหา (Remediation)
    เมื่อตรวจจับได้ถึงปัญหา แพลตฟอร์ม AIOps สามารถตอบสนองต่อปัญหาตามข้อกำหนดที่ระบุไว้ หรือ อาศัยการสังเกตการณ์ในอดีต และเสนอแนะวิธีการในการจัดการปัญหาหรือตอบสนองต่อการแก้ไขปัญหาแบบอัตโนมัติ

ไม่ว่าจะเป็นการพยากรณ์อากาศหรือการคาดการณ์ปัญหาด้านไอที ก็มีรูปแบบเดียวกัน คือการนำข้อมูลที่เพียงพอจากหลากหลายแหล่ง มาวิเคราะห์ถึงแพทเทินท์ของเหตุการณ์ การเชื่อมโยงกันของเหตุการณ์ต่าง ๆ รวมถึงข้อมูลและเหตุการณ์ในอดีต เพื่อคาดการณ์ถึงเหตุการณ์ในอนาคตหรือตรวจจับความผิดปกติเมื่อเปรียบเทียบกับข้อมูลในอดีต ดังนั้นการรู้ล่วงหน้าของปัญหาด้านไอทีก็ย่อมทำได้ไม่ยาก หากองค์กรมีเครื่องมือที่เหมาะสม และทีมงานที่มีความชำนาญ & เชี่ยวชาญในด้านนี้โดยตรงและพร้อมให้คำปรึกษาในการปรับรูปแบบการบริหารจัดการด้านไอทีขององค์กรเป็น AIOps

สามารถฝากข้อมูลไว้ให้เราติดต่อกลับได้ที่: https://forms.office.com/r/Vus99434wz 
หรือ สามารถติดต่อมาที่: bsm@mfec.co.th   หรือ scan QR code ผ่านช่องทาง LINE OAหรือฝากข้อมูลไว้ให้เราติดต่อกลับ: https://forms.office.com/r/Vus99434wz

อ้างอิง: https://www.gartner.com/en/documents/4000217/market-guide-for-aiops-platforms

เขียนบทความโดย: นางสาวเปี่ยมณัฐดา กันทะวงศ์ MFEC Senior Presales Consultant

 

About Maylada

Check Also

Google Cloud เพิ่ม BigQuery datasets บน Marketplace แล้ว

Google Cloud ประกาศเปิดให้ผู้ใช้งานสามารถเข้าถึงชุดข้อมูล BigQuery datasets ผ่าน Google Cloud Marketplace ด้วยการผสานการทำงานร่วมกับ BigQuery Analytics Hub เพื่อเพิ่มช่องทางการเข้าถึงข้อมูลสำหรับองค์กร

ก้าวทันยุคดิจิทัล 2025 ด้วยโซลูชัน IT ที่ตอบโจทย์ธุรกิจของคุณ: แนะนำ Solution เพื่อการเพิ่มประสิทธิภาพการทำงาน [Guest Post]

ในยุคดิจิทัลที่เปลี่ยนแปลงอย่างรวดเร็ว การเริ่มต้นปีใหม่เป็นโอกาสที่ดีสำหรับธุรกิจในการยกระดับกระบวนการทำงาน เพิ่มประสิทธิภาพ และสร้างความได้เปรียบในการแข่งขัน การเลือกโซลูชัน IT ที่เหมาะสมจะเป็นกุญแจสำคัญในการขับเคลื่อนธุรกิจของคุณในปีนี้