[Guest Post] AIOps คืออะไร สำคัญอย่างไรกับ IT Operations และธุรกิจของคุณ – ตอนที่ 1 แนะนำภาพรวม

IT Operation Management เป็นสิ่งสำคัญมากที่จะทำให้ Digital Transformation ประสบความสำเร็จหรือล้มเหลว และการที่จะทำให้ IT Operation Management มีประสิทฺธิภาพสูงสุด ต้องนำ AIOps Platform เข้ามาใช้งาน

การสร้างความเติบโตธุรกิจอย่างยั่งยืน การเพิ่มความสามารถในการแข่งขัน รวมถึงการเป็นเบอร์ 1 ในอุตสาหกรรมต้องอาศัยเทคโนโลยีที่ก้าวล้ำ จากงานวิจัยของ PricewaterhouseCoopers (PwC) พบว่าเมกาเทรนด์ (Megatrends) ที่จะส่งผลกระทบกับธุรกิจมากที่สุด คือ พัฒนาการทางด้านเทคโนโลยีที่ก้าวหน้าอย่างรวดเร็ว ซึ่งสามารถทำให้ธุรกิจหยุดชะงัก (business disruption) จึงทำให้หน่วยงานต่างๆ หันมาทำดิจิทัลทรานส์ฟอร์เมชั่น (Digital Transformation) แบบครบวงจร ซึ่งการบริหารจัดการการปฏิบัติการด้านเทคโนโลยีสารสนเทศ (IT Operation Management) เป็นสิ่งสำคัญมากที่จะทำให้ Digital Transformation ประสบความสำเร็จหรือล้มเหลว และการที่จะทำให้ IT Operation Management มีประสิทฺธิภาพสูงสุดจำเป็นที่จะต้องนำ AIOps Platform เข้ามาใช้งาน เพื่อให้ระบบ IT มีความพร้อมใช้ (availability) และความน่าเชื่อถือ (reliability) สูงสุด เพื่อสร้าง User Experience ที่ดีที่สุด ซึ่งจะส่งผลต่อผลลัพธ์ทางธุรกิจ

บทความนี้จะกล่าวถึง AI for IT Operations หรือ AIOps ซึ่งเป็นเทคโนโลยีใหม่ที่มีประโยชน์อย่างยิ่งสำหรับการปฏิบัติการด้าน IT มันจะช่วยให้ธุรกิจของท่านล้ำหน้าคู่แข่ง ในบทความนี้ท่านจะทราบว่า AIOps คืออะไร และทำไมผู้เกี่ยวข้องกับการปฏิบัติการด้าน IT จำเป็นต้องสนใจ ท่านจะรู้จักฟังก์ชั่นการทำงาน และประโยชน์ของ AIOps Platform ทั้งด้าน IT Monitoring, IT Service Management และ IT Automation ฟังดูน่าสนใจนะครับ ลองติดตามอ่านกันได้เลยครับ

IT Operations คืออะไร และความท้าทายที่เกี่ยวข้องกับงาน IT Operations คืออะไร

ปัจจุบันการปฏิบัติการด้าน IT หรือ IT Operations ครอบคลุมการบริหารจัดการระบบเทคโนโลยีสารสนเทศในด้านต่างๆ ได้แก่

  • IT Infrastructure Management (ITIM)
  • IT Service Management (ITSM)
  • Network Performance Monitoring and Diagnostics (NPMD)
  • Security Information and Event Management (SIEM)
  • Application Performance Monitoring (APM)
  • Digital Experience Monitoring (DEM)

ในโลกยุคปัจจุบันที่ธุรกิจขับเคลื่อนด้วย Digital Technology  การปฏิบัติการด้าน IT operations มีความท้าทาย 3 เรื่องใหญ่ๆ คือ

  1. การขยายตัวของ IT Infrastructure ทำให้เกิดข้อมูลทั้ง events, metrics, traces, network flow data, telemetry data ซึ่งมีรูปแบบหลายหลาย (variety) มีปริมาณมหาศาล (volume) มีความเร็ว (velocity) ทั้งแบบ real-time และ historical ทำไม่สามารถเห็นข้อมูลเชิงลึก (insight) เพราะขาดเครื่องมือที่มาจัดการวิเคราะห์ข้อมูลปริมาณมหาศาล (big data) เหล่านี้ ทำให้งาน IT Operations ไม่สามารถส่งมอบคุณค่าที่อยู่ในข้อมูลเหล่านี้ให้กับธุรกิจ
  2. การมีเครื่องมือบริหารจัดการและเฝ้าระวังด้าน IT หลายตัวเพื่อบริหารจัดการด้านต่างๆ ได้แก่ ITIM, ITSM, NPMD, SIEM, APM, DEM กลับเพิ่มเวลาในการหาสาเหตุและแก้ไขปัญหา เนื่องจากมีรอยต่อในการทำงานระหว่างระบบหรือเครื่องมือต่างๆ
  3. การปฏิบัติการด้าน IT โดยส่วนใหญ่มุ่งตอบโจทย์เฉพาะฝ่าย IT โดยมักจะขาดการวิเคราะห์ข้อมูลเชิงลึกที่ส่งผลต่อธุรกิจ และไม่ทราบประสบการณ์การใช้งานด้านดิจิทัล (Digital Experience) ของผู้ใช้งานหรือลูกค้า

 

แล้ว AIOps คืออะไร เกี่ยวข้องอะไรกับ IT Operations

AIOps ย่อมาจาก Artificial Intelligence for IT Operations หรือการนำเทคโนโลยีปัญญาประดิษฐ์ (AI) มาใช้ในการปฏิบัติการด้านเทคโนโลยีสารสนเทศ คำว่า AIOps ถูกบัญญัติขึ้นมาโดยบริษัทวิจัยระดับโลกอย่าง Gartner ซึ่งพูดถึง AIOps platform ที่ใช้เทคโนโลยี Machine Learning มาจัดการข้อมูลมหาศาล (big data) ที่ถูกสร้างมาจากระบบ IT ซึ่ง Gartner ได้อธิบายว่า AIOps Platform จะช่วยเพิ่มประสิทธิภาพกระบวนทำงานต่างๆ ของการปฏิบัติการด้าน IT อาทิเช่น anomaly detection, event correlation และ root cause analysis (RCA) เพื่อที่จะปรับปรุงการการเฝ้าระวัง (monitoring) การบริหารจัดการงานบริการ (service management) และการทำงานแบบอัตโนมัติ (automation tasks) ให้ดีขี้น โดยครอบคลุม 3 ด้านได้แก่

  1. Observe (Monitoring) แพลตฟอร์มจะได้รับข้อมูล real-time และ historical ในรูปแบบ events, metrics, traces, topology จากระบบ IT ต่างๆ และมีการทำ historical analysis, anomaly detection, performance analysis และ correlation & contextualization
  2. Engage (ITSM) แพลตฟอร์มจะได้รับข้อมูล incidents, dependencies และ changes และมีการทำ task automation, change risk analysis, SD agent performance analysis, knowledge management
  3. Act (Automation) แพลตฟอร์มสามารถวิเคราะห์และรัน playbook เพื่อตรวจสอบ (Self-Diagnostic) แก้ไขปัญหา (Self-Healing) กู้คืน (Self-Recovery) และป้องกันปัญหา (Self-Prevention) ระบบ IT แบบอัตโนมัติ โดยเฉพาะงานที่เกิดซ้ำ (recurring task) ทั้งนี้เพื่อลด incident ลด down time ลด error เพิ่ม SLA

 

 

ฟังก์ชั่นการทำงาน และประโยชน์ของ AIOps Platform

ฟังก์ชั่นการทำงานของ AIOps Platform หลักๆ ประกอบด้วย

  1. Data Ingestion คือ การนำข้อมูลเข้าจากหลายๆ แหล่ง ทั้งข้อมูลประเภท events, metrics, traces จาก Configuration Item (CI) ต่างๆ ไม่ว่าจะเป็นอุปกรณ์เครือข่าย เครื่องแม่ข่ายคอมพิวเตอร์ แอพพลิเคชั่น คลาวด์ หรือข้อมูลจากระบบบริหารจัดการ IT อื่นๆ เช่น ITIM, ITSM, NPMD, SIEM, APM, DEM
  2. Data Analytics คือ การวิเคราะห์ข้อมูล โดยใช้เทคโนโลยี machine learning ซึ่งสามารถทำได้ 2 จุดคือ
    • แบบ real-time โดยทำการวิเคราะห์ ณ จุดที่นำข้อมูลเข้าระบบ (data-in-motion)
    • แบบ historical โดยทำการวิเคราะห์จากข้อมูลที่ได้จัดเก็บไว้แล้ว (data-at-rest)
  1. Prescription คือ การแนะนำสิ่งที่ต้องทำจากการวิเคราะห์ข้อมูลในข้อ 2 รวมถึงการคาดการณ์ (predictive analytics) เช่น การระบุสาเหตุ วิธีการแก้ปัญหา วิธีการป้องกันปัญหา
  2. Action คือ กระทำสิ่งที่แนะนำแบบอัตโนมัติโดยเข้าถึงอุปกรณ์ หรือแอพพลิเคชั่น และส่งคำสั่งดำเนินการเพื่อแก้ไขปัญหา หรือป้องกันตามที่แนะนำ

เป้าหมายหลักของการวิเคราะห์ข้อมูล คือ การค้นหารูปแบบ (patterns) ที่อยู่ในชุดข้อมูล เพื่อคาดการณ์ incident ที่น่าจะเกิดขึ้นในระบบ IT หรือเพื่อหาสาเหตุ จากนั้นแพลตฟอร์มก็สามารถเข้าไปยัง CI เพื่อไปป้องกันไม่ให้ incident นั้นเกิด หรือแก้ไขปัญหาจากสาเหตุที่ได้ค้นพบ โดย AIOps Platform ที่ดีจะมีคุณสมบัติดังนี้

  • ลด Noise เช่น false alarm
  • หาสาเหตุ หรือที่คาดว่าจะเป็นสาเหตุโดยใช้แผนผังการเชื่อมต่อ (topology) หรือ ML และเชื่อมโยงปัญหาเหล่านี้ไปยัง customer journey
  • ตรวจจับสิ่งผิดปกติจากหลายๆ ตัวแปร (multivariate anomalies) ซึ่งเกินกว่าที่ static thresholds หรือ numeric outliers จะทำได้ ทั้งนี้เพื่อตรวจจับเงื่อนไขและพฤติกรรมที่ผิดปกติและส่งผลกระทบกับธุรกิจ
  • หาแนวโน้มซึ่งอาจจะส่งผลให้ใช้งานไม่ได้ก่อนที่จะเกิดขี้นจริง
  • ขับเคลื่อนการทำ automation สำหรับงานที่ความเสี่ยงต่ำถึงปานกลาง
  • ใช้ chatbots หรือ virtual support assistants (VSAs) เพื่อเข้าถึงองค์ความรู้และขับเคลื่อนการทำ automation สำหรับงานหรือ incident ที่เกิดซ้ำๆ
  • ช่วยจัดความสำคัญของ incident ให้อัตโนมัติและแนะนำวิธีการแก้ไขจาก incident ที่เคยเกิดขึ้นในอดีต

AIOps Platform นอกจากจะนำมาใช้ประโยชน์กับการบริหารจัดการ IT ในด้าน Monitoring ทั้ง ITIM, ITSM, NPMD, SIEM, APM, DEM และ IT Service Management แล้ว AIOps Platform ยังเป็นเครื่องมือที่สำคัญสำหรับการทำ DevOps, Continuous Integration/Continuous Delivery (CI/CD) และ Site Reliability Engineering (SRE) ซึ่งมีการใช้ automation ในขั้นตอนการทำงานต่างๆ ตั้งแต่การพัฒนาทดสอบ application การ deploy application และการ monitoring ซึ่งจะต้องทำอย่างต่อเนื่องในลักษณะ continuous delivery ให้กับทีมต่างๆ รวมถึงผู้ใช้งาน

 

โปรดติดตามตอนที่ 2  ซึ่งจะกล่าวถึง AIOps สำหรับ Monitoring, ITSM และ Automation ตลอดจน N-AIOps คืออะไร และบทสรุปจบท้ายของบทความ  

หากท่านสนใจข้อมูลเพิ่มเติมเกี่ยวกับ AIOps และ N-AIOps ท่านสามารถคลิ๊กที่ https://bit.ly/3pLujv3 หรือ info@netkasystem.com  

ติดตามได้ที่ https://www.facebook.com/netkasystem และ http://line.me/ti/p/~@netkasystem                            

[เพียงกดติดตามข่าวสารผ่าน Line และ FB ลุ้นรับ code เติมเงินบัตร Starbuck ทันที วันละ 10 ใบ]

หรือติดต่อ Distributor ของเรา

  1. DataOne Asia (Thailand) โทร 02 686 3000
  1. NextWave (Thailand) คุณไหมแพร โทร 090 972 3842  

ผู้เขียน

คุณชาญชัย เจียมโชติพัฒนกุล  Founder & CEO  บริษัท เน็ตก้า ซิสเต็ม จำกัด

 

อ้างอิง

  1. Gartner research’s Market Guide for AIOps Platforms published: 7 November 2019
  2. Gartner research’s DevOps Teams Must Use Site Reliability Engineering to Maximize Customer Value published 10 January 2020
  3. Gartner research’s Use AIOps for a Data-Driven Approach to Improve Insights From IT Operations Monitoring Tools published 11 May 2020
  4. Gartner research’s Deliver Cross-Domain Analysis and Visibility With AIOps and Digital Experience Monitoring published 5 Jul 2018
  5. Gartner research’s Innovation Insight for AI in IT Transformation published 13 Oct 2020
  6. Gartner research’s Avoid the Unexpected Consequences of IT Change Management With AIOps and CMDB published 10 Oct 2019

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Microsoft ตั้งทีมวิศวกรรม AI ใหม่ นำโดย Jay Parikh อดีตผู้บริหารจาก Meta

Satya Nadella ประธานเจ้าหน้าที่บริหารของ Microsoft ประกาศในบันทึกถึงพนักงานว่าบริษัทกำลังก่อตั้งกลุ่มวิศวกรรมใหม่ภายใต้ชื่อ CoreAI – Platform and Tools โดยมี Jay Parikh อดีตผู้บริหารระดับสูงจาก Meta …

Amazon RDS for MariaDB พร้อมสนุน Innovation Release 11.7 ในสภาพแวดล้อม Preview

สำหรับใครที่อยากทดสอบ MariaDB ฟีเจอร์ใหม่ ๆ บน AWS ล่าสุด Amazon RDS for MariaDB ได้ประกาศพร้อมสนับสนุน MariaDB Innovation Release …