Observability อาจจะยังเป็นคำศัพท์ใหม่สำหรับหลายคน ซึ่งในตอนที่ 1 เราได้อธิบายความหมายของคำ ๆ นี้ไปกันแล้ว พร้อมทั้งความแตกต่างกับคำว่า Monitoring โดยในปีล่าสุดการจัดอันดับของการ์ทเนอร์ได้ยกให้ Dynatrace ติดโผอันดับหนึ่ง โดยมีเหตุผลสนับสนุนหลายประการ หนึ่งในนั้นคือความฉลาดของ AI
ในบทความที่สองนี้ เราจะพาทุกท่านไปติดตามกันว่า AIOps คืออะไร ทำไม Observability Platform ที่ดีควรมี เพื่อช่วยสนับสนุนบริการและงานของ ITOps และ DevOps ให้เป็นไปได้อย่างมีประสิทธิภาพเกิดการแก้ปัญหาในเชิงรุก

AIOps คืออะไร
AIOps เป็นวิธีการปฏิบัติที่นำความสามารถของ AI/ML เข้ามาช่วยในการปฏิบัติการทางไอที เช่น ความสามารถในการเชื่อมโยงเหตุการณ์ ตรวจจับความผิดปกติ และนำไปสู่ต้นเหตุปัญหา นอกจากนี้ ยังมีประโยชน์ต่อวงจรการพัฒนาซอฟต์แวร์ โดย AI ได้เข้ามาช่วยคัดกรองปัญหาการแจ้งเตือนเชิงปริมาณ และข้อมูลที่มีคุณสมบัติที่มีความสัมพันธ์กันอย่างซับซ้อนในปัจจุบัน
เหตุผลที่ AIOps เป็นเรื่องจำเป็นต่อสถานการณ์ขององค์กรในปัจจุบันก็เพราะความหลากหลายของ Infrastructure ที่มีอยู่และถือกำเนิดใหม่อยู่เรื่อย ๆ ของเทคโนโลยีต่าง ๆ เช่น Cloud และ Microservices ทำให้ยากต่อการติดตามและสร้างปฏิบัติการที่รวดเร็ว ด้วยเหตุนี้เอง การมี AIOps ที่สามารถหยุดยั้งปัญหาหรือหาเหตุได้อย่างอัตโนมัติจึงเป็นเรื่องสำคัญอย่างยิ่ง เพราะเมื่อทุกอย่างทำได้อย่างรวดเร็วและมีประสิทธิภาพ โอกาสและประโยชน์ทางธุรกิจก็เพิ่มขึ้นเช่นกัน
ITOps คืออะไร
ไอเดียของ ITOps ก็คือข้อปฏิบัติเกี่ยวกับการตอบสนองและตัดสินใจจากทีมปฏิบัติการกับ IT Infrastructure ในองค์กร ตั้งแต่การออกแบบ deploy คอนฟิก รักษาทรัพย์สินและให้บริการ เพื่อรักษาผลลัพธ์ตามที่ธุรกิจคาดหวัง แต่ความท้าทายคือ ปัจจุบัน infrastructure เหล่านี้ได้ขยายออกไปมากกว่าแค่ สวิตซ์ เราเตอร์ เซิร์ฟเวอร์ ซอฟต์แวร์ และ ฮาร์ดแวร์ เพราะมีกิจกรรมที่เกิดขึ้นนอกองค์กรอย่าง Cloud โดยเป้าหมายของ ITOps สามารถแบ่งออกเป็น 5 ส่วน ดังนี้
1. System Admin – ปรับแต่งค่าของเซิร์ฟเวอร์ ติดตั้งแอปพลิเคชัน มอนิเตอร์ติดตามปัญหาด้านสุขภาพของระบบ พร้อมอัปเดตและแก้ไขปัญหาด้านฮาร์ดแวร์
2. Network Admin – ดูแลการเชื่อมต่อของเครือข่ายให้มีประสิทธิภาพ และมั่นคงปลอดภัย ตลอดจนการแก้ปัญหาเกี่ยวกับอุปกรณ์หรือซอฟต์แวร์ด้านเครือข่าย
3. Computer Operation – ดูแลจัดการสถานที่ตั้งของเครื่องเซิร์ฟเวอร์ ระบบพื้นฐานเชิงกายภาพ เช่น ไฟและระบบสำรอง พร้อมคอยติดตามปัญหาและแจ้งเตือน
4. IT Help Desk – แก้ปัญหาและติดตามเกี่ยวกับการให้บริการต่างๆ
5. Cloud Operation – ดูแลปัญหาเกี่ยวกับคลาวด์และการให้บริการ ทำอย่างไรไม่ให้แอปพลิเคชันหรือบริการล่ม มีระบบจัดการอัตโนมัติต่าง ๆ
จะเห็นได้ว่า ITOps เป็นงานที่กว้างขวางเกี่ยวพันกับโครงสร้างทางไอทีทุกอย่างขององค์กร ซึ่ง ITOps มักมีหน้าที่เกี่ยวกับการวางแผนและนำส่งบริการอย่างมีคุณภาพว่าระบบไอทีจะสามารถใช้งานได้ มีฟังก์ชันตามที่วางไว้ มีประสิทธิภาพที่ดี และคงทนพร้อมให้บริการตาม SLA ที่วางไว้ แต่ทั้งหมดยังต้องเกิดขึ้นอย่างมั่นคงปลอดภัย ซึ่งความคาดหวังเหล่านี้จะเกิดขึ้นไม่ได้เลยหาก ITOps ไม่สามารถวัดคุณภาพ หรือทราบถึงเหตุฉุกเฉินได้รวดเร็วมากพอ ดังนั้น การทำงานควรถูกเสริมศักยภาพด้วย AIOps
ผสาน ITOps และ AIOps เข้าด้วยกัน
ทีมงาน IT Operation ขององค์กรมักมีงานล้นมืออยู่เสมอ ทั้งการรักษาประสิทธิภาพของระบบเดิมและการต่อยอดนวัตกรรมใหม่ ๆ ทั้ง Private Cloud, Public Cloud, On-premise และ Multi-cloud นอกเหนือจากงานรายวันเกี่ยวกับอุปกรณ์และ ITOps ยังต้องประสานงานกับ Vendor, DevOps, ทีมธุรกิจ และผู้ให้บริการต่าง ๆ อีกด้วย ดังนั้น จะดีกว่าไหมหากมีเครื่องมือที่ช่วยบูรณาการติดตามการดำเนินงานทุกเลเยอร์ของ Infrastructure อันซับซ้อน ตั้งแต่การตรวจจับปัญหาถึงสาเหตุพร้อมสู่การแก้
หากพิจารณาวิธีการแก้ไขปัญหาของงาน ITOps สิ่งพื้นฐานที่เกิดขึ้นมักต้องการเข้าใจความเชื่อมโยงระหว่าง ระบบ อุปกรณ์ ผู้ใช้งาน และโครงสร้างพื้นฐาน เพื่อนำมาวิเคราะห์ร่วมกันสู่สาเหตุ โดยวิธีการแบบเดิม ๆ ITOps มักทำเพียงแค่ Script หรือการตั้งตารางงานบางอย่างมาตอบสนองกับเหตุการณ์ ซึ่ง Dynatrace Observability ที่มาพร้อมกับความสามารถด้าน AIOps จะเข้ามาช่วยติดตามการดำเนินงานขององค์กรได้ทุกส่วน โดยการวิเคราะห์ข้อมูลที่รวบรวมมาได้จาก Agent หรือข้อมูลระดับ Big data ด้วยกลไกอันชาญฉลาดผ่าน AI พร้อมแสดงผลให้เข้าใจได้ง่ายผ่านกราฟความเชื่อมโยงของ IT Infrastructure, คลาวด์ และแอปพลิเคชัน ซึ่งท่านสามารถได้รับข้อมูลของต้นตอปัญหาได้อย่างอัตโนมัติ
ความท้าทายของ DevOps ในการติดตามประสิทธิภาพงาน

DevOps ก็เป็นอีกทีมหนึ่งที่อยู่ภายในการทำงานไอทีขององค์กรเช่นกัน แต่หน้าที่หลักของพวกเขาก็คือการทำงานร่วมกับ ITOps เพียงแต่มองภาพที่ต่างกันออกไป นั่นคือการทำ CI/CD ของซอฟต์แวร์หรือ Workflow ต่าง ๆ ให้รวดเร็วและมีประสิทธิภาพมากขึ้น และต้องเน้นหนักด้านความมั่นคงปลอดภัยภายในการทำงาน ซึ่งนำไปสู่สิ่งที่เรียกว่า DevSecOps อีกด้วย
แม้การทำงานของ DevOps จะแตกต่างออกไป แต่ในเนื้องานแล้วพวกเขาก็เผชิญกับความท้าทายไม่ต่างกันจากความหลากหลายของ Infrastructure เช่น คลาวด์ หรือแนวคิดในการพัฒนาแอปพลิเคชันในรูปแบบของ Microservices ที่นิยมอาศัยเทคโนโลยีด้าน Container เข้ามาตอบโจทย์ ด้วยเหตุนี้เอง ทีมงาน DevOps ก็จำเป็นที่จะต้องมีเครื่องมือที่สามารถช่วยติดตามงานในส่วนของตัวเองเช่นกัน ซึ่งหากเป็นเครื่องมือที่ทำได้ครอบคลุมกับฝั่ง ITOps แล้ว การประสานงานก็จะยิ่งง่ายขึ้นเพราะแม้จะมองต่างมุม แต่ก็สนทนากันด้วยข้อมูลเดียวกันอย่างไม่คลาดเคลื่อนนั่นเอง
ตอบโจทย์งานของ DevOps ด้วย Observability ที่ครบวงจร
หากต้องการติดตามงานของ DevOps ได้อย่างครบวงจรให้สามารถรักษาคุณภาพในการบริการให้ได้ตาม SLA เครื่องมือในการติดตามที่ดีควรจะสามารถตอบโจทย์งานได้ดังนี้
1. ติดตามประสิทธิภาพของแอปพลิเคชัน
แพลตฟอร์มด้าน Observability ควรจะสามารถติดตามค่าวัดผลต่าง ๆ (metric) ที่สามารถวินิจฉัยได้ถึงคุณภาพของแอปพลิเคชัน เช่น เวลาในการตอบสนอง (Response Time) เวลาในหน้าโหลดแต่ละหน้าเพจที่เกิดขึ้นกับผู้ใช้ (Loading Time) หรือการทำงานของ API ว่ายังเป็นไปได้ดีไหม
2. ติดตามประสิทธิภาพของ infrastructure
DevOps ก็จำเป็นต้องทราบองค์ประกอบของ Infrastructure ที่ตนเกี่ยวข้อง เช่น เซิร์ฟเวอร์ สตอเรจ เครือข่าย VM และองค์ประกอบอื่นที่สนับสนุนแอป เช่น อัตราการใช้งาน CPU ปริมาณพื้นที่ของดิสก์ที่เหลือเพื่อวางแผนในการให้บริการ
3. ติดตามประสิทธิภาพของเครือข่าย
Bandwidth ที่ใช้งานและการเคลื่อนไหวของทราฟิกในเครือข่าย อาจช่วยบ่งบอกถึงความผิดปกติของการดำเนินงานหรือแม้กระทั่งการถูกโจมตีได้เช่นกัน
4. ติดตามประสบการณ์การใช้งานของผู้ใช้
คุณภาพในมุมมองของผู้ใช้บริการ (User experience) เป็นสิ่งหนึ่งที่ละเลยไม่ได้ในมุมของผู้พัฒนาซอฟต์แวร์ ซึ่งเครื่องมือด้าน Observability ที่ดีควรจะสามารถให้ข้อมูลที่เกี่ยวกับการใช้งานในมุมมองต่าง ๆ เช่น ช่วงเวลา ชนิดอุปกรณ์ และพิกัดทางภูมิศาสตร์ ให้ทีม DevOps ได้นำกลับไปปรับปรุงและค้นหาปัญหาต่อไป
จะเห็นได้ว่าความท้าทายของงาน DevOps ก็มีอยู่ไม่น้อย โดยเครื่องมือด้าน Observability ที่ดีควรบูรณาการมุมมองเหล่านี้ได้ทั้งหมด เพื่อสกัดเป็น Insight ที่มีประโยชน์กับการทดสอบหรือ Deploy ฟังก์ชันใหม่ คุมคุณภาพของบริการให้เป็นไปตาม SLA ให้รู้ปัญหาเพื่อแก้ไขได้ก่อนผู้ใช้จะรับรู้ถึงปัญหา ตลอดจนมีข้อมูลที่คุยได้ในภาพเดียวกันกับทีม ITOps โดยคุณสมบัติเหล่านี้ อยู่ใน Dynatrace Observability Platform เรียบร้อยแล้ว ทั้งยังติดตามปัญหาได้ลึกถึงระดับ Code Level เพื่อให้ DevOps มองเห็นถึงจุดกำเนิดที่รวมตัวเป็นปัญหาได้อย่างแท้จริง
บทสรุป
ใบบทความนี้เราได้พาทุกท่านไปรู้จักกับแพลตฟอร์ม Observability ที่ดีที่จะช่วยยกระดับการทำงานของ ITOps และ DevOps ได้อย่างมีประสิทธิภาพ นำส่งบริการไอทีได้อย่างมั่นใจ ซึ่งนี่เป็นเพียงส่วนหนึ่งของความสามารถใน Dynatrace เท่านั้น เพราะมีมุมมองอีกหลายด้านที่องค์กรสามารถใช้ประโยชน์ของ Dynatrace Observability ได้เช่น วิเคราะห์ความมั่นคงปลอดภัย (Security Analytics) วิเคราะห์ประสบการณ์ด้านดิจิทัลในมุมของผู้ใช้งาน (Digital Experience) วิเคราะห์การให้บริการในเชิงธุรกิจ (Business Analytics) นอกจากนี้ ยังมีฟังก์ชันที่ช่วยในการสร้างการทำงานแบบอัตโนมัติได้ด้วยเทคโนโลยีแบบ Low-code อีกด้วย
บทความหน้าเราจะพาทุกท่านไปเจาะลึกถึงไอเดียและองค์ประกอบของ Dynatrace เพื่อเรียนรู้ถึงความชาญฉลาดที่ซ่อนอยู่ภายใต้แพลตฟอร์ม ทั้งความสามารถของ Agent (OneAgent), เทคโนโลยีที่ Dynatrace สร้างขึ้นโดยเฉพาะเพื่อติดตามข้อมูลที่กระจายตัว (PurePath), Data Lakehouse (Grail), การแสดงผลข้อมูลในรูปแบบกราฟที่ทำให้ผู้ใช้มองเห็นความสัมพันธ์ในระบบ (SmartScape) และ Davis AI ที่ช่วยค้นหาข้อมูลต่าง ๆ ได้อย่างอัตโนมัติ พร้อมทั้งเทคโนโลยี Low-code สำหรับสร้างแอปพลิเคชัน (AppEngine) และการทำงานอัตโนมัติ(AutomationEngine)
ท่านใดสนใจศึกษาข้อมูลเพิ่มเติมได้ที่ https://www.dynatrace.com หรือติดต่อทีมงาน Dynatrace Thailand ได้ที่ https://www.dynatrace.com/contact/
ข้อมูลอ้างอิง
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






