กรณีศึกษา : KBTG กับการใช้ Dynatrace  Observability

ผู้ใช้บริการของธนาคารมักต้องการเพียงผลสัมฤทธิ์ที่ว่าบริการที่พวกเขาจะใช้ต้องไม่ขัดข้อง มีฟังก์ชันการใช้งานครบครัน สะดวกสบายในการใช้งานและพร้อมตอบสนองได้ทันที  ซึ่งการที่ระบบไม่สามารถให้บริการแม้เป็นเพียงช่วงเวลาสั้นๆ มักส่งผลกระทบต่อผู้คนมากมายและธุรกิจเสมอ

แม้ภายนอกระบบ Application ต่างๆ จะราบรื่นเป็นปกติเพราะผู้คนส่วนใหญ่แทบไม่ได้รับรู้ถึงผลกระทบ แต่ด้วยความความซับซ้อนของระบบย่อมมีปัญหาเกิดขึ้นอยู่เรื่อยๆ คำถามคือทีมงานของ KBTG การรักษาสเถียรภาพให้เกิดผลกระทบน้อยที่สุดได้อย่างไร? โดยเครื่องมือ Dynatrace Observability คือหนึ่งในแกนสำคัญนั้น

บทความในครั้งนี้ทีมงาน TechTalkThai ได้รับฟังการถ่ายทอดเรื่องราวมาจากผู้ปฏิบัติงานของ KBTG ซึ่งน่าสนใจเป็นอย่างยิ่งว่าเหตุใด Observability จึงบทบาทสำคัญต่อ KBTG และเหตุใดพวกเขาต้องเลือกใช้ Dynatrace เป็นเครื่องมือหลักในงานดังกล่าว มาติดตามกันได้ในบทความนี้กันครับ

ระบบไอทีภายใต้การดูแลของทีม KBTG ถือได้ว่าเป็นบริการธนาคารรายหลักของประเทศไทยที่มีความสำคัญกับการขับเคลื่อนของเศษฐกิจเป็นอย่างยิ่ง ทำให้ต้องเผชิญกับความท้าทายอย่างมากมาย

ประการแรก คือการมีระบบไอทีจำนวนมากที่ต้องรองรับแต่ละหน่วยธุรกิจ ยกตัวอย่างเช่น ระบบ Call Center หน่วยลงทุน บริการธนาคารระดับสาขา ระบบบริการผ่านมือถือ ตลอดจนระบบสินเชื่อต่างๆ ยังไม่นับรวมการแบ่งแยกระหว่างบริการเพื่อบุคคลธรรมดาและธุรกิจอีกด้วย เพียงแค่นี้ทุกท่านคงพอจินตนาการได้บ้างแล้วว่าทีม KBTG ต้องพบกับแอปพลิเคชันที่ซับซ้อนมากเพียงใด

ประการที่สอง ธนาคารผ่านการประกอบธุรกิจมาอย่างยาวนาน ซึ่งกาลเวลาทำให้พวกเขามีนวัตกรรมทั้งเก่าและใหม่ใช้งานร่วมกัน ตั้งแต่ระบบเมนเฟรมที่เป็นแกนหลัก ไปจนถึงระบบ AI ที่ล้ำสมัย และความแตกต่างตรงนี้คืออุปสรรคหนึ่งของการแก้ปัญหาแอปพลิเคชันด้วย

ประการที่สาม ด้วยความซับซ้อนและความสำคัญของธุรกิจ ทำให้การเปลี่ยนแปลงใดๆย่อมต้องมีขั้นตอนผ่านแผน Change Management และมีการซักซ้อมหรือหารือกันเป็นอย่างดี ทำให้การเปลี่ยนแปลงต่างๆ ต้องใช้เวลามากขาดความยืดหยุ่น

ประการที่สุดท้าย ไม่ว่าระบบธุรกิจและไอที จะซับซ้อนมากแค่ไหน แต่ทีมงาน KBTG ไม่สามารถปฏิเสธความคาดหวังทั้งจากฝ่ายธุรกิจและผู้ใช้บริการทั่วไปได้ว่าระบบควรต้องพร้อมให้บริการได้เสมอ เพราะการหยุดทำงานเพียงชั่วครู่อาจส่งผลทางธุรกิจและส่งผลต่อความเชื่อมั่นของผู้ใช้บริการ และนำไปสู่ชื่อเสียงด้านลบที่แพร่สะพัดออกไปได้ทางโลกออนไลน์เพียงชั่วข้ามคืน

หากท่านเป็นผู้ปฏิบัติการด้านไอทีที่เคยผ่านการดูแลระบบไม่ว่าจะเป็นแอปพลิเคชันหรือเครือข่ายก็ตาม คำถามที่ว่า ระบบช้าตรงไหน? มักมีน้ำหนักกว่ามากกว่าการที่ระบบใช้การไม่ได้ สาเหตุเพราะการใช้ระบบไม่ได้ มักเกิดจากปัญหาที่สกัดกั้นทำงานสำคัญเอาไว้ ซึ่งเมื่อหาเจอมักแก้ได้ไม่ยาก 

ในขณะที่คำว่าระบบช้ามักนำไปสู่ปัญหาที่หลากหลายมากกว่า ที่ต้องไล่เรียงหาสาเหตุกันอย่างจริงจัง ซึ่งอาจเกิดขึ้นกับบางส่วนในเส้นทางของแอปพลิเคชัน หรือกระทบแค่ผู้ใช้งานบางกลุ่ม สร้างความฉงนสงสัยให้แก่ผู้ดูแลระบบเสมอมา

ทีมงาน KBTG เคยผ่านอดีตเหล่านี้มาเช่นกัน กับระบบมอนิเตอร์เดิมๆที่มีข้อจำกัดในการมองเห็นเพียงแค่ CPU, Memory, I/O และปัจจัยอื่นๆ ที่บอกได้เพียงภาพรวมแต่ไม่สามารถลงลึกถึงสาเหตุต้นตอของปัญหา ทำให้ต้องอาศัยคนเพื่อวิเคราะห์ Log สืบสวนเหตุการณ์ โดยกระบวนการเหล่านี้ต้องใช้ทั้งคนและเวลา จนกระทั่งเมื่อ 3-4 ปีก่อน ความซับซ้อนของ microservices ที่มีมีทราฟฟิคภายในเป็นของตัวเอง ได้สร้างความซับซ้อนให้แก่ทีมงานอย่างทวีคูณ ด้วยเหตุนี้ทีม KBTG ต้องสร้างความแตกต่างใหม่ด้วยการมองหาเครื่องมือเฝ้าสังเกตที่เรียกว่า Observability

แน่นอนว่าการคัดเลือกโซลูชันสำหรับระบบธนาคารนั้นไม่มีอะไรง่าย เพราะด้วยมูลค่าของธุรกิจทำให้ต้องมีการตั้งโจทย์การทดสอบที่เข้มข้นมาก ในหลายแง่มุม

ในเชิงของฟังก์ชันนั้นทีมงาน KBTG ตั้งโจทย์ว่าทีมงานของ Dynatrace ต้องค้นหาสาเหตุของปัญหาในวงแอปพลิเคชันทดสอบให้ได้ว่าเกิดจากจุดไหน โดยทีมงาน KBTG ได้ทำการเพิ่มโหลดให้ระบบและวางบั๊กไว้หลายจุดโดยไม่เผยข้อมูล เพื่อทดลองว่าผู้นำเสนอโซลูชันจะสามารถไขปัญหาจากข้อมูลที่ตนมีได้หรือไม่ เสมือนเป็นการทดสอบ Capture the flag เลยทีเดียว ซึ่งแน่นอนว่า Dynatrace สอบผ่านจุดนั้นมาได้

นอกจากนี้ในด้านประสิทธิภาพทีมงาน KBTG ยังต้องทดสอบว่า Agent ของผู้นำเสนอโซลูชันต่างๆ ทำให้เกิดโหลดเพิ่มขึ้นเท่าไหร่ เช่น มีอัตราการใช้งาน CPU เพิ่มกี่เปอร์เซ็นต์ หรือทำให้ภาพรวมของแอปพลิเคชันช้าลงมากแค่ไหน โดยเทียบระหว่างก่อนและหลังติดตั้ง โดย Dynatrace สามารถทำได้อย่างดีในเกณฑ์นี้เช่นกัน

ซึ่งความท้าทายในส่วน Overhead คือการหาจุดสมดุลย์ระหว่างความซับซ้อนในการเก็บข้อมูลเทียบกับโหลดที่เกิดขึ้น ทั้งนี้ Dynatrace ทำได้อย่างยอดเยี่ยม แถมยังให้ข้อมูลที่เป็นประโยชน์ต่อการแก้ปัญหาของทีมงาน KBTG อีกด้วย

ในกรณีของการใช้งานจริงนั้น KBTG พบว่า OneAgent ของ Dynatrace สามารถตรวจจับสิ่งต่างๆได้ในระบบโดยไม่จำเป็นต้องปรับจูนเครื่องมือเลยเมื่อเทียบกับผู้แข่งขันรายอื่น ที่สำคัญ Dynatrace ยังมีช่องทางการติดตั้งใช้งานแบบ On-premise ซึ่งเป็นโจทย์ด้าน Compliance ที่สำคัญของธนาคาร

จากประสบการณ์หลายปีที่ผ่านมาของ KBTG กับ Dynatrace ที่ถูกเลือกเข้าไปใช้กับระบบที่มีความหลากหลายและความซับซ้อนสูง เชื่อแน่ว่าประสบการณ์ของพวกเขาคงเป็นเสียงหนึ่งที่ให้ความมั่นใจได้ว่า Dynatrace Observability นั้นดีอย่างไร

1.) ลดเวลาการค้นหาต้นตอปัญหาได้นับสิบเท่า

โดยปกติแล้วทั้งการหาสาเหตุต้นตอของปัญหา (root cause) และการแก้ไขปัญหาที่เกิดขึ้นกับแอปพลิเคชันอาจต้องใช้เวลานาน ทีมดูแลระบบอาจต้องเรียกทุกฝ่ายที่เกี่ยวข้องทุกฝ่ายเข้ามาเพื่อวิเคราะห์หาสาเหตร่วมกัน เมื่อทราบถึงสาเหตุต้นตอของปัญหาที่เกิดขึ้นที่ทำให้ระบบช้า ทุกฝ่ายต้องแก้ไขปัญหาร่วมกัน โดยในอดีตมักมีความซ้ำซ้อนของการแจ้งเตือนของปัญหาที่เกิดขึ้นด้วย 

ยกตัวอย่างเช่น การที่แอปพลิเคชัน 3 ตัวที่ระบบไม่ได้เกี่ยวข้องกัน แต่ต้องใช้ฐานข้อมูลร่วมกัน โดยหากฐานข้อมูลเกิดโหลดหนักเกินไป ทีมดูแลก็ต้องได้รับการแจ้งเตือนปัญหาถึง 3 เหตุการณ์ ทั้งๆที่มีเพียงฐานข้อมูลตัวเดียวเท่านั้นที่เป็นปัญหา แต่สถานการณ์กลับกระทบต่อผู้ดูแลแอปพลิเคชันทุกฝ่ายที่ต้องเข้ามาร่วมกันแก้ไขปัญหาอย่างไม่ตรงจุด เสียเวลาของบุคคลากรที่ไม่ได้รับผิดชอบโดยตรงต่อต้นตอของปัญหา

ปัญหาข้างต้นนี้สามารถถูกแก้ไขได้ด้วย Dynatrace เนื่องจากการมีภาพที่มองเห็นถึงปัญหาภาพรวมในแต่ละจุดได้ ลดการติดต่อประสานงานทุกฝ่าย ที่สามารถชี้ปัญหาได้อย่างเจาะจงว่าเกิดจากอะไร รวมถึง Dynatrace ยังใช้ AI ช่วยวิเคราะห์หาสาเหตุของปัญหา และสรุปกลุ่มของปัญหาออกมาให้ทีมงานเห็นภาพเดียวกันได้ โดยจากคำบอกเล่าประมาณการได้ว่าทีม KBTG ใช้เวลาแก้ปัญหาลดลงได้นับสิบเท่า

2.) เริ่มต้นได้ไวใช้เวลาน้อย

Dynatrace OneAgent คือ Agent ที่คอยเก็บข้อมูลของระบบที่ถูกนำไปติดตั้งในเครื่องที่ผู้ใช้สนใจ โดย OneAgent รองรับทุกแพลตฟอร์มและภาษาโปรแกรม อัดแน่นมาพร้อมกับทุกฟีเจอร์ ซึ่งขั้นตอนในการติดตั้งของ Dynatrace ทำได้อย่างรวดเร็วและง่ายดาย มีหน้าจอที่สามารถดาวน์โหลด OneAgent ได้อย่างอัตโนมัติ พร้อมสคิร์ปต์ที่ช่วยให้เครื่องเป้าหมายติดตั้ง Agent ได้พร้อมกัน ทำให้ทีมงาน KBTG สามารถติดตั้ง Agent ให้กับเครื่องจำนวนมากได้อย่างง่ายดาย เป็นที่มาของการตอบโจทย์ที่ว่า เริ่มต้นได้ไวและใช้เวลาน้อย

3.) เข้าใจแอปพลิเคชันที่ซับซ้อนได้ง่ายๆ

อีกหนึ่งฟังก์ชันหลักของระบบ Observability คือการใช้เพื่อทำความเข้าใจภาพรวมการทำงานของแอปพลิเคชันอันซับซ้อนได้ ยกตัวอย่างเช่นนักพัฒนาหน้าใหม่ที่ไม่เคยรู้จักกับแอปพลิเคชันของ KBTG มาก่อน อาจใช้เครื่องมือนี้เพื่อศึกษาแอปพลิเคชันที่แตกตัวเป็น microservice ให้เข้าใจเส้นทางการทำงานได้มากขึ้น หรือแม้กระทั่งทีมงาน Infrastructure ก็สามารถเรียนรู้ภาพรวมของแอปพลิเคชันเพื่อนำไปวิเคราะห์การแก้ปัญหาได้

4.) แก้ปัญหาได้ก่อนเกิดเหตุ

KBTG ยังได้มีการนำ Dynatrace ไปใช้ในกระบวนการ Development ในฝั่งของนักพัฒนาอีกด้วย ผลที่เกิดขึ้นคือเมื่อนักพัฒนาสามารถใช้เครื่องมือนี้ได้เอง พวกเขาก็สามารถเข้าใจถึงประสิทธิภาพในแต่ละจุดได้เป็นอย่างดีตั้งแต่ก่อนนำขึ้น Production ไม่ต้องไปตามแก้ไขภายหลัง ในจุดนี้นอกจากจะป้องกันปัญหาที่จะเกิดขึ้นใน Production ได้ล่วงหน้าแล้ว ยังสามารถนำแอปพลิเคชันออกสู่ตลาดได้ไวขึ้นส่งผลดีต่อธุรกิจอย่างมาก

5.) ไม่ต้องดูแลการอัปเดต Agent

Agent ของระบบมอนิเตอร์ในอดีตอาจมีต้องคอยติดตามอัปเดตด้วยตัวเอง แต่ไม่ใช่กับ OneAgent ของ Dynatrace ที่สามารถอัปเดตตัวเองได้อัตโนมัติเพื่อเพิ่มเติมฟังก์ชันใหม่เข้ามา ทำให้ทีมงาน KBTG ไม่จำเป็นต้องสูญเสียเวลาของบุคลากรสำหรับดูแลงานส่วนนี้ และสามารถมั่นใจได้ว่า OneAgent ทุกตัวเป็นเวอร์ชันล่าสุดที่มีฟังก์ชันใหม่อยู่เสมอ

6.) Davis AI ผู้มาก่อนกาล

Davis AI เกิดขึ้นหลายปีก่อนหน้าที่โลกจะตระหนักถึงความสามารถของ AI จาก ChatGPT ด้วยซ้ำ ซึ่ง Davis AI ได้ช่วยโปรไฟล์การทำงานของแอปพลิเคชันยามปกติ เพื่อใช้คาดการณ์ความผิดปกติที่เบี่ยงเบนออกจากค่า Threshold เหล่านั้น พร้อมคำแจ้งเตือน โดยทีมงาน KBTG ได้ใช้ประโยชน์ความจากสามารถนี้มานานแล้ว ที่ช่วยหาสาเหตุของปัญหาอย่างแม่นยำและทันท่วงที

ในบทความนี้เราได้นำคำบอกเล่าจากผู้ใช้งาน Dynatrace ตัวจริง ซึ่งความท้าทายก็คือ การบริหารจัดการระบบจำนวนมากที่มีความซับซ้อนสูงให้ทำงานได้เต็มประสิทธิภาพตลอดเวลา โดยถือได้ว่า ด้วยเหตุนี้เอง KBTG คือตัวแทนของลูกค้าที่มีการใช้เครื่องมือ Observability อย่างเข้มข้น

ในมุมของ Dynatrace เองก็ผ่านด่านทดสอบมาอย่างมากมายทั้งเรื่อง ประสิทธิภาพ คุณภาพ และการพัฒนาด้านเทคโนโลยีอย่างต่อเนื่องจนเป็นผู้นำในด้านเครื่องมือ Observability ประกอบกับความง่ายต่อการใช้งาน จนกระทั่งได้กลายมาเป็นผู้ช่วยหลักต่อการแก้ปัญหาใน KBTG โดยจากประสบการณ์ที่ผ่านมาของทีมงานพบว่า Dynatrace มีจุดเด่นหลายเรื่องอย่างที่กล่าวไปแล้วข้างต้น

สนใจโซลูชันด้าน Observability จาก Dynatrace ติดต่อทีมงานดูแลประจำประเทศไทยได้ที่ https://www.dynatrace.com/contact/

About nattakon

จบการศึกษา ปริญญาตรีและโท สาขาวิศวกรรมคอมพิวเตอร์ KMITL เคยทำงานด้าน Engineer/Presale ดูแลผลิตภัณฑ์ด้าน Network Security และ Public Cloud ในประเทศ ปัจจุบันเป็นนักเขียน Full-time ที่ TechTalkThai

Check Also

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce

Cisco ออกแพตช์แก้ช่องโหว่ Zero-day บน Catalyst SD-WAN Manager ที่ถูกใช้โจมตียกระดับสิทธิ์เป็น root

Cisco ปล่อยอัปเดตด้านความปลอดภัยแก้ช่องโหว่บน Catalyst SD-WAN Manager (เดิมคือ SD-WAN vManage) หลังพบว่าถูกใช้โจมตีจริงในลักษณะ Zero-day เพื่อยกระดับสิทธิ์เป็น root บนระบบที่ได้รับผลกระทบ