กรณีศึกษา : KBTG กับการใช้ Dynatrace  Observability

ผู้ใช้บริการของธนาคารมักต้องการเพียงผลสัมฤทธิ์ที่ว่าบริการที่พวกเขาจะใช้ต้องไม่ขัดข้อง มีฟังก์ชันการใช้งานครบครัน สะดวกสบายในการใช้งานและพร้อมตอบสนองได้ทันที  ซึ่งการที่ระบบไม่สามารถให้บริการแม้เป็นเพียงช่วงเวลาสั้นๆ มักส่งผลกระทบต่อผู้คนมากมายและธุรกิจเสมอ

แม้ภายนอกระบบ Application ต่างๆ จะราบรื่นเป็นปกติเพราะผู้คนส่วนใหญ่แทบไม่ได้รับรู้ถึงผลกระทบ แต่ด้วยความความซับซ้อนของระบบย่อมมีปัญหาเกิดขึ้นอยู่เรื่อยๆ คำถามคือทีมงานของ KBTG การรักษาสเถียรภาพให้เกิดผลกระทบน้อยที่สุดได้อย่างไร? โดยเครื่องมือ Dynatrace Observability คือหนึ่งในแกนสำคัญนั้น

บทความในครั้งนี้ทีมงาน TechTalkThai ได้รับฟังการถ่ายทอดเรื่องราวมาจากผู้ปฏิบัติงานของ KBTG ซึ่งน่าสนใจเป็นอย่างยิ่งว่าเหตุใด Observability จึงบทบาทสำคัญต่อ KBTG และเหตุใดพวกเขาต้องเลือกใช้ Dynatrace เป็นเครื่องมือหลักในงานดังกล่าว มาติดตามกันได้ในบทความนี้กันครับ

ระบบไอทีภายใต้การดูแลของทีม KBTG ถือได้ว่าเป็นบริการธนาคารรายหลักของประเทศไทยที่มีความสำคัญกับการขับเคลื่อนของเศษฐกิจเป็นอย่างยิ่ง ทำให้ต้องเผชิญกับความท้าทายอย่างมากมาย

ประการแรก คือการมีระบบไอทีจำนวนมากที่ต้องรองรับแต่ละหน่วยธุรกิจ ยกตัวอย่างเช่น ระบบ Call Center หน่วยลงทุน บริการธนาคารระดับสาขา ระบบบริการผ่านมือถือ ตลอดจนระบบสินเชื่อต่างๆ ยังไม่นับรวมการแบ่งแยกระหว่างบริการเพื่อบุคคลธรรมดาและธุรกิจอีกด้วย เพียงแค่นี้ทุกท่านคงพอจินตนาการได้บ้างแล้วว่าทีม KBTG ต้องพบกับแอปพลิเคชันที่ซับซ้อนมากเพียงใด

ประการที่สอง ธนาคารผ่านการประกอบธุรกิจมาอย่างยาวนาน ซึ่งกาลเวลาทำให้พวกเขามีนวัตกรรมทั้งเก่าและใหม่ใช้งานร่วมกัน ตั้งแต่ระบบเมนเฟรมที่เป็นแกนหลัก ไปจนถึงระบบ AI ที่ล้ำสมัย และความแตกต่างตรงนี้คืออุปสรรคหนึ่งของการแก้ปัญหาแอปพลิเคชันด้วย

ประการที่สาม ด้วยความซับซ้อนและความสำคัญของธุรกิจ ทำให้การเปลี่ยนแปลงใดๆย่อมต้องมีขั้นตอนผ่านแผน Change Management และมีการซักซ้อมหรือหารือกันเป็นอย่างดี ทำให้การเปลี่ยนแปลงต่างๆ ต้องใช้เวลามากขาดความยืดหยุ่น

ประการที่สุดท้าย ไม่ว่าระบบธุรกิจและไอที จะซับซ้อนมากแค่ไหน แต่ทีมงาน KBTG ไม่สามารถปฏิเสธความคาดหวังทั้งจากฝ่ายธุรกิจและผู้ใช้บริการทั่วไปได้ว่าระบบควรต้องพร้อมให้บริการได้เสมอ เพราะการหยุดทำงานเพียงชั่วครู่อาจส่งผลทางธุรกิจและส่งผลต่อความเชื่อมั่นของผู้ใช้บริการ และนำไปสู่ชื่อเสียงด้านลบที่แพร่สะพัดออกไปได้ทางโลกออนไลน์เพียงชั่วข้ามคืน

หากท่านเป็นผู้ปฏิบัติการด้านไอทีที่เคยผ่านการดูแลระบบไม่ว่าจะเป็นแอปพลิเคชันหรือเครือข่ายก็ตาม คำถามที่ว่า ระบบช้าตรงไหน? มักมีน้ำหนักกว่ามากกว่าการที่ระบบใช้การไม่ได้ สาเหตุเพราะการใช้ระบบไม่ได้ มักเกิดจากปัญหาที่สกัดกั้นทำงานสำคัญเอาไว้ ซึ่งเมื่อหาเจอมักแก้ได้ไม่ยาก 

ในขณะที่คำว่าระบบช้ามักนำไปสู่ปัญหาที่หลากหลายมากกว่า ที่ต้องไล่เรียงหาสาเหตุกันอย่างจริงจัง ซึ่งอาจเกิดขึ้นกับบางส่วนในเส้นทางของแอปพลิเคชัน หรือกระทบแค่ผู้ใช้งานบางกลุ่ม สร้างความฉงนสงสัยให้แก่ผู้ดูแลระบบเสมอมา

ทีมงาน KBTG เคยผ่านอดีตเหล่านี้มาเช่นกัน กับระบบมอนิเตอร์เดิมๆที่มีข้อจำกัดในการมองเห็นเพียงแค่ CPU, Memory, I/O และปัจจัยอื่นๆ ที่บอกได้เพียงภาพรวมแต่ไม่สามารถลงลึกถึงสาเหตุต้นตอของปัญหา ทำให้ต้องอาศัยคนเพื่อวิเคราะห์ Log สืบสวนเหตุการณ์ โดยกระบวนการเหล่านี้ต้องใช้ทั้งคนและเวลา จนกระทั่งเมื่อ 3-4 ปีก่อน ความซับซ้อนของ microservices ที่มีมีทราฟฟิคภายในเป็นของตัวเอง ได้สร้างความซับซ้อนให้แก่ทีมงานอย่างทวีคูณ ด้วยเหตุนี้ทีม KBTG ต้องสร้างความแตกต่างใหม่ด้วยการมองหาเครื่องมือเฝ้าสังเกตที่เรียกว่า Observability

แน่นอนว่าการคัดเลือกโซลูชันสำหรับระบบธนาคารนั้นไม่มีอะไรง่าย เพราะด้วยมูลค่าของธุรกิจทำให้ต้องมีการตั้งโจทย์การทดสอบที่เข้มข้นมาก ในหลายแง่มุม

ในเชิงของฟังก์ชันนั้นทีมงาน KBTG ตั้งโจทย์ว่าทีมงานของ Dynatrace ต้องค้นหาสาเหตุของปัญหาในวงแอปพลิเคชันทดสอบให้ได้ว่าเกิดจากจุดไหน โดยทีมงาน KBTG ได้ทำการเพิ่มโหลดให้ระบบและวางบั๊กไว้หลายจุดโดยไม่เผยข้อมูล เพื่อทดลองว่าผู้นำเสนอโซลูชันจะสามารถไขปัญหาจากข้อมูลที่ตนมีได้หรือไม่ เสมือนเป็นการทดสอบ Capture the flag เลยทีเดียว ซึ่งแน่นอนว่า Dynatrace สอบผ่านจุดนั้นมาได้

นอกจากนี้ในด้านประสิทธิภาพทีมงาน KBTG ยังต้องทดสอบว่า Agent ของผู้นำเสนอโซลูชันต่างๆ ทำให้เกิดโหลดเพิ่มขึ้นเท่าไหร่ เช่น มีอัตราการใช้งาน CPU เพิ่มกี่เปอร์เซ็นต์ หรือทำให้ภาพรวมของแอปพลิเคชันช้าลงมากแค่ไหน โดยเทียบระหว่างก่อนและหลังติดตั้ง โดย Dynatrace สามารถทำได้อย่างดีในเกณฑ์นี้เช่นกัน

ซึ่งความท้าทายในส่วน Overhead คือการหาจุดสมดุลย์ระหว่างความซับซ้อนในการเก็บข้อมูลเทียบกับโหลดที่เกิดขึ้น ทั้งนี้ Dynatrace ทำได้อย่างยอดเยี่ยม แถมยังให้ข้อมูลที่เป็นประโยชน์ต่อการแก้ปัญหาของทีมงาน KBTG อีกด้วย

ในกรณีของการใช้งานจริงนั้น KBTG พบว่า OneAgent ของ Dynatrace สามารถตรวจจับสิ่งต่างๆได้ในระบบโดยไม่จำเป็นต้องปรับจูนเครื่องมือเลยเมื่อเทียบกับผู้แข่งขันรายอื่น ที่สำคัญ Dynatrace ยังมีช่องทางการติดตั้งใช้งานแบบ On-premise ซึ่งเป็นโจทย์ด้าน Compliance ที่สำคัญของธนาคาร

จากประสบการณ์หลายปีที่ผ่านมาของ KBTG กับ Dynatrace ที่ถูกเลือกเข้าไปใช้กับระบบที่มีความหลากหลายและความซับซ้อนสูง เชื่อแน่ว่าประสบการณ์ของพวกเขาคงเป็นเสียงหนึ่งที่ให้ความมั่นใจได้ว่า Dynatrace Observability นั้นดีอย่างไร

1.) ลดเวลาการค้นหาต้นตอปัญหาได้นับสิบเท่า

โดยปกติแล้วทั้งการหาสาเหตุต้นตอของปัญหา (root cause) และการแก้ไขปัญหาที่เกิดขึ้นกับแอปพลิเคชันอาจต้องใช้เวลานาน ทีมดูแลระบบอาจต้องเรียกทุกฝ่ายที่เกี่ยวข้องทุกฝ่ายเข้ามาเพื่อวิเคราะห์หาสาเหตร่วมกัน เมื่อทราบถึงสาเหตุต้นตอของปัญหาที่เกิดขึ้นที่ทำให้ระบบช้า ทุกฝ่ายต้องแก้ไขปัญหาร่วมกัน โดยในอดีตมักมีความซ้ำซ้อนของการแจ้งเตือนของปัญหาที่เกิดขึ้นด้วย 

ยกตัวอย่างเช่น การที่แอปพลิเคชัน 3 ตัวที่ระบบไม่ได้เกี่ยวข้องกัน แต่ต้องใช้ฐานข้อมูลร่วมกัน โดยหากฐานข้อมูลเกิดโหลดหนักเกินไป ทีมดูแลก็ต้องได้รับการแจ้งเตือนปัญหาถึง 3 เหตุการณ์ ทั้งๆที่มีเพียงฐานข้อมูลตัวเดียวเท่านั้นที่เป็นปัญหา แต่สถานการณ์กลับกระทบต่อผู้ดูแลแอปพลิเคชันทุกฝ่ายที่ต้องเข้ามาร่วมกันแก้ไขปัญหาอย่างไม่ตรงจุด เสียเวลาของบุคคลากรที่ไม่ได้รับผิดชอบโดยตรงต่อต้นตอของปัญหา

ปัญหาข้างต้นนี้สามารถถูกแก้ไขได้ด้วย Dynatrace เนื่องจากการมีภาพที่มองเห็นถึงปัญหาภาพรวมในแต่ละจุดได้ ลดการติดต่อประสานงานทุกฝ่าย ที่สามารถชี้ปัญหาได้อย่างเจาะจงว่าเกิดจากอะไร รวมถึง Dynatrace ยังใช้ AI ช่วยวิเคราะห์หาสาเหตุของปัญหา และสรุปกลุ่มของปัญหาออกมาให้ทีมงานเห็นภาพเดียวกันได้ โดยจากคำบอกเล่าประมาณการได้ว่าทีม KBTG ใช้เวลาแก้ปัญหาลดลงได้นับสิบเท่า

2.) เริ่มต้นได้ไวใช้เวลาน้อย

Dynatrace OneAgent คือ Agent ที่คอยเก็บข้อมูลของระบบที่ถูกนำไปติดตั้งในเครื่องที่ผู้ใช้สนใจ โดย OneAgent รองรับทุกแพลตฟอร์มและภาษาโปรแกรม อัดแน่นมาพร้อมกับทุกฟีเจอร์ ซึ่งขั้นตอนในการติดตั้งของ Dynatrace ทำได้อย่างรวดเร็วและง่ายดาย มีหน้าจอที่สามารถดาวน์โหลด OneAgent ได้อย่างอัตโนมัติ พร้อมสคิร์ปต์ที่ช่วยให้เครื่องเป้าหมายติดตั้ง Agent ได้พร้อมกัน ทำให้ทีมงาน KBTG สามารถติดตั้ง Agent ให้กับเครื่องจำนวนมากได้อย่างง่ายดาย เป็นที่มาของการตอบโจทย์ที่ว่า เริ่มต้นได้ไวและใช้เวลาน้อย

3.) เข้าใจแอปพลิเคชันที่ซับซ้อนได้ง่ายๆ

อีกหนึ่งฟังก์ชันหลักของระบบ Observability คือการใช้เพื่อทำความเข้าใจภาพรวมการทำงานของแอปพลิเคชันอันซับซ้อนได้ ยกตัวอย่างเช่นนักพัฒนาหน้าใหม่ที่ไม่เคยรู้จักกับแอปพลิเคชันของ KBTG มาก่อน อาจใช้เครื่องมือนี้เพื่อศึกษาแอปพลิเคชันที่แตกตัวเป็น microservice ให้เข้าใจเส้นทางการทำงานได้มากขึ้น หรือแม้กระทั่งทีมงาน Infrastructure ก็สามารถเรียนรู้ภาพรวมของแอปพลิเคชันเพื่อนำไปวิเคราะห์การแก้ปัญหาได้

4.) แก้ปัญหาได้ก่อนเกิดเหตุ

KBTG ยังได้มีการนำ Dynatrace ไปใช้ในกระบวนการ Development ในฝั่งของนักพัฒนาอีกด้วย ผลที่เกิดขึ้นคือเมื่อนักพัฒนาสามารถใช้เครื่องมือนี้ได้เอง พวกเขาก็สามารถเข้าใจถึงประสิทธิภาพในแต่ละจุดได้เป็นอย่างดีตั้งแต่ก่อนนำขึ้น Production ไม่ต้องไปตามแก้ไขภายหลัง ในจุดนี้นอกจากจะป้องกันปัญหาที่จะเกิดขึ้นใน Production ได้ล่วงหน้าแล้ว ยังสามารถนำแอปพลิเคชันออกสู่ตลาดได้ไวขึ้นส่งผลดีต่อธุรกิจอย่างมาก

5.) ไม่ต้องดูแลการอัปเดต Agent

Agent ของระบบมอนิเตอร์ในอดีตอาจมีต้องคอยติดตามอัปเดตด้วยตัวเอง แต่ไม่ใช่กับ OneAgent ของ Dynatrace ที่สามารถอัปเดตตัวเองได้อัตโนมัติเพื่อเพิ่มเติมฟังก์ชันใหม่เข้ามา ทำให้ทีมงาน KBTG ไม่จำเป็นต้องสูญเสียเวลาของบุคลากรสำหรับดูแลงานส่วนนี้ และสามารถมั่นใจได้ว่า OneAgent ทุกตัวเป็นเวอร์ชันล่าสุดที่มีฟังก์ชันใหม่อยู่เสมอ

6.) Davis AI ผู้มาก่อนกาล

Davis AI เกิดขึ้นหลายปีก่อนหน้าที่โลกจะตระหนักถึงความสามารถของ AI จาก ChatGPT ด้วยซ้ำ ซึ่ง Davis AI ได้ช่วยโปรไฟล์การทำงานของแอปพลิเคชันยามปกติ เพื่อใช้คาดการณ์ความผิดปกติที่เบี่ยงเบนออกจากค่า Threshold เหล่านั้น พร้อมคำแจ้งเตือน โดยทีมงาน KBTG ได้ใช้ประโยชน์ความจากสามารถนี้มานานแล้ว ที่ช่วยหาสาเหตุของปัญหาอย่างแม่นยำและทันท่วงที

ในบทความนี้เราได้นำคำบอกเล่าจากผู้ใช้งาน Dynatrace ตัวจริง ซึ่งความท้าทายก็คือ การบริหารจัดการระบบจำนวนมากที่มีความซับซ้อนสูงให้ทำงานได้เต็มประสิทธิภาพตลอดเวลา โดยถือได้ว่า ด้วยเหตุนี้เอง KBTG คือตัวแทนของลูกค้าที่มีการใช้เครื่องมือ Observability อย่างเข้มข้น

ในมุมของ Dynatrace เองก็ผ่านด่านทดสอบมาอย่างมากมายทั้งเรื่อง ประสิทธิภาพ คุณภาพ และการพัฒนาด้านเทคโนโลยีอย่างต่อเนื่องจนเป็นผู้นำในด้านเครื่องมือ Observability ประกอบกับความง่ายต่อการใช้งาน จนกระทั่งได้กลายมาเป็นผู้ช่วยหลักต่อการแก้ปัญหาใน KBTG โดยจากประสบการณ์ที่ผ่านมาของทีมงานพบว่า Dynatrace มีจุดเด่นหลายเรื่องอย่างที่กล่าวไปแล้วข้างต้น

สนใจโซลูชันด้าน Observability จาก Dynatrace ติดต่อทีมงานดูแลประจำประเทศไทยได้ที่ https://www.dynatrace.com/contact/

About nattakon

จบการศึกษา ปริญญาตรีและโท สาขาวิศวกรรมคอมพิวเตอร์ KMITL เคยทำงานด้าน Engineer/Presale ดูแลผลิตภัณฑ์ด้าน Network Security และ Public Cloud ในประเทศ ปัจจุบันเป็นนักเขียน Full-time ที่ TechTalkThai

Check Also

Elastic 9.4 ออกแล้ว

Elastic ได้ออกมาประกาศเปิดตัว Elastic 9.4 อย่างเป็นทางการ โดยเพิ่มความสามารถในการตรวจสอบการทำงานของ Context Engineering, Application และ Infrastructure เพิ่มเติม, เสริม AI ในการรักษาความมั่นคงปลอดภัย และเพิ่มความสามารถอื่นๆ อีกมากมาย ดังนี้

Extreme Networks เปิดตัว Wi-Fi 7 AP รุ่นใหม่ พร้อม Agentic AI สำหรับบริหารจัดการระบบเครือข่ายแบบอัตโนมัติ

Extreme Networks ได้ออกมาประกาศถึงอัปเดตครั้งใหญ่ โดยเปิดตัว Wi-Fi 7 Access Point รุ่นใหม่ล่าสุด 5 รุ่น พร้อมนวัตกรรมใหม่ในการบริหารจัดการระบบเครือข่ายด้วย AI Agent เพื่อดูแลรักษาระบบเครือข่ายขององค์กรให้ทำงานได้อย่างต่อเนื่องโดยอัตโนมัติ