
ผู้ใช้บริการของธนาคารมักต้องการเพียงผลสัมฤทธิ์ที่ว่าบริการที่พวกเขาจะใช้ต้องไม่ขัดข้อง มีฟังก์ชันการใช้งานครบครัน สะดวกสบายในการใช้งานและพร้อมตอบสนองได้ทันที ซึ่งการที่ระบบไม่สามารถให้บริการแม้เป็นเพียงช่วงเวลาสั้นๆ มักส่งผลกระทบต่อผู้คนมากมายและธุรกิจเสมอ
แม้ภายนอกระบบ Application ต่างๆ จะราบรื่นเป็นปกติเพราะผู้คนส่วนใหญ่แทบไม่ได้รับรู้ถึงผลกระทบ แต่ด้วยความความซับซ้อนของระบบย่อมมีปัญหาเกิดขึ้นอยู่เรื่อยๆ คำถามคือทีมงานของ KBTG การรักษาสเถียรภาพให้เกิดผลกระทบน้อยที่สุดได้อย่างไร? โดยเครื่องมือ Dynatrace Observability คือหนึ่งในแกนสำคัญนั้น
บทความในครั้งนี้ทีมงาน TechTalkThai ได้รับฟังการถ่ายทอดเรื่องราวมาจากผู้ปฏิบัติงานของ KBTG ซึ่งน่าสนใจเป็นอย่างยิ่งว่าเหตุใด Observability จึงบทบาทสำคัญต่อ KBTG และเหตุใดพวกเขาต้องเลือกใช้ Dynatrace เป็นเครื่องมือหลักในงานดังกล่าว มาติดตามกันได้ในบทความนี้กันครับ
ความท้าทายมากแต่ความคาดหวังสูง ความคาดหวังที่สูงซ่อนไปด้วยความท้าทายที่มากมายอยู่เบื้องหลัง
ระบบไอทีภายใต้การดูแลของทีม KBTG ถือได้ว่าเป็นบริการธนาคารรายหลักของประเทศไทยที่มีความสำคัญกับการขับเคลื่อนของเศษฐกิจเป็นอย่างยิ่ง ทำให้ต้องเผชิญกับความท้าทายอย่างมากมาย
ประการแรก คือการมีระบบไอทีจำนวนมากที่ต้องรองรับแต่ละหน่วยธุรกิจ ยกตัวอย่างเช่น ระบบ Call Center หน่วยลงทุน บริการธนาคารระดับสาขา ระบบบริการผ่านมือถือ ตลอดจนระบบสินเชื่อต่างๆ ยังไม่นับรวมการแบ่งแยกระหว่างบริการเพื่อบุคคลธรรมดาและธุรกิจอีกด้วย เพียงแค่นี้ทุกท่านคงพอจินตนาการได้บ้างแล้วว่าทีม KBTG ต้องพบกับแอปพลิเคชันที่ซับซ้อนมากเพียงใด
ประการที่สอง ธนาคารผ่านการประกอบธุรกิจมาอย่างยาวนาน ซึ่งกาลเวลาทำให้พวกเขามีนวัตกรรมทั้งเก่าและใหม่ใช้งานร่วมกัน ตั้งแต่ระบบเมนเฟรมที่เป็นแกนหลัก ไปจนถึงระบบ AI ที่ล้ำสมัย และความแตกต่างตรงนี้คืออุปสรรคหนึ่งของการแก้ปัญหาแอปพลิเคชันด้วย
ประการที่สาม ด้วยความซับซ้อนและความสำคัญของธุรกิจ ทำให้การเปลี่ยนแปลงใดๆย่อมต้องมีขั้นตอนผ่านแผน Change Management และมีการซักซ้อมหรือหารือกันเป็นอย่างดี ทำให้การเปลี่ยนแปลงต่างๆ ต้องใช้เวลามากขาดความยืดหยุ่น
ประการที่สุดท้าย ไม่ว่าระบบธุรกิจและไอที จะซับซ้อนมากแค่ไหน แต่ทีมงาน KBTG ไม่สามารถปฏิเสธความคาดหวังทั้งจากฝ่ายธุรกิจและผู้ใช้บริการทั่วไปได้ว่าระบบควรต้องพร้อมให้บริการได้เสมอ เพราะการหยุดทำงานเพียงชั่วครู่อาจส่งผลทางธุรกิจและส่งผลต่อความเชื่อมั่นของผู้ใช้บริการ และนำไปสู่ชื่อเสียงด้านลบที่แพร่สะพัดออกไปได้ทางโลกออนไลน์เพียงชั่วข้ามคืน
ช้าตรงไหน? – จุดกำเนิดของ Observability ใน KBTG

หากท่านเป็นผู้ปฏิบัติการด้านไอทีที่เคยผ่านการดูแลระบบไม่ว่าจะเป็นแอปพลิเคชันหรือเครือข่ายก็ตาม คำถามที่ว่า ระบบช้าตรงไหน? มักมีน้ำหนักกว่ามากกว่าการที่ระบบใช้การไม่ได้ สาเหตุเพราะการใช้ระบบไม่ได้ มักเกิดจากปัญหาที่สกัดกั้นทำงานสำคัญเอาไว้ ซึ่งเมื่อหาเจอมักแก้ได้ไม่ยาก
ในขณะที่คำว่าระบบช้ามักนำไปสู่ปัญหาที่หลากหลายมากกว่า ที่ต้องไล่เรียงหาสาเหตุกันอย่างจริงจัง ซึ่งอาจเกิดขึ้นกับบางส่วนในเส้นทางของแอปพลิเคชัน หรือกระทบแค่ผู้ใช้งานบางกลุ่ม สร้างความฉงนสงสัยให้แก่ผู้ดูแลระบบเสมอมา
ทีมงาน KBTG เคยผ่านอดีตเหล่านี้มาเช่นกัน กับระบบมอนิเตอร์เดิมๆที่มีข้อจำกัดในการมองเห็นเพียงแค่ CPU, Memory, I/O และปัจจัยอื่นๆ ที่บอกได้เพียงภาพรวมแต่ไม่สามารถลงลึกถึงสาเหตุต้นตอของปัญหา ทำให้ต้องอาศัยคนเพื่อวิเคราะห์ Log สืบสวนเหตุการณ์ โดยกระบวนการเหล่านี้ต้องใช้ทั้งคนและเวลา จนกระทั่งเมื่อ 3-4 ปีก่อน ความซับซ้อนของ microservices ที่มีมีทราฟฟิคภายในเป็นของตัวเอง ได้สร้างความซับซ้อนให้แก่ทีมงานอย่างทวีคูณ ด้วยเหตุนี้ทีม KBTG ต้องสร้างความแตกต่างใหม่ด้วยการมองหาเครื่องมือเฝ้าสังเกตที่เรียกว่า Observability
ฝ่าด่านทดสอบสุดหิน – กว่าจะเป็น Dynatrace
แน่นอนว่าการคัดเลือกโซลูชันสำหรับระบบธนาคารนั้นไม่มีอะไรง่าย เพราะด้วยมูลค่าของธุรกิจทำให้ต้องมีการตั้งโจทย์การทดสอบที่เข้มข้นมาก ในหลายแง่มุม
ในเชิงของฟังก์ชันนั้นทีมงาน KBTG ตั้งโจทย์ว่าทีมงานของ Dynatrace ต้องค้นหาสาเหตุของปัญหาในวงแอปพลิเคชันทดสอบให้ได้ว่าเกิดจากจุดไหน โดยทีมงาน KBTG ได้ทำการเพิ่มโหลดให้ระบบและวางบั๊กไว้หลายจุดโดยไม่เผยข้อมูล เพื่อทดลองว่าผู้นำเสนอโซลูชันจะสามารถไขปัญหาจากข้อมูลที่ตนมีได้หรือไม่ เสมือนเป็นการทดสอบ Capture the flag เลยทีเดียว ซึ่งแน่นอนว่า Dynatrace สอบผ่านจุดนั้นมาได้
นอกจากนี้ในด้านประสิทธิภาพทีมงาน KBTG ยังต้องทดสอบว่า Agent ของผู้นำเสนอโซลูชันต่างๆ ทำให้เกิดโหลดเพิ่มขึ้นเท่าไหร่ เช่น มีอัตราการใช้งาน CPU เพิ่มกี่เปอร์เซ็นต์ หรือทำให้ภาพรวมของแอปพลิเคชันช้าลงมากแค่ไหน โดยเทียบระหว่างก่อนและหลังติดตั้ง โดย Dynatrace สามารถทำได้อย่างดีในเกณฑ์นี้เช่นกัน
ซึ่งความท้าทายในส่วน Overhead คือการหาจุดสมดุลย์ระหว่างความซับซ้อนในการเก็บข้อมูลเทียบกับโหลดที่เกิดขึ้น ทั้งนี้ Dynatrace ทำได้อย่างยอดเยี่ยม แถมยังให้ข้อมูลที่เป็นประโยชน์ต่อการแก้ปัญหาของทีมงาน KBTG อีกด้วย
ในกรณีของการใช้งานจริงนั้น KBTG พบว่า OneAgent ของ Dynatrace สามารถตรวจจับสิ่งต่างๆได้ในระบบโดยไม่จำเป็นต้องปรับจูนเครื่องมือเลยเมื่อเทียบกับผู้แข่งขันรายอื่น ที่สำคัญ Dynatrace ยังมีช่องทางการติดตั้งใช้งานแบบ On-premise ซึ่งเป็นโจทย์ด้าน Compliance ที่สำคัญของธนาคาร
ความพึงพอใจต่อ Dynatrace Observability ที่ KBTG อยากบอกต่อ
จากประสบการณ์หลายปีที่ผ่านมาของ KBTG กับ Dynatrace ที่ถูกเลือกเข้าไปใช้กับระบบที่มีความหลากหลายและความซับซ้อนสูง เชื่อแน่ว่าประสบการณ์ของพวกเขาคงเป็นเสียงหนึ่งที่ให้ความมั่นใจได้ว่า Dynatrace Observability นั้นดีอย่างไร
1.) ลดเวลาการค้นหาต้นตอปัญหาได้นับสิบเท่า
โดยปกติแล้วทั้งการหาสาเหตุต้นตอของปัญหา (root cause) และการแก้ไขปัญหาที่เกิดขึ้นกับแอปพลิเคชันอาจต้องใช้เวลานาน ทีมดูแลระบบอาจต้องเรียกทุกฝ่ายที่เกี่ยวข้องทุกฝ่ายเข้ามาเพื่อวิเคราะห์หาสาเหตร่วมกัน เมื่อทราบถึงสาเหตุต้นตอของปัญหาที่เกิดขึ้นที่ทำให้ระบบช้า ทุกฝ่ายต้องแก้ไขปัญหาร่วมกัน โดยในอดีตมักมีความซ้ำซ้อนของการแจ้งเตือนของปัญหาที่เกิดขึ้นด้วย
ยกตัวอย่างเช่น การที่แอปพลิเคชัน 3 ตัวที่ระบบไม่ได้เกี่ยวข้องกัน แต่ต้องใช้ฐานข้อมูลร่วมกัน โดยหากฐานข้อมูลเกิดโหลดหนักเกินไป ทีมดูแลก็ต้องได้รับการแจ้งเตือนปัญหาถึง 3 เหตุการณ์ ทั้งๆที่มีเพียงฐานข้อมูลตัวเดียวเท่านั้นที่เป็นปัญหา แต่สถานการณ์กลับกระทบต่อผู้ดูแลแอปพลิเคชันทุกฝ่ายที่ต้องเข้ามาร่วมกันแก้ไขปัญหาอย่างไม่ตรงจุด เสียเวลาของบุคคลากรที่ไม่ได้รับผิดชอบโดยตรงต่อต้นตอของปัญหา
ปัญหาข้างต้นนี้สามารถถูกแก้ไขได้ด้วย Dynatrace เนื่องจากการมีภาพที่มองเห็นถึงปัญหาภาพรวมในแต่ละจุดได้ ลดการติดต่อประสานงานทุกฝ่าย ที่สามารถชี้ปัญหาได้อย่างเจาะจงว่าเกิดจากอะไร รวมถึง Dynatrace ยังใช้ AI ช่วยวิเคราะห์หาสาเหตุของปัญหา และสรุปกลุ่มของปัญหาออกมาให้ทีมงานเห็นภาพเดียวกันได้ โดยจากคำบอกเล่าประมาณการได้ว่าทีม KBTG ใช้เวลาแก้ปัญหาลดลงได้นับสิบเท่า
2.) เริ่มต้นได้ไวใช้เวลาน้อย
Dynatrace OneAgent คือ Agent ที่คอยเก็บข้อมูลของระบบที่ถูกนำไปติดตั้งในเครื่องที่ผู้ใช้สนใจ โดย OneAgent รองรับทุกแพลตฟอร์มและภาษาโปรแกรม อัดแน่นมาพร้อมกับทุกฟีเจอร์ ซึ่งขั้นตอนในการติดตั้งของ Dynatrace ทำได้อย่างรวดเร็วและง่ายดาย มีหน้าจอที่สามารถดาวน์โหลด OneAgent ได้อย่างอัตโนมัติ พร้อมสคิร์ปต์ที่ช่วยให้เครื่องเป้าหมายติดตั้ง Agent ได้พร้อมกัน ทำให้ทีมงาน KBTG สามารถติดตั้ง Agent ให้กับเครื่องจำนวนมากได้อย่างง่ายดาย เป็นที่มาของการตอบโจทย์ที่ว่า เริ่มต้นได้ไวและใช้เวลาน้อย
3.) เข้าใจแอปพลิเคชันที่ซับซ้อนได้ง่ายๆ
อีกหนึ่งฟังก์ชันหลักของระบบ Observability คือการใช้เพื่อทำความเข้าใจภาพรวมการทำงานของแอปพลิเคชันอันซับซ้อนได้ ยกตัวอย่างเช่นนักพัฒนาหน้าใหม่ที่ไม่เคยรู้จักกับแอปพลิเคชันของ KBTG มาก่อน อาจใช้เครื่องมือนี้เพื่อศึกษาแอปพลิเคชันที่แตกตัวเป็น microservice ให้เข้าใจเส้นทางการทำงานได้มากขึ้น หรือแม้กระทั่งทีมงาน Infrastructure ก็สามารถเรียนรู้ภาพรวมของแอปพลิเคชันเพื่อนำไปวิเคราะห์การแก้ปัญหาได้
4.) แก้ปัญหาได้ก่อนเกิดเหตุ
KBTG ยังได้มีการนำ Dynatrace ไปใช้ในกระบวนการ Development ในฝั่งของนักพัฒนาอีกด้วย ผลที่เกิดขึ้นคือเมื่อนักพัฒนาสามารถใช้เครื่องมือนี้ได้เอง พวกเขาก็สามารถเข้าใจถึงประสิทธิภาพในแต่ละจุดได้เป็นอย่างดีตั้งแต่ก่อนนำขึ้น Production ไม่ต้องไปตามแก้ไขภายหลัง ในจุดนี้นอกจากจะป้องกันปัญหาที่จะเกิดขึ้นใน Production ได้ล่วงหน้าแล้ว ยังสามารถนำแอปพลิเคชันออกสู่ตลาดได้ไวขึ้นส่งผลดีต่อธุรกิจอย่างมาก
5.) ไม่ต้องดูแลการอัปเดต Agent
Agent ของระบบมอนิเตอร์ในอดีตอาจมีต้องคอยติดตามอัปเดตด้วยตัวเอง แต่ไม่ใช่กับ OneAgent ของ Dynatrace ที่สามารถอัปเดตตัวเองได้อัตโนมัติเพื่อเพิ่มเติมฟังก์ชันใหม่เข้ามา ทำให้ทีมงาน KBTG ไม่จำเป็นต้องสูญเสียเวลาของบุคลากรสำหรับดูแลงานส่วนนี้ และสามารถมั่นใจได้ว่า OneAgent ทุกตัวเป็นเวอร์ชันล่าสุดที่มีฟังก์ชันใหม่อยู่เสมอ
6.) Davis AI ผู้มาก่อนกาล

Davis AI เกิดขึ้นหลายปีก่อนหน้าที่โลกจะตระหนักถึงความสามารถของ AI จาก ChatGPT ด้วยซ้ำ ซึ่ง Davis AI ได้ช่วยโปรไฟล์การทำงานของแอปพลิเคชันยามปกติ เพื่อใช้คาดการณ์ความผิดปกติที่เบี่ยงเบนออกจากค่า Threshold เหล่านั้น พร้อมคำแจ้งเตือน โดยทีมงาน KBTG ได้ใช้ประโยชน์ความจากสามารถนี้มานานแล้ว ที่ช่วยหาสาเหตุของปัญหาอย่างแม่นยำและทันท่วงที
บทส่งท้าย
ในบทความนี้เราได้นำคำบอกเล่าจากผู้ใช้งาน Dynatrace ตัวจริง ซึ่งความท้าทายก็คือ การบริหารจัดการระบบจำนวนมากที่มีความซับซ้อนสูงให้ทำงานได้เต็มประสิทธิภาพตลอดเวลา โดยถือได้ว่า ด้วยเหตุนี้เอง KBTG คือตัวแทนของลูกค้าที่มีการใช้เครื่องมือ Observability อย่างเข้มข้น
ในมุมของ Dynatrace เองก็ผ่านด่านทดสอบมาอย่างมากมายทั้งเรื่อง ประสิทธิภาพ คุณภาพ และการพัฒนาด้านเทคโนโลยีอย่างต่อเนื่องจนเป็นผู้นำในด้านเครื่องมือ Observability ประกอบกับความง่ายต่อการใช้งาน จนกระทั่งได้กลายมาเป็นผู้ช่วยหลักต่อการแก้ปัญหาใน KBTG โดยจากประสบการณ์ที่ผ่านมาของทีมงานพบว่า Dynatrace มีจุดเด่นหลายเรื่องอย่างที่กล่าวไปแล้วข้างต้น
สนใจโซลูชันด้าน Observability จาก Dynatrace ติดต่อทีมงานดูแลประจำประเทศไทยได้ที่ https://www.dynatrace.com/contact/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






