จบลงไปเป็นที่เรียบร้อยสำหรับงาน “Datadog Live Bangkok 2024” เมื่อวันที่ 7 สิงหาคม 2024 ที่ผ่านมา ณ โรงแรมไฮแอท รีเจนซี่ กรุงเทพ สุขุมวิท อีกหนึ่งงานที่มาพูดคุยเกี่ยวกับเรื่องราวของ “Observability” กับในหลากหลายแง่มุมตั้งแต่ในเรื่องเทคโนโลยี ไปจนถึงวัฒนธรรม และประสบการณ์การใช้งานจริง
งาน Datadog ครั้งนี้มีทั้งเรื่องนวัตกรรม Observability และ Security ใหม่ ๆ รวมถึงการบอกถึงความสำคัญของการมี Observability และ Security แพลตฟอร์มในองค์กร นอกจากนี้ยังบอกถึงการประยุกต์ใช้ในงาน Platform Engineering สำหรับการทำ Observability ประสบการณ์การปรับใช้ Observability จนทำให้กลายเป็น “วัฒนธรรม” ขององค์กรได้สำเร็จ ซึ่งภายในงานมีทั้งข้อคิดและคำแนะนำมากมายสำหรับองค์กรที่กำลังเริ่มต้น เพราะ Observability นั้นเป็น “Journey” ที่ต้องทำอย่างต่อเนื่องและไม่มีวันสิ้นสุด มาเรียนรู้กันได้ในบทความนี้
Datadog ผู้นำด้าน Observability เตรียมหนุนตลาดไทยมากขึ้น
ในช่วงเริ่มงาน คุณ Ali Azarian, Vice President, Enterprise Sales แห่ง Datadog Asia และ คุณออด้า ไชยกูล, Enterprise Sales แห่ง Datadog Thailand ได้ขึ้นมากล่าวต้อนรับผู้เข้าร่วมงาน โดยคุณ Ali Azarian ได้เน้นย้ำถึงวิวัฒนาการที่ก้าวกระโดดของ Datadog และการลงทุนในการวิจัยและพัฒนา (R&D) อย่างต่อเนื่องของบริษัทจนทำให้มีผลิตภัณฑ์ให้บริการมากขึ้นอย่างก้าวกระโดด
“เราได้ลงทุนราว 30% ของรายจ่ายไปในด้าน R&D กลับเข้าไปสู่ธุรกิจของพวกเรา ซึ่งเป็นตัวเลขที่มีนัยสำคัญ ที่เหนือกว่าบริษัทคู่แข่งชั้นนำ 5 เจ้ารวมกัน” คุณ Ali Azarian, Vice President แห่ง Datadog Asia กล่าว “ผมอยู่ที่ Datadog มาจะครบ 4 ปีในเดือนหน้านี้ ตอนนั้นเรามีเพียงแค่ 4 ผลิตภัณฑ์ แต่ตอนนี้เรามีถึง 26 ผลิตภัณฑ์ที่มีมากถึง 3,000 ฟีเจอร์แล้ว”
การจัดงาน Datadog Live Bangkok 2024 นี้ นอกจากมาให้ความรู้เกี่ยวกับผลิตภัณฑ์และเรื่องราวของผู้ใช้งานในฐานะผู้นำด้าน Observability ที่เหนือกว่าเจ้าอื่น ๆ ในแง่ของรายได้แล้ว ยังเป็นการตอกย้ำที่ Datadog จะสนับสนุนในตลาดไทยมากขึ้น โดยในประเทศไทยมีองค์กรลูกค้าใช้งาน Datadog มากกว่า 160 เจ้าเมื่อปี 2023 เป็นที่เรียบร้อย เติบโตมากกว่า 200% เมื่อเทียบกับปีก่อนหน้านี้
“เรามี Data Point ส่งมาที่แพลตฟอร์มในระดับ Trillions of Data Points Per Hour จึงทำให้ลูกค้ามั่นใจในบริการของ Datadog ได้อย่างแน่นอน” คุณออด้า ไชยกูล, Enterprise Sales แห่ง Datadog Thailand กล่าว “ในปี 2023 ทาง Datadog มีลูกค้าในไทยมากกว่า 160 แห่งที่กระจายในทุกภาคส่วนของอุตสาหกรรม ซึ่งค่าเฉลี่ยผลิตภัณฑ์ที่ลูกค้าใช้งาน Datadog อยู่ที่ 8 ผลิตภัณฑ์ภายใต้แพลตฟอร์มของ Datadog ขึ้นไปแล้ว”
รู้จักแพลตฟอร์ม Datadog ผ่าน 7 แกน 26 ผลิตภัณฑ์
ด้วยพัฒนาการของ Datadog ที่เกิดขึ้นอย่างก้าวกระโดด คุณออด้า จึงแนะนำให้รู้จัก 7 แกนในแพลตฟอร์ม Datadog ที่ทั้งหมดมีอยู่ถึง 26 ผลิตภัณฑ์ในปัจจุบันสำหรับการทำ Observability ณ ปี 2024 ได้แก่
- Infrastructure Monitoring การติดตามในส่วนของโครงสร้างพื้นฐานต่าง ๆ ไม่ว่าจะเป็นลักษณะ On-Premises หรือว่า On-Cloud รวมถึงช่วยเหลือในการตรวจสอบความคุ้มค่าของการใช้งาน Public Cloud และ Service ต่าง ๆ บน Cloud ผ่านผลิตภัณฑ์ Cloud Cost Management ตามหลักคิดแบบ FinOps
- Application Performance Monitoring (APM) การติดตามแอปพลิเคชันมีความช้าหรือว่าข้อผิดพลาด (Error) เกิดขึ้น ซึ่งปัจจุบันในผลิตภัณฑ์กลุ่มนี้ได้ต่อยอดจากการทำ Application Observability ผ่าน APM ไปสู่การทำ Data Observability ด้วยผลิตภัณฑ์ใหม่ เช่น Data Stream Monitoring และ Data Job Monitoring ทำให้องค์กรสามารถเห็น Tracing ทั้ง Application, Database, Data Streaming และ Data Job Processing ได้อย่างสะดวกสบายขึ้น
- Digital Experience Monitoring ผ่านผลิตภัณฑ์ Real User Monitoring และ Synthetics Monitoring ซึ่งช่วยในการเพิ่มและปรับปรุงประสิทธิภาพของประสบการณ์ใช้งาน Frontend Application (Web และ Mobile) ด้วยการติดตามเส้นทางลูกค้า (User Journey) ที่สามารถติดตามการใช้ Mobile App หรือ Web App ได้ ซึ่งจะทำให้องค์กรสามารถรู้เหตุการณ์ปัญหาที่ผู้ใช้งานพบเจอได้ก่อนที่ผู้ใช้งานจะมาแจ้งร้องเรียน อันจะส่งผลให้ผู้ใช้มีประสบการณ์ที่ดีขึ้น
- Log Management การนำข้อมูล Log มาบริหารจัดการได้บน Datadog ที่ทำให้ทุก Data Point ขององค์กรเข้ามาเชื่อมโยงกับข้อมูลอื่น ๆ ได้อย่างไร้รอยต่อ ไม่ต้องใช้แอปพลิเคชันอื่นแยกอีกต่อไป
- Security การติดตามช่องโหว่ภายในระบบปฏิบัติการ แอปพลิเคชัน หรือ Library ที่ล้าสมัย เพื่อให้ทีม Security สามารถรับรู้ช่องโหว่ที่มี เพื่อดำเนินการแก้ไขต่อไปได้ รวมทั้งสามารถแปลง Log ไปเป็น Cloud SIEM ได้ทันทีอีกด้วย
- Developer Experience การติดตามสำหรับสนับสนุนประสบการณ์ของนักพัฒนาระบบ เช่น การติดตามผลลัพธ์และประสิทธิภาพในขั้นตอน CI/CD เป็นต้น
- Service Management การติดตามเหตุการณ์ (Incident) ต่าง ๆ ที่เกิดขึ้นในบริการ เพื่อทำให้องค์กรสามารถระบุปัญหาและจัดการบรรเทาเหตุการณ์ได้อย่างมีประสิทธิภาพ รวมถึงความสามารถในการทำ Workflow Automation เพื่อใช้กับเหตุการณ์ที่ต้องการทำ Automate Process หรือ Action ต่าง ๆ ได้
โดยทั้ง 7 แกนในแพลตฟอร์ม Datadog นั้น ทำงานอยู่บนแพลตฟอร์มหลักเพียงแพลตฟอร์มเดียว ทำให้ข้อมูลทุกอย่างสามารถเชื่อมโยงกันได้แบบไร้รอยต่อ นอกจากนี้ ยังมี Watchdog ที่เป็น AI Engine ในการ Automate Alerts ให้ข้อมูล Insight จากระบบที่กำลังเฝ้าระวัง รวมถึงช่วยวิเคราะห์ต้นตอของปัญหาได้อย่างอัตโนมัติ อีกทั้ง ตัวแพลตฟอร์มเองยังมีการนำ Generative AI เข้ามาเพื่อทำหน้าที่เป็น Co-Pilot สำหรับเป็นผู้ช่วยให้กับผู้ใช้งานในการค้นหา และตอบสนองต่อปัญหาที่เกิดขึ้นได้อย่างง่ายดายยิ่งขึ้น
คุณออด้า เน้นย้ำว่า Datadog ไม่ใช่แค่แพลตฟอร์ม Monitoring เพียงอย่างเดียวเท่านั้น หากแต่เป็นแพลตฟอร์มแบบ End-To-End ที่ทุกคนสามารถเข้ามาดูข้อมูล เข้าถึงข้อมูลเชิงลึก เพื่อดำเนินการ (Action) อะไรบางอย่างได้อย่างอัตโนมัติได้ด้วย หากองค์กรต้องการรายละเอียดเกี่ยวกับ Datadog สามารถเข้าไปเยี่ยมชมบนเว็บไซต์ Datadog ได้เลย
LLM Observability ติดตามประสิทธิภาพและ Security ของ Generative AI
ในช่วงหลายปีที่ผ่าน วิวัฒนาการของเทคโนโลยีมีการเปลี่ยนแปลงตลอดเวลา และรวดเร็วเป็นอย่างมาก ตั้งแต่การเปลี่ยนในระดับของจำนวนเทคโนโลยีในองค์กรที่ปัจจุบันมีความหลากหลายมากขึ้นกว่าแต่ก่อน มีการนำ Opensource เทคโนโลยีต่าง ๆ เข้ามาใช้งานผสมผสานกับเทคโนโลยีเก่าที่องค์กรใช้อยู่แล้วก่อนหน้า ผนวกรวมกับเทคโนโลยีและกระบวนการทำงานที่มีการพัฒนาอย่างต่อเนื่อง เช่น จากเมื่อก่อนที่ Dev กับ Ops ทำงานแยกกัน นำมาสู่ DevOps และปัจจุบันกลายเป็น DevSecOps, กระบวนการจาก Waterfall กลายเป็น Agile, Virtual Machine ที่กลายเป็น Container นำมาสู่ Serverless ฯลฯ
ทุกอย่างนี้ ได้ทำให้เกิดความซับซ้อนในการทำงาน ทั้งการบริหารจัดการความหลากหลายของเทคโนโลยีที่เกิดขึ้น หรือแม้แต่เมื่อปัญหาเกิดขึ้นก็เป็นเรื่องยากและใช้เวลาในการเข้าใจปัญหาอย่างแท้จริงจากความสลับซับซ้อนของระบบและเทคโนโลยีที่หลากหลาย ซึ่งถ้าเปรียบเทียบแล้วอาจจะเหมือนกับ “ทะเลของความสลับซับซ้อน” ที่องค์กรต้องพบเจอในทุก ๆ วัน
นี่จึงเป็นที่มาของ Datadog ที่ต้องการช่วยลดความซับซ้อน และทำให้องค์กรมีความเข้าใจ เห็นภาพได้ในทุกจุดไม่ว่าองค์กรนั้น ๆ จะนำเทคโนโลยีอะไรเข้ามาใช้งานเพื่อตอบโจทย์ทางธุรกิจ Datadog สามารถช่วยเฝ้าระวัง คอยสอดส่องว่าตอนนี้มีเหตุการณ์อะไรผิดปกติ และเกิดขึ้นที่ตรงไหนบ้าง ต้องระวังจุดใดเรื่องอะไร พร้อมแนะนำว่าควรจะดำเนินการอย่างไรด้วยเทคโนโลยีการทำ Observability
ยกตัวอย่างในเรื่องของ AI ที่ปัจจุบันในหลายองค์กรเริ่มพัฒนาและนำ AI มาใช้กับระบบงานภายใน และระบบงานที่ให้บริการลูกค้า หรือผู้ใช้งานทั่วไปมากขึ้นเรื่อย ๆ โดยเฉพาะ Generative AI อันเป็นเทคโนโลยีที่มีการกล่าวถึงเป็นอย่างมากในช่วง 1-2 ปีที่ผ่านมานี้ ซึ่ง Datadog พบว่ามีหลายองค์กรที่เริ่มนำเทคโนโลยี Generative AI ในส่วนของ Large Language Model (LLM) ซึ่งเป็นโมเดลภาษามาใช้งานเป็นส่วนหนึ่งของระบบที่ให้บริการ โดยเรียกระบบหรือแอปพลิเคชันแบบนี้ว่า LLM-powered Application หรือ LLM Application ยกตัวอย่างเช่น Chatbot, Code Generation, Summarization และ Transalation, Content Generation และ Use Case อื่น ๆ อีกมากมายที่เห็นมากขึ้นเรื่อย ๆ
การใช้เครื่องมือในการเฝ้าระวังและบริหารจัดการแบบเดิมจึงไม่สามารถรองรับหรือมีประสิทธิภาพที่ดีเพียงพอต่อ LLM Application ได้ เนื่องจากแอปพลิเคชันแบบนี้ทำงานในลักษณะที่คาดเดายาก (Non-deterministic) แตกต่างจากแอปพลิเคชันทั่ว ๆ ไปซึ่งเป็นมีการเขียนด้วยข้อกำหนดทาง Logic ที่แน่นอน (Deterministic) ด้วยเหตุนี้ ทาง Datadog จึงออกผลิตภัณฑ์ที่ตอบโจทย์สำหรับการเฝ้าระวัง แก้ไขปัญหา หรือประเมินประสิทธิภาพของ LLM Application ด้วยผลิตภัณฑ์ที่ชื่อ “LLM Observability” เพื่อทำให้องค์กรมองเห็นภาพรวมทั้ง AI Stack ของการพัฒนาระบบ AI และ Generative AI ได้แบบ Full-Stack และสามารถแสดงภาพรวม End-To-End ของ LLM Chain ที่เกิดจากการเรียกใช้งาน LLM Application ของลูกค้าหรือผู้ใช้งานระบบงานนั้นในทุกจุด
โดย LLM Observability สามารถสนับสนุนการติดตามได้ในทุก Layer ของการพัฒนาและให้บริการระบบที่มี LLM ไม่ว่าจะเป็นการติดตามประสิทธิภาพของโมเดล เวลาตอบสนอง ค่าใช้จ่ายที่ใช้ จำนวน Token ที่เป็นข้อมูลรับเข้าและส่งออก รวมทั้งการประเมินคุณภาพและความปลอดภัยของ LLM Application นั้น ๆ ซึ่งช่วยแก้ปัญหาที่ไม่พึงประสงค์ เช่น การสร้างข้อมูลหรือเนื้อหาที่ไม่ถูกต้องตามข้อเท็จจริง (Hallucination) คุณภาพของการตอบสนอง ต้นทุนที่มีการเปลี่ยนแปลงและสูงขึ้นผิดปกติ และประสิทธิภาพการตอบสนองของ Foundation Model ที่ LLM Application มีการเรียกใช้ เป็นต้น
เครื่องมือจาก Datadog นี้จะช่วยลดความซับซ้อนให้องค์กรสามารถตรวจสอบติดตามการเรียกใช้งานของลูกค้าและผู้ใช้งานในลักษณะการติดตามที่เรียกว่า Tracing ทำให้เข้าใจได้ว่าการเรียกแต่ละครั้งเกิดปัญหา หรือใช้เวลาอย่างไรในทุกกระบวนของ LLM Chain ที่เกิดขึ้น เช่น การเรียก Foundation Model การทำ Embedding และ Retrieval Augmented Generation (RAG) ช่วยจัดการกับปัญหาที่เกิดขึ้น พร้อมแจ้งเตือนหรือแนะนำหากเกิดเหตุไม่พึงประสงค์ เช่น Prompt Injection, Negative Sentiment, Topic Relevancy, Failure to Answer เป็นต้น ซึ่งจะทำให้องค์กรมีการทำ Observability กับ LLM-powered Application ได้อย่างง่ายดายในทุกขั้นตอนผ่านแพลตฟอร์มเดียว
จุดนี้เอง เป็นการตอกย้ำถึง Innovation และการเป็นผู้นำของแพลตฟอร์ม Datadog ที่มีการพัฒนาและต่อยอดอย่างต่อเนื่องเพื่อรองรับเทคโนโลยีใหม่ ๆ เสมอ รวมถึงการปรับปรุงและเพิ่มฟีเจอร์ใหม่กับเทคโนโลยีเดิมที่องค์กรใช้งานกันอยู่แล้ว ทั้งหมดนี้ เพื่อตอบโจทย์และช่วยเหลือให้องค์กรต่าง ๆ ในการเดินทางบนทะเลแห่งความสลับซับซ้อนของเทคโนโลยีนี้ ได้อย่างมีประสิทธิภาพและด้วยต้นทุนที่คุ้มค่าที่สุด
Ascend Money ใช้ Datadog สนับสนุนกระบวนงาน Platform Engineering
Ascend Money บริษัท FinTech ผู้ให้บริการทางการเงินผ่าน True Money ในหลากหลายประเทศในภูมิภาคเอเชียตะวันออกเฉียงใต้ ที่ไม่ได้มีแค่ระบบชำระเงินตามร้านสะดวกซื้อหากแต่ยังมีบริการทางการเงินอื่น ๆ อีกมากมาย
ด้วยบริการที่มีอยู่อย่างหลากหลายและความต้องการใช้งานเครื่องมือใน Tech Stack ราว 80 – 100 เครื่องมือ บริษัทจึงได้ปรับใช้แนวทาง Platform Engineering ในการออกแบบและสร้างแพลตฟอร์มชุดเครื่องมือพร้อมทั้งกระบวนการทำงานที่ทำให้ทีมทำงานสามารถ “บริการตนเอง (Self-Service)” ได้ผ่าน “Internal Developer Platform (IDP)” โดยที่ทุกคนจะสามารถมาเลือกใช้เครื่องมือที่ต้องการได้ด้วยตนเอง
และหนึ่งในความสามารถที่ทีม Platform Engineering จะต้องส่งมอบให้ได้ คือการทำ Observability ที่จะต้องสามารถเอาแหล่งข้อมูลต่าง ๆ มานำเสนอให้ต่อยอดใช้งานได้ ทำงานได้ง่าย มีความอัตโนมัติ (Automation) และเป็น Self-Service อีกทั้ง Observability Stack ยังต้องสามารถขยายขนาด (Scale) ตามความต้องการของธุรกิจได้ด้วย จึงเป็นที่มาในการเลือกใช้ Datadog เพื่อประสบการณ์ใช้งานที่ง่ายขึ้นกว่าเดิม
หลังจากที่ Ascend Money ใช้งาน Datadog แล้ว ไม่ว่าแหล่งข้อมูลจะมาที่ใดหรือว่ากระบวนการใดก็ตาม Datadog ล้วนสามารถสนับสนุนได้ทั้งหมด ที่สำคัญคือตรงส่วนของ Virtualization & Alerting นั้น Datadog จะมีการจัดเตรียม Golden Signal ให้พร้อมกับข้อมูลอื่น ๆ เช่น Correlation ไม่ว่าจะเป็น Logs, Metrics หรือว่า Traces รวมทั้งทำ Service Map โยง Dependencies มาให้ทันที ซึ่งทำให้ง่ายในการปรับแต่ง Dashboard ได้รวดเร็วยิ่งขึ้น
Abacus Digital แนะ Observability คือหน้าที่ของทุกคนในองค์กร
Abacus Digital หรืออดีตคือ SCB Abacus ผู้สร้างแพลตฟอร์มสินเชื่อดิจิทัล (Digital Lending Platform) ที่ขับเคลื่อนด้วยข้อมูล เพื่อเปิดโอกาสให้คนไทยและธุรกิจไทยสามารถเข้าถึงสินเชื่อได้มากขึ้น ซึ่ง Abacus Digital คืออีกหนึ่งบริษัท FinTech ที่ได้มีการปรับใช้เทคโนโลยี Observability ภายในองค์กร จนทำให้เกิดเป็น “วัฒนธรรม (Culture)” ขององค์กร ด้วยแนวคิดที่ว่า Observability คือหน้าที่ของทุกคนในองค์กร
โดย Abacus Digital ชี้ให้เห็นว่า ปัจจัยสำคัญในการทำให้ Observability เกิดขึ้นได้สำเร็จจริง ๆ ภายในองค์กรนั่นคือเรื่องของ “คน” ที่อาจจะไม่เห็นด้วยหรือไม่เข้าใจว่าทำไมถึงต้องทำ ซึ่ง Abacus Digital ได้แนะนำกลยุทธ์ที่มีการปรับใช้ในบริษัท จนทำให้เกิดวัฒนธรรม Observability ได้สำเร็จ ผ่าน 5 ประการ ได้แก่
- Start with Why สิ่งที่สำคัญที่สุดคือการสื่อสารให้เข้าใจก่อนว่า ทำไมองค์กรถึงต้องทำ Observability เช่น การทำสิ่งนี้ จะส่งผลต่อ SLI หรือ SLO อย่างไรบ้าง เป็นต้น
- Unify the Goals ต้องทำให้ทุกคนมีเป้าหมายเดียวกัน และมีส่วนร่วมที่จะปรับปรุงทั้งประสบการณ์ต่าง ๆ เช่น การใช้งานผลิตภัณฑ์ของบริษัทให้ดีขึ้น
- Keep it simple and Informative ต้องทำให้ง่าย และมีข้อมูลความรู้ต่าง ๆ ที่สามารถเข้าถึงได้อย่างสะดวกรวดเร็ว เข้าใจง่ายได้ในขณะที่มีข้อมูลครบถ้วน
- Embedded in to the current process ต้องฝังเข้าไปในกระบวนการทำงาน เช่น ในการพัฒนาระบบ ก็จะต้องฝังเข้าไปเป็นหนึ่งในกระบวนการของ Software Development Life Cycle (SDLC) ที่ต้องพิจารณาเรื่อง Observability ว่าควรจะต้องเป็นอย่างไรไปพร้อมกัน
- Embrace Insight ปรับใช้ข้อมูลเชิงลึก ผ่าน Dashboard ร่วมกับรายละเอียดข้อมูลต่าง ๆ เพื่อทำให้องค์กรเห็นภาพรวมว่ามีเหตุการณ์อะไรที่น่าจะต้องพิจารณาเกิดขึ้นตรงไหนบ้าง แล้วดำเนินการต่อยอดให้ดีขึ้น
จากกลุยทธ์ทั้ง 5 ที่ Abacus Digital ชี้ว่า Datadog คือหนึ่งในเครื่องมือที่สนับสนุนทางบริษัทสามารถสร้างวัฒนธรรม Observability ภายในองค์กรให้เกิดขึ้นได้อย่างรวดเร็วยิ่งขึ้น ด้วยการติดตั้งที่ง่าย ใช้งานสะดวก สามารถมองเห็นข้อมูลในแต่ละจุดได้ทันที รวมทั้งยังมี Learning Center แหล่งความรู้ที่สามารถศึกษาเพิ่มเติมด้วยตัวเองตามความสามารถของแต่ละคนอีกด้วย
Datadog ได้ทำให้ Abacus Digital สามารถ “Shine the light” มองเห็นสิ่งที่เกิดขึ้นได้ตั้งแต่ Client ไปจนถึง Server และสิ่งสำคัญที่ฝากไว้ในช่วงท้ายเซสชันคือ Observability จะต้องทำอย่างต่อเนื่อง เพื่อให้เกิดการมองเห็น ติดตามได้ในทุกจุด และงาน Observability ไม่มีวันเสร็จซึ่งจะต้องมีการพัฒนาอย่างต่อเนื่องไม่มีวันสิ้นสุด
AWS แนะ 8 ขั้นตอนในการเข้าสู่เส้นทาง Observability
AWS ผู้ให้บริการ Cloud ยักษ์ใหญ่ระดับโลก ที่เป็นพาร์ตเนอร์กับ Datadog มาอย่างยาวนาน ได้บอกเล่าถึง Observability Maturity Model ที่กำหนดโดย AWS เพื่อให้พิจารณาว่าปัจจุบันองค์กรมีความสมบูรณ์ (Mature) ในเรื่อง Observability มากน้อยเพียงใด โดยแบ่งออกเป็น 4 Stage ได้แก่
- Stage 1 : Foundation ช่วงเริ่มต้นที่องค์กรเริ่มเก็บข้อมูล Telemetry เช่น Log, Metric, Trace ซึ่งยังคงจัดเก็บแยกกันเป็นส่วน ๆ ระบบติดตามข้อมูลก็ยังคงเป็นไซโลอยู่ ซึ่ง AWS แนะนำว่าสิ่งที่สำคัญคือต้องเข้าใจว่ามีอะไรบ้าง และต้องการไปถึงจุดใดในอนาคต
- Stage 2 : Intermediate Monitoring เริ่มมีเครื่องมือใช้งานในการจัดเก็บ และเริ่มเก็บข้อมูลรวมศูนย์ไว้แล้ว และเริ่มมีการแจ้งเตือนในบางส่วนแล้ว ซึ่งองค์กรส่วนใหญ่มักอยู่ใน Stage นี้ โดยแนะว่าควรจะต้องกำหนด KPI ในการดำเนินการ และควรพิจารณาปรับใช้ Automation เข้ามาเพิ่มเติม
- Stage 3 : Advanced Observability ที่เริ่มมีการนำเอา Correlation หรือ Incident ที่เกิดขึ้นมาวิเคราะห์และร้อยเรียงให้เข้าใจภาพที่เกิดขึ้นได้เร็วขึ้นแล้ว รวมทั้งสามารถเริ่มไปเชื่อมโยงกับเครื่องมืออื่น ๆ อย่างเช่น Incident Management เพื่อ Trouble Shooting ต่อไปได้
- Stage 4 : Proactive Observability ระดับสูงสุดที่เริ่มประยุกต์ใช้ AI/ML เพื่อสนับสนุนการค้นหาปัญหา หรือว่าใช้ Generative AI เพื่อค้นหาสาเหตุของปัญหาได้แบบเชิงรุก (Proactive) รวมทั้งยังสามารถดูเทรนด์หรือคาดการณ์ได้ล่วงหน้าว่ามีโอกาสที่จะเกิดเหตุการณ์อะไรเกิดขึ้นได้ล่วงหน้า
นอกจากนี้ AWS ได้ตอกย้ำอีกครั้งภายในงานว่า “Observability เป็นเส้นทาง (Journey)” ที่ต้องเดินต่อไปเรื่อย ๆ ไม่มีจุดมุ่งหมายปลายทางที่ชัดเจน เพราะจะมีความต้องการใหม่ ๆ มาเสมอ พร้อมทั้งแนะนำ 8 ขั้นตอนในการเริ่มต้นทำ Observability ในองค์กร ได้แก่
- Observe what matters ต้องรู้และเข้าใจตัวเองให้ได้ก่อนว่า อะไรคือสิ่งที่สำคัญบ้างสำหรับทั้งลูกค้า ธุรกิจ Stakeholder ภายใน และโครงการ
- Measure your objectives กำหนดตัววัดผล เช่น KPI, SLA, SLO ฯลฯ เพื่อทำให้องค์กรมีข้อมูลที่วัดความสำเร็จ ซึ่งต้องมั่นใจว่าสิ่งนั้นเป็นสิ่งที่สำคัญสำหรับองค์กรจริง ๆ
- Identify Sources หลังจากเข้าใจและมีตัววัดผลแล้ว ต้องค้นหาแหล่งข้อมูลให้เจอว่าจะเอาข้อมูลดิบมาจากที่ใด มีข้อมูลอะไรให้สามารถสกัดออกมาได้บ้าง ถ้าหากไม่มี อาจจะต้องสร้างขึ้นมาเพิ่มเติม
- Alert Strategy กำหนดกลยุทธ์เงื่อนไขการแจ้งเตือนให้เหมาะสม เช่น ถ้าหากพบว่าเป็น Critical แล้วใครจะต้องไปดำเนินการอะไรต่อ หรือว่า Warning จะต้องทำอะไรหรือไม่ เพื่อหลีกเลี่ยงอาการ Alert Fatigue หรือการเพิกเฉยต่อ Alert ที่เกิดขึ้นมากจนเกินไป
- Dashboard Strategy แบ่ง Dashboard ออกเป็นส่วน ๆ ให้ชัดเจน เช่น Dashboard สำหรับ Stakeholder ที่จะดูภาพรวมค่าใช้จ่าย หรือ High-Level, Low-Level Dashboard ที่จะต้องติดตามข้อมูลรายละเอียดมากขึ้น เป็นต้น
- Tool Selection เลือกใช้เครื่องมือให้เหมาะสมกับความต้องการใช้งาน ด้วยขีดความสามารถที่ตอบโจทย์ได้จริงด้วยจำนวนที่น้อยที่สุด ซึ่ง Datadog ที่สามารถตอบสนองได้ในทุกจุดคือตัวหนึ่งที่อาจเลือกพิจารณาใช้งาน เพราะถ้าไม่วางแผนไว้ตั้งแต่ต้นก็อาจจะมีปัญหาค่าใช้จ่ายตามมาในภายหลังได้
- Bring it all together ต้องมีการจัดทำเอกสารไว้ด้วย และต้องฝังเข้าไปในกระบวนการภายใน ก่อนเริ่มต้นใช้งานจริงเสมอ
- Iterate หลังเริ่มต้นได้แล้ว ก็ยังคงต้องทำอย่างต่อเนื่องและปรับปรุงไปตลอด เพราะระหว่างทางจะมีการเปลี่ยนแปลงที่เกิดขึ้นเสมอ ดังนั้น จึงควรพิจารณาปรับใช้กระบวนการอัตโนมัติ Automation เพิ่มเติมด้วย เพื่อให้สามารถจัดการงานบางส่วนให้ได้ทันที
Toyota Leasing ประยุกต์ใช้ Datadog กับเรื่อง Zero Trust
Toyota Leasing (Thailand) คือบริษัทสถาบันการเงินในเครือ Toyota Financial Services Corporation ซึ่งปัจจุบันบริษัทมีมากกว่า 40 ประเทศทั่วโลก ซึ่งในประเทศไทยทาง Toyota Leasing ได้เปิดให้บริการมากว่า 30 ปีแล้ว ซึ่งมีสำนักงานถึง 11 สาขาที่พร้อมให้บริการ
แม้ว่า Toyota Leasing จะไม่ได้เป็นบริษัทเทคโนโลยีเหมือนกับบริษัทอื่น ๆ ที่นำเสนอภายในงาน หากแต่กระบวนการภายในบางส่วนก็มีการพัฒนาระบบซอฟต์แวร์ ซึ่งได้ปรับใช้กระบวนการ Waterfall ผสม Agile อยู่เช่นกัน รวมทั้งมีการปรับใช้ Datadog ในการสร้าง Observability ภายในองค์กรมาตั้งแต่ช่วงปี 2018 – 2022 เพื่อสนับสนุนแนวคิด “Kai Zen” หรือการพัฒนาปรับปรุงอย่างต่อเนื่อง
ด้วยเหตุนี้ Toyota Leasing จึงนำเอา Datadog มาช่วยติดตามตรวจสอบในระดับ Nano Service พร้อมทั้งการทำให้ Source Code มีความมั่นคงปลอดภัย การทำ CI/CD ช่วยสแกนโค้ด Library หรือเครื่องมือต่าง ๆ ช่วยหาจุดที่ตั้งค่าผิดพลาด (Misconfiguration) ในการพัฒนาตามกระบวนการ DevSecOps ที่ดำเนินการอยู่
ที่สำคัญ Datadog ทำให้ Toyota Leasing มีคลังข้อมูลที่ทำให้เกิดการมองเห็น (Visibility) และสามารถนำไปประยุกต์กับการทำ Zero Trust ค้นหาติดตามแหล่งข้อมูลต่าง ๆ ที่ใช้งาน เช่น บน EC2 หรือว่าบนทรัพยากร On-Premises แล้วสามารถนำมาสร้าง Protect Surface พร้อมกับทำ Automation ได้ด้วย
บทส่งท้าย
ทั้งหมดนี้ คือเรื่องราวที่เกิดขึ้นในงาน “Datadog Live Bangkok 2024” เมื่อวันที่ 7 สิงหาคม 2024 ที่ผ่านมา ทั้งเรื่อง Observability และ Security ที่ Datadog ให้บริการ เครื่องมือรูปแบบใหม่ที่พร้อมตอบรับเทรนด์โลกที่กำลังเกิดขึ้น รวมทั้งประสบการณ์การปรับใช้ Datadog ภายในหลากหลายองค์กร ไม่ว่าจะเป็นงานด้าน Platform Engineering การพัฒนาในกระบวนการ DevSecOps รวมทั้งแนวคิดที่ Observability จะต้องทำอย่างต่อเนื่อง เป็นเส้นทางที่ไม่มีวันสิ้นสุด
ถ้าหากองค์กรต้องใดต้องการเริ่มต้นทำ Observability และ Security ได้อย่างรวดเร็วด้วย Datadog ที่พร้อมสนับสนุนในทุกขั้นตอนภายในเครื่องมือเดียว ไม่ต้องใช้งานหลายเครื่องมือให้ซับซ้อน สามารถเข้าไปดูรายละเอียดของ Datadog เพิ่มเติมได้ที่เว็บไซต์หรือติดต่อทีมงาน Datadog ประเทศไทยผ่านทางอีเมล info@datadoghq.com ได้ทันที