รู้จักกับ OceanBase เบื้องหลังฐานข้อมูลมหกรรมช็อปปิ้งวันคนโสด 11.11 บนสถาปัตยกรรม Distributed Relational Database

มหกรรมลดราคาออนไลน์ 11.11 หรือวันคนโสดได้พลิกโฉมหน้าประวัติศาสตร์ออนไลน์ครั้งใหญ่ ซึ่งนั่นกลายเป็นจุดกำเนิดของ OceanBase ฐานข้อมูลที่ถูกออกแบบขึ้นในสถาปัตยกรรมแบบ Distributed Relational Database ที่ปัจจุบันยังถูกนำไปใช้ในธุรกิจการเงินมากมาย

ในบทความนี้เราจะพาทุกท่านไปเจาะลึกฟีเจอร์สำคัญและการออกแบบที่อยู่เบื้องหลังแนวคิดของ OceanBase กันว่า เหตุใดพวกเขาจึงสามารถรองรับ HTAP, Horizontal Scaling, RPO 0 & RTO < 8 วินาที พร้อมกับ TCO ที่น่าประทับใจ และข้อดีที่เหนือกว่า Traditional Database

OceanBase ถูกพัฒนาขึ้นมาราวปี 2010 โดย Ant Group เพื่อจัดการความท้าทายกับเทศกาลวันคนโสดหรือที่หลายคนรู้จักกันในแคมเปญ 11.11 ซึ่ง ณ เวลานั้นไม่มีฐานข้อมูลใดที่ตอบโจทย์การประมวลผลที่สูงกว่า 544,000 TPS 

OceanBase ถูกออกแบบมาด้วยแนวคิดความเป็น Distributed Relational Database โดยเน้นเรื่องการขยายตัวเพื่อรองรับการประมวลผลจำนวนมหาศาล พร้อมกับความชาญฉลาดในการจัดการข้อมูล ทำให้ธุรกิจทำงานได้อย่างต่อเนื่องด้วยกลไกเบื้องหลังภายใต้มากมาย เช่น Paxos Protocol, LSM-Tree, Transparent Sharding และการออกแบบ High Availability ได้หลายรูปแบบ

OceanBase นับเป็นฐานข้อมูลบนสถาปัตยกรรมแบบ distributed ที่ทรงพลัง ซึ่งมีสถิติพิสูจน์ถึงความแข็งแกร่งในการทำงานที่ได้รับการยอมรับในสากล โดยเป็นฐานข้อมูลเจ้าแรกที่สามารถสร้างสถิติใหม่ได้ทั้ง OLTP และ OLAP คือ

  • สถิติอันดับหนึ่งของปี 2020 ในสาขา TPC-C (OLTP) ที่ 707.35 ล้าน tpmC
  • สถิติอันดับหนึ่งของปี 2021 ในสาขา TPC-H (OLAP) ที่ 15.26 ล้าน QphH

นอกเหนือจากมุมมองในด้านสถิติแล้ว OceanBase ยังได้รับความไว้วางใจให้กลายเป็นฐานข้อมูลสำหรับสถาบันการเงินในประเทศจีนที่ครองตลาดได้มากกว่า 70% และกำลังเติบโตอย่างรวดเร็วในตลาดสากลอีกด้วย 

โดยธรรมชาติของธุรกิจการเงินข้อมูลธุรธรรมมักเพิ่มขึ้นเป็นทวีคูณทุกปี ซึ่งด้วยระเบียบข้อบังคับแล้ว ผู้ให้บริการต้องเก็บข้อมูลไว้หลายปี เมื่อระยะเวลาผ่านไปต้นทุนของ Storage จะกลายเป็นค่าใช้จ่ายที่สูงมาก รวมไปถึงค่าแรงงานคนที่จะต้องคอยจัดการ Storage เหล่านี้เรื่อยๆ

ฐานข้อมูลแบบเก่าไม่สามารถขยายตัวเพื่อรองรับ Transaction ที่เพิ่มขึ้นอย่างมหาศาลอย่างรวดเร็ว ซึ่งการเขียนข้อมูลลงดิสก์กลายเป็นคอขวด โดยปกติการปรับปรุงประสิทธิภาพมักต้องมีการจัดการอย่างซับซ้อนด้วยการทำ  Sharding หรือการเพิ่มทรัพยากรที่อาจส่งผลกระทบต่อธุรกิจให้เกิด Downtime นั่นจึงไม่ตอบโจทย์ RTO/RPO ที่เข้มงวดในธุรกิจการเงิน นอกจากนี้ระบบฐานข้อมูลแบบเก่ายังไม่สามารถจัดการระบบแบบรวมศูนย์ ก่อให้เกิดต้นทุนในการปฏิบัติการอย่างมีนัยสำคัญ

1.) Performance และ Resiliency

OceanBase ได้พิสูจน์ตัวเองมาแล้วกรณีของธุรกิจการเงินยักษ์ใหญ่อย่าง Alipay โดยพวกเขาสามารถรองรับการให้บริการได้ถึง 61,000,000 QPS รวมถึงสร้างสถิติใหม่ในการวัดผลประเภท Transaction(TPC-C) ที่ 707,000,000 tpmC และ สถิติใหม่ของงานประเภท Analytic(TPC-H) ที่ 15,000,000 QphH ซึ่งเป็นเรื่องที่เหลือเชื่อสำหรับการสร้างสถิติ 2 ประเภทข้อมูลในฐานข้อมูลเดียวกัน

ในมุมของความทนทานของระบบ (High Availability) สถาปัตยกรรมแบบ Distributed Relational Database ของ OceanBase และการจัดการข้อมูลโดย Paxos Protocol ทำให้ระบบสามารถการันตีความปลอดภัยในข้อมูลแบบ Zero Downtime พร้อมกับผลลัพธ์ของ RPO = 0 (ไม่มีข้อมูลศูนย์หาย) นอกจากนี้ยังตอบโจทย์ RTO < 8 วินาที ในกรณีการเกิด Failover ด้วย

2.) รองรับการขยายตัวสำหรับธุรกิจในอนาคต(Scaling)

เครดิต : OceanBase

สถาปัตยกรรมแบบ Distributed-database ของ OceanBase ถูกออกแบบมาเพื่อการเพิ่มพลังการประมวลผลในลักษณะของ Horizontal Scaling กล่าวคือเมื่อมีโหลดมากขึ้น ผู้ใช้งานสามารถเพิ่มจำนวนเซิร์ฟเวอร์ให้กลุ่มประมวลผลได้ทันที ต่างจากในอดีตที่การเพิ่มทรัพยากรดูเป็นเรื่องยุ่งยาก และที่สำคัญคือ OceanBase ให้ประสิทธิภาพแบบ Linear Scaling ยกตัวอย่างเช่นเซิร์ฟเวอร์หนึ่งเครื่องให้ประสิทธิภาพที่ 100 TPS แต่หากเพิ่มเป็น 2 เครื่องจะให้ประสิทธิภาพเป็นเท่าตัวที่ 200 TPS เป็นต้น

3.) Any Workload, Any Data model และ Any Cloud

เครดิต : OceanBase

OceanBase ถูกออกแบบมาให้รองรับการใช้งานแบบ Hybrid Transactional/Analytical Processing (HTAP) ซึ่งที่ผ่านมาระบบฐานข้อมูลเดิมมักจะใช้การแปลงข้อมูลจาก Transaction ให้พร้อมสำหรับการวิเคราะห์ข้อมูล (Analytic) หรือที่เรียกว่า ETL โดยมักกระทบต่อประสิทธิภาพการทำงาน นั่นทำให้องค์กรมักใช้ช่วงเวลาช่วงกลางคืนที่มีโหลดไม่มากนักทำการวิเคราะห์ข้อมูล ซึ่งทำให้ไม่สามารถออกรายงานแบบเรียลไทม์ได้

เครดิต : OceanBase

ไม่เพียงเท่านั้น OceanBase ยังสามารถรองรับ Data Model ได้อย่างครอบคลุมกับการใช้งานในระดับองค์กร ในข้อมูลประเภทต่างๆ เช่น Row-based, Column-Based, Wide Column, Key-Value, Document และ Spatial โดยความยืดหยุ่นนี้จะช่วยให้องค์กรตอบคำถามที่ซับซ้อนได้ใน 1 คำสั่ง SQL 

เครดิต : OceanBase

จากภาพประกอบด้านบน ตัวอย่างเช่น “ค้นหาร้านกาแฟใกล้ฉันในระยะ 500 เมตร ราคาต่ำกว่า 100 บาทและมีรีวิวมากกว่า 4 ดาว ในเชิงบวก” โดยคำตอบจะต้องอาศัยข้อมูลแบบ Vector เพื่อหาชื่อร้านกาแฟที่มีรีวิวเชิงบอก ในขณะที่ข้อมูล Spatial จะช่วยกรองพิกัดในระยะที่กำหนด สุดท้ายราคาและคะแนนจะต้องอาศัยของมูลแบบมีโครงสร้าง

เครดิต : OceanBase

ระบบของ OceanBase ถูกออกแบบมาให้เป็นโซลูชันที่ไม่ยึดติดกับแพลตฟอร์มใดอย่างแท้จริง กล่าวได้ว่าขอเพียงระบบนั้นสามารถรองรับ Linux ได้ก็เพียงพอแล้ว เพราะมีระบบการจัดการข้อมูลที่สมบูรณ์ภายในตนเอง ไม่ต้องอาศัยฟีเจอร์จากผู้ให้บริการคลาวด์ใดโดยเฉพาะ ดังนั้น OceanBase จึงพร้อมสำหรับ Hybrid Cloud, Public Cloud, Multi Cloud และความต้องการแบบ Private Cloud ในองค์กร

4.) ตอบโจทย์ TCO ในทุกมิติผ่านหลายความคุ้มค่า

ความคุ้มค่าด้านการลงทุนคือโจทย์ใหญ่ของผู้บริหารธุรกิจ ที่ OceanBase สามารถตอบคำถามได้อย่างมั่นใจในหลายแง่มุม คือ

  • License ในการใช้งาน OceanBase มีการกำหนดราคาให้ธุรกิจเข้าถึงได้ง่ายแตกต่างกับผู้เล่นอื่นได้อย่างชัดเจน
  • Multi-tenants เป็นอีกหนึ่งไฮไลต์สำคัญของ OceanBase ที่ฐานข้อมูลแบบเดิมต้องสำรอง CPU, Memory และ Storage เผื่อระบบแม้จะไม่ได้ใช้ แต่ความเป็น Multi-tenant จะช่วยให้องค์กรสามารถยุบรวมทรัพยากรสำรองเข้าร่วมกัน ตามรูปประกอบด้านล่าง
เครดิต : OceanBase
  • การเก็บข้อมูลแบบ LSM-Tree ร่วมกับกลไกการบีบอัดข้อมูลและ Encoding แบบพิเศษ(Compression) ทำให้ OceanBase ประหยัดพื้นที่การจัดเก็บข้อมูลได้ราว 70-90% เหนือกว่าวิธีการของ Traditional Relational Database หลายเท่าตัว
เครดิต : OceanBase
  • ต้นทุนการปฏิบัติการ(Operational Cost) ถือเป็นอีกหนึ่งปัจจัยสำคัญ เมื่อองค์กรต้องแบ่งฐานข้อมูลเป็นหลายระบบ แต่ด้วยความสามารถของ Distribute-database ที่รวมศูนย์ระบบทั้งหมดของ OceanBase เข้ามาจัดการให้โดยอัตโนมัติพร้อมสั่งการในหน้า Console ปฏิบัติการเดียว นั่นช่วยให้องค์กรลดต้นทุนในการทำงานได้มหาศาล
  • ความสามารถของ Multi Models ก็เป็นอีกหนึ่งการใช้งานที่องค์กรสามารถตอบคำถามซับซ้อนได้ใน 1 SQL Statement ซึ่งหากฐานข้อมูลไม่สามารถรองรับได้ องค์กรจะต้องแยกการใช้งาน ซึ่งนำไปสู่ Overhead ประสานงานระบบต่างๆเข้าด้วยกัน รวมถึงประเด็นเรื่องของต้นทุนปฏิบัติการ เช่น การมอนิเตอร์ระบบ การดูแลความมั่นคงปลอดภัย และ การจัดตั้งระบบ HA ให้แต่ละระบบอีกด้วย
เครดิต : OceanBase
เครดิต : OceanBase

ท่านใดที่เคยเริ่มต้นมากับ MySQL หรือ Oracle ที่กำลังมองหาฐานข้อมูลทางเลือกประสิทธิภาพที่สูง แต่กังวลเรื่องของความเข้ากันได้ เพื่อให้เปลี่ยนผ่านส่งผลกระทบน้อยที่สุด OceanBase คือคำตอบที่โดดเด่นด้วยการทำงานที่เข้ากันได้กับ Oracle ได้มากกว่า 95% และ MySQL ที่ 99% มากกว่านั้นในแง่ของความเชี่ยวชาญทีมงานของ OceanBase ยังมีประสบการณ์มาแล้วมากมายจากการให้บริการมายาวนาน ดังเช่นกรณีของ AntGroup ที่เปลี่ยนผ่านตัวเองจาก Oracle ในปี 2014

ในทางปฏิบัติจะมีการประเมินเพื่อวางแผนการย้ายระบบฐานข้อมูลมา OceanBase ด้วยเครื่องมือ OMA (OceanBase Migration Assessment) เพื่อดูความเข้ากันได้ของการย้ายระบบฐานข้อมูล หลังจากนั้น OMS (OceanBase Migration Service) จะรับหน้าที่ต่อในการย้ายข้อมูลไปยัง OceanBase พร้อมกับตรวจสอบความถูกต้องในแต่ละขั้น สุดท้ายจึงค่อยเปลี่ยนเส้นทางของแอปพลิเคชันไปยัง OceanBase

OceanBase คือโซลูชันที่ถูกออกแบบมาด้วยสถาปัตยกรรมแบบ Distributed Relational Database โดยกำเนิด เพื่อรับมือกับความไม่แน่นอนของปริมาณการใช้งานที่คาดเดาไม่ได้ ซึ่งเทคโนโลยีที่ขับเคลื่อนอยู่เบื้องหลังความสำเร็จมี ดังนี้

  • สถาปัตยกรรมแบบกระจาย (Distributed Architecture)
  • การซิงค์ข้อมูลด้วย Paxos consensus protocol 
  • การจัดเก็บข้อมูลแบบ LSM-Tree พร้อมด้วยการบีบอัดข้อมูล
  • สถาปัตยกรรมการรวมศูนย์ของระบบฐานข้อมูลแบบ Multi-tenancy

จากเรื่องราวของ Alipay คือเสียงสะท้อนที่ยืนยันถึงความพร้อมของ OceanBase ได้เป็นอย่างดีว่า พวกเขาสามารถช่วยองค์กรเปลี่ยนโครงสร้างพื้นฐานของการจัดเก็บข้อมูล พลิกโฉมสู่โอกาสใหม่ ๆ และรองรับการขยายตัวของธุรกิจ ลดต้นทุน เพื่อการดำเนินธุรกิจได้อย่างมั่นใจ

ท่านใดสนใจโซลูชัน OceanBase สามารถติดต่อทีมงานดูแลประจำประเทศไทย ได้ที่ https://en.oceanbase.com/contactus    

About nattakon

จบการศึกษา ปริญญาตรีและโท สาขาวิศวกรรมคอมพิวเตอร์ KMITL เคยทำงานด้าน Engineer/Presale ดูแลผลิตภัณฑ์ด้าน Network Security และ Public Cloud ในประเทศ ปัจจุบันเป็นนักเขียน Full-time ที่ TechTalkThai

Check Also

Google เจรจา SpaceX เตรียมส่ง Project Suncatcher ดาต้าเซ็นเตอร์ AI ขึ้นสู่วงโคจร

Google อยู่ระหว่างเจรจากับ SpaceX ของ Elon Musk รวมถึงพันธมิตรรายอื่น ๆ เพื่อเดินหน้า Project Suncatcher หรือโครงการตั้งดาต้าเซ็นเตอร์บนวงโคจร เพราะการใช้พลังงานบนโลกที่อาจจำกัด จนการใช้งานเพื่อจับเคลื่อนดาต้าเซ็นเตอร์สำหรับงาน AI …

สกิลใหม่จาก Signadot ช่วย Claude Code, Codex และ Cursor ตรวจการเปลี่ยนแปลงบนสภาพแวดล้อม Kubernetes

Signadot บริษัทด้านการทดสอบไมโครเซอร์วิส เปิดตัว /signadot-validate ซึ่งเป็นทักษะใหม่ที่ช่วยให้เอเจนต์เขียนโค้ดอย่าง Claude Code ของ Anthropic, Codex ของ OpenAI และ Cursor สามารถตรวจสอบความถูกต้องของการเปลี่ยนแปลงโค้ดด้วยตัวเองบนสภาพแวดล้อม …