หนึ่งในแนวโน้มทางด้าน Storage ที่ถือว่าน่าจับตามองต่อไปมากในช่วงปี 2021 – 2025 นี้ ก็คือการพัฒนาของระบบ Computational Storage Drive หรือ CSD ที่อาจกลายเป็นอนาคตของ SSD ใน Data Center จนมาถึงอุปกรณ์ Endpoint เลยก็เป็นได้ และในบทความนี้เราก็จะพาทุกท่านมารู้จักกับ CSD กันอย่างย่นย่อ เพื่อเป็นประโยชน์ต่อการติดตามเทรนด์ในอนาคตร่วมกันครับ
ทำไมเราถึงต้องการหน่วยประมวลผลที่ทำงานในแต่ละ Drive?
หากใครติดตามเทคโนโลยีฝั่งของ HDD และ SSD กันมาโดยตลอด จะเห็นได้ว่าตลาดนี้มักจะแข่งขันที่เทคโนโลยีการผลิต และแนวคิดในการออกแบบในระดับของ Hardware กันเป็นหลักว่าใครจะพัฒนา Disk ที่ใช้หน่วยจัดเก็บข้อมูลที่มีขนาดเล็กลง ทำงานได้เร็วขึ้น มีความร้อนน้อย ทำให้เพิ่มปริมาณหน่วยจัดเก็บข้อมูลให้มากขึ้นได้ ในขณะที่ Interface หรือ Form Factor ของอุปกรณ์เองก็มักเป็นมาตรฐานที่ผู้ผลิตแต่ละรายก็สามารถผลิตออกมาได้ในเวลาไม่ต่างกันมากนัก
ในขณะเดียวกัน โลกของการประมวลผลข้อมูลเองนั้นก็มักต้องเผชิญกับคอขวดในการรับส่งข้อมูล และหน่วยประมวลผลภายในอุปกรณ์ที่มักมีจำกัด ทำให้สุดท้ายแล้วท่ามกลางโลกที่ข้อมูลมีปริมาณมากขึ้นอย่างต่อเนื่องนี้ ทรัพยากรในการประมวลผลและช่องทางการรับส่งข้อมูลใน Hardware ต่างๆ นั้นกลับไม่เพียงพอ
แนวทางหนึ่งที่ถูกเสนอขึ้นมาเพื่อตอบโจทย์เหล่านี้ และสร้างโอกาสในการเกิดนวัตกรรมใหม่ๆ ให้กับวงการ Storage ได้ ก็คือ Computational Storage Drive หรือ CSD ที่มีการนำหน่วยประมวลผลเฉพาะทางฝังลงไปใน Disk แต่ละชุดโดยตรง เพื่อให้ทำการประมวลผลข้อมูลได้บนตัว Disk ทันที ทำให้ Software นั้นจะเข้ามามีบทบาทต่อการจัดการกับข้อมูลในระดับ Disk ได้เหมือนกับ Software-Defined Storage เพียงแต่เป็นระดับที่เล็กลงมา
ตัวอย่างของ CSD: ScaleFlux เพิ่มประสิทธิภาพและความคุ้มค่าให้ SSD ด้วยพลังของการประมวลผล

ScaleFlux คือธุรกิจ Startup ที่มุ่งเน้นการพัฒนา CSD โดยเฉพาะ ด้วยแนวคิดที่คล้ายคลึงกับการพัฒนา All Flash Storage ที่ Software นั้นมีบทบาทเป็นอย่างมากในการเขียน การอ่าน และการจัดกับข้อมูลภายใน Storage
CSD 2000 คือผลิตภัณฑ์ตระกูล CSD ของ ScaleFlux ที่ได้นำ FPGA ฝังลงไปบนตัว SSD เพื่อทำการประมวลผลบน Disk โดยตรง โดยความสามารถที่โดดเด่นมากๆ ของ CSD 2000 นั้นก็ได้แก่
- การทำ Transparent, Inline Compression ที่ระดับ Disk ทำให้ SSD มีความจุมากขึ้นหลายเท่าตัว โดยสำหรับ Workload ที่เป็น Database นั้นก็สามารถประหยัดพื้นที่จัดเก็บข้อมูลได้ราวๆ 4-5 เท่าเลยทีเดียว
- เพิ่มประสิทธิภาพและลด Latency ในการเขียนอ่านข้อมูล ด้วยการลดปริมาณข้อมูลที่ต้องเขียนลง Flash ได้จากการประมวลผล
- เพิ่มอายุการใช้งาน Flash ภายใน SSD ได้ยาวนานยิ่งขึ้น 3-6 เท่า
- เพิ่มประสิทธิภาพในการเขียนข้อมูลให้กับ QLC ได้ถึงประมาณ 6 เท่า เมื่อเทียบกับผู้ผลิต QLC SSD ทั่วไป
- สามารถปรับแต่งการทำงานเพื่อให้มีประสิทธิภาพที่เหมาะสมกับ Workload ที่ต้องการได้
แนวทางของ CSD นี้สามารถนำไปใช้งานได้กับ SSD นหลาย Form Factor โดยปัจจุบัน ScaleFlux นี้สามารถรองรับ U.2 NVMe SSD ได้ด้วยการนำหน่วยประมวลผลของตนไปแทนที่ Controller Chip และยังมีความเป็นไปได้ในการรองรับ Ruler Form Factor ได้ แต่ M.2 นั้นมีข้อจำกัดด้านพลังงานอยู่จึงยังต้องมีการพัฒนาระบบต่อไป
ปัจจุบัน CSD 2000 นี้ถูกใช้งานอยู่ใน Data Center ราว 40 แห่งทั่วโลก ในฐานะของ Disk ที่มีความคุ้มค่าเหนือกว่า SSD ทั่วๆ ไป โดย Hao Zhong ให้สัมภาษณ์กับทาง Blocks & Files ว่าโซลูชันของ ScaleFlux ช่วยเพิ่มความจุได้ถึง 4 เท่า เพิ่มประสิทธิภาพได้ถึง 2 เท่า ในขณะที่มีราคาถูกกว่า Flash ทั่วไปถึง 2 เท่า (อ่านบทสัมภาษณ์ได้ที่ https://blocksandfiles.com/2021/02/22/scaleflux-ceo-hao-zhong-interview/ )
ในอนาคต ScaleFlux จะเปลี่ยนจากการใช้ FPGA ที่เน้นประสิทธิภาพ ประหยัดพลังงาน แต่ขาดความยืดหยุ่น ไปสู่การพัฒนา ARM SoC ของตนเอง เพื่อให้ CSD นั้นยังคงมีประสิทธิภาพและประหยัดพลังงานอยู่ แต่เพิ่มความยืดหยุ่นในการเปลี่ยนแปลง Software ที่ใช้ในการประมวลผลได้อย่างอิสระมากขึ้นสำหรับ CSD
ผู้ที่สนใจรายละเอียดเพิ่มเติมสามารถศึกษาข้อมูลเกี่ยวกับ ScaleFlux ได้ที่ https://www.scaleflux.com/
ก็ต้องติดตามกันต่อไปว่า Computation Storage Drive นี้จะถูกพัฒนาต่อไปในทิศทางไหน เช่น การเพิ่มความสามารถในการทำ Data Protection, Security, Privacy หรือการฝังระบบ Analytics ลงไปโดยตรง ในขณะที่แนวโน้มอื่นๆ อย่าง SPU, DPU หรือแม้แต่ Computational Storage เองก็ยังคงมีการพัฒนาอย่างต่อเนื่องและน่าสนใจไม่แพ้กัน