เมื่อโครงการด้าน AI และ Big Data ได้กลายเป็นหัวใจสำคัญของธุรกิจ ระบบจัดเก็บข้อมูลหรือ Storage ที่เหมาะสมต่อการใช้งานแต่ละขั้นตอนของการจัดการกับข้อมูลนั้นก็ถือเป็นปัจจัยสำคัญอย่างยิ่งที่จะส่งผลต่อประสิทธิภาพการทำงานของระบบและค่าใช้จ่ายในการลงทุนระยะยาวโดยตรง เพราะการเลือกใช้ Storage ที่ไม่เหมาะสมต่อรูปแบบการใช้งานข้อมูลนั้น อาจนำมาซึ่งประเด็นปัญหาทั้งประสิทธิภาพในการประมวลผล, ความมั่นคงทนทานของข้อมูล, พื้นที่จัดเก็บข้อมูล และ Downtime รวมถึงค่าใช้จ่ายที่อาจเกิดขึ้นอย่างไม่รู้จบในการลงทุนเพิ่มขยายระบบโดยแก้ปัญหาไม่ตรงจุด
IBM ในฐานะของผู้เชี่ยวชาญเทคโนโลยีด้าน AI Infrastructure สำหรับธุรกิจองค์กร จึงได้ทำการออกแบบระบบ Storage เฉพาะทางสำหรับงาน AI และ Big Data ที่ตอบโจทย์ต่อการใช้งานในกระบวนการย่อยของการพัฒนา AI ขึ้นมาโดยเฉพาะ ภายใต้ชื่อโซลูชัน IBM Elastic Storage System หรือ IBM ESS นั่นเอง
4 ขั้นตอนของการจัดการข้อมูลในระบบAI
ก่อนจะทำความรู้จักกับ IBM ESS นั้น สิ่งที่ควรจะทราบก่อนก็คือ AI Ladder หรือขั้นตอนการในจัดการกับข้อมูลในแต่ละกระบวนการในการพัฒนาระบบ AI นั่นเอง ซึ่ง IBM ก็ได้ระบุว่ากระบวนการเหล่านี้มีด้วยกัน 4 ขั้นตอนหลักๆ ได้แก่
- Collect การรวบรวมและบันทึกข้อมูลเอาไว้ โดยข้อมูลที่เข้ามาในส่วนนี้มักเป็นข้อมูลดิบหรือข้อมูลที่มีปริมาณมหาศาลและเกิดขึ้นอย่างรวดเร็ว รวมถึงอาจถูกนำไปใช้งานหรือประมวลผลต่อในหลากหลายรูปแบบ
- Organize การจัดระเบียบข้อมูลเพื่อให้ถูกนำไปใช้งานได้อย่างง่ายดายและแม่นยำมากยิ่งขึ้น รวมถึงการทำให้ข้อมูลมีคุณภาพมากยิ่งขึ้นด้วย
- Analyze การนำข้อมูลไปทำการวิเคราะห์และประมวลผลภายในระบบ AI หรือ Analytics โดยข้อมูลจะต้องสามารถถูกเข้าถึงได้ด้วยความเร็วสูง และอยู่ใกล้กับหน่วยประมวลผลให้มากที่สุด
- Infuse การนำข้อมูลและ AI ไปใช้งานจริงในธุรกิจหรือการทำงาน
จะเห็นได้ว่าแต่ละขั้นตอนนั้นมีความต้องการในการใช้งานหรือเข้าถึงข้อมูลที่แตกต่างกันออกไป โดยในขั้นตอนของการ Collect นั้นจะมุ่งเน้นไปที่การจัดเก็บข้อมูลให้รวดเร็วทันความต้องการและมีความจุที่มากพอ ในขณะที่ขั้นตอนของการ Organize นั้นจะเน้นไปที่การทำความเข้าใจและจัดระเบียบข้อมูลที่ได้รับมาเพื่อให้สามารถนำไปใช้งานต่อได้อย่างเหมาะสม ส่วนขั้นตอน Analyze นั้นจะเป็นการนำข้อมูลไปใช้ในการทำการวิเคราะห์จริง จึงต้องเน้นเรื่องของความเร็วเป็นหลัก และในขั้นตอน Infuse นั้นจะเป็นเรื่องของการนำระบบ AI และ Analytics ร่วมกับข้อมูลที่เกี่ยวข้องไปใช้หน้างานจริง
กฎข้อหนึ่งของวงการ Enterprise Storage ที่เป็นจริงมาตั้งแต่อดีตกาลแล้วนั้นก็คือการที่ระบบ Storage ไม่มีคำว่า One size fits all. ซึ่งหมายถึงว่าในการใช้งานข้อมูลแต่ละแบบนั้น หากต้องการให้การทำงานกับข้อมูลเป็นไปได้ด้วยประสิทธิภาพสูงสุดและเกิดความคุ้มค่าสูงสุด ก็ต้องเลือก Storage ที่ตอบโจทย์กับงานนั้นๆ นั่นเอง
IBM Elastic Storage System ระบบEnterprise Storage สำหรับงานAI, Big Data และSupercomputer โดยเฉพาะ
IBM ที่ได้เป็นผู้ออกแบบและติดตั้งระบบ Supercomputer ที่ใหญ่ที่สุดในโลกถึง 2 ระบบได้แก่ Summit และ Sierra นั้น ก็ได้มีประสบการณ์ด้านการจัดการกับข้อมูลปริมาณมหาศาลเพื่อการประมวลผลประสิทธิภาพสูงมาอย่างโชกโชน และด้วยความที่เป็นผู้บุกเบิกเทคโนโลยีทางด้าน AI อย่างยาวนาน จึงมีความเข้าใจในความต้องการด้านการใช้ข้อมูลในระบบลักษณะนี้เป็นอย่างดี
ด้วยเหตุนี้ทาง IBM จึงได้ทำการเปิดตัวผลิตภัณฑ์ Storage ตระกูลใหม่ภายใต้ชื่อ IBM Elastic Storage System ซึ่งเป็นระบบ Storage สำหรับ AI โดยเฉพาะขึ้นมา โดยใช้ IBM Elastic Storage Server ที่ติดตั้ง IBM POWER9 และออกแบบให้ระบบรองรับ I/O ปริมาณมหาศาลได้ พร้อมติดตั้ง IBM Spectrum Scale ซึ่งเป็นเทคโนโลยี Software-Defined Storage
สำหรับงาน High Performance Computing (HPC) เนื่องจากสามารถรองรับการรับส่งข้อมูลปริมาณมากแบบขนานหรือที่เรียกว่า Massive Parallel File System โดยทำงานบนระบบปฏิบัติการแบบเปิดอย่าง Red Hat Enterprise Linux เวอร์ชันล่าสุด ทำงานร่วมกันอย่างเป็นระบบและถูกออกแบบมาอย่างดีเพื่อให้กลายเป็นระบบ IBM Elastic Storage System ที่สามารถเริ่มต้นใช้งานที่ความจุระดับ Terabyte และเพิ่มขยายแบบ Scale-Out และ Scale-Up ไปจนถึงหลัก Petabyte, Exabyte หรือ Yottabyte ได้เลยทีเดียว
สำหรับการรักษาข้อมูลให้มีความมั่นคงทนทาน ระบบจะใช้การทำ Erasure Coding เป็นหลัก โดยระบบสามารถเลือกการตั้งค่าให้เหมาะสมกับระดับความทนทานและความจุที่ต้องการได้ ในขณะที่ยังเหมาะสมกับการใช้งานทั้งบน HDD และ All Flash ได้อย่างเต็มประสิทธิภาพ รวมไปถึงการออกแบบสถาปัตยกรรมของระบบแบบ Full Redundancy หรือไม่มี Single Point of Failure (SPOF) ทำให้สามารถปกป้องข้อมูลได้อย่างมีประสิทธิภาพ รองรับการเข้ารหัสข้อมูลที่เก็บใน IBM ESS ที่เรียกว่า Data-at-rest Encryption
ในด้านของการเชื่อมต่อเครือข่ายหรือระบบต่างๆ ขององค์กรนั้น IBM ESS รองรับความเร็วในการเชื่อมต่อตั้งแต่ 10/40/100GbE ไปจนถึง InfiniBand ที่ความเร็ว 56Gbps FDR, 100Gbps EDR และ 200Gbps HDR ซึ่งเป็นความเร็วมาตรฐานที่มักใช้กันในงาน HPC รวมไปถึงการเชื่อมต่อเครือข่ายเน็ตเวิร์กรูปแบบอื่นๆ ในปัจจุบันและอนาคต ทำให้สามารถทำงานได้กับทั้ง Server ที่ใช้หน่วยประมวลผล IBM Power ไปจนถึง x86 และ Server อื่นๆ อย่างเช่น NVIDIA DGX ที่เป็นที่นิยมในงานทางด้าน AI ได้เป็นอย่างดี
ในแง่โพรโตคอลสำหรับเชื่อมต่อไปยังเครื่องแม่ข่ายและแอพพลิเคชันต่างๆ ในองค์กร รองรับโพรโตคอลในการเชื่อมต่อมากที่สุดในท้องตลาดตอนนี้ ไม่ว่าจะเป็น
- NFS สำหรับ Linux และ Unix
- SMB/CIFS สำหรับ Windows
- S3 สำหรับคลาวด์และ Object Storage
- HDFS สำหรับ Hadoop และงาน Big Data
- OpenStack สำหรับคลาวด์และ Open Standards
- CSI Driver สำหรับ Container-based Application รองรับ Kubernetes Docker และ Red Hat OpenShift
- GPFS Client สำหรับโพรโตคอล POSIX ที่ทำให้เครื่องแม่ข่ายเชื่อมต่อ ESS Storage ได้เสมือน Local Disk ของตัวเอง และมีความเร็วสูง
นอกจากนี้ IBM ESS ยังสามารถเชื่อมต่อกับระบบคลาวด์ในรูปแบบ Transparent Cloud Tiering ที่ทำให้ลูกค้าสามารถรับส่งข้อมูลขึ้น-ลงเครือข่ายผู้ให้บริการคลาวด์ทั้งในและนอกประเทศได้อีกด้วย ไม่ว่าจะเป็น IBM Cloud, AWS Cloud, Microsoft Azure Cloud เป็นต้น รูปแบบการจัดเก็บข้อมูลของ IBM ESS ยังรองรับการจัดเก็บข้อมูลทั้งในลักษณะของ File System และ Object Storage เป็นหลัก และสามารถทำงานร่วมกับโซลูชันอื่นๆ ของ IBM ได้เป็นอย่างดี รวมถึง IBM Spectrum Discover สำหรับใช้ในการ Organize ข้อมูลเพื่อนำไปใช้งานต่อได้อย่างง่ายดายอีกด้วย
อีกจุดเด่นที่สำคัญที่ทำให้ IBM ESS มีผู้ใช้งานมากมายทั่วโลกคือ ความสามารถในการให้บริการอุปกรณ์จัดเก็บข้อมูลในรูปแบบ Global Single Namespace ที่สามารถลดความยุ่งยากในการเข้าถึงข้อมูลไฟล์หรือการค้นหาไฟล์เอกสารต่างๆ ได้อย่างมีประสิทธิภาพ เพราะผู้ใช้สามารถเข้าถึงไฟล์ที่จัดเก็บในรูปแบบ Hierarchical File System ที่ซับซ้อนได้ง่ายขึ้น ไม่ว่าผู้ดูแลระบบย้ายข้อมูลไปยังสตอเรจรูปอื่นหรือ Tier อื่น ผู้ใช้ก็ยังสามารถเข้าถึงข้อมูลที่ต้องการได้เหมือนเดิม รวมไปถึงการเข้าถึงข้อมูลจากระยะไกลหรือตั้งอยู่คนละภูมิภาคก็ยังได้
Form Factor ของระบบนี้จะมาในรูปแบบของ Storage Appliance ที่ภายในบรรจุ IBM Power9 Data Server จำนวน 2 ชุด และ IBM Power9 ESS Management Server จำนวน 1 ชุดต่อ Cluster รวมถึงชุดของ Expansion และ PDU ให้ พร้อมใช้งานได้ทันที
ปัจจุบัน IBM ESS มีด้วยกัน 2 รุ่นล่าสุดที่เพิ่งเปิดตัวมาในปี 2020 ได้แก่
- IBM Elastic Storage System 5000 (ESS 5000) ระบบจัดเก็บข้อมูลสำหรับงาน Data Lake โดยจะเป็นรุ่น HDD ที่เน้นความจุในการจัดเก็บข้อมูลเป็นหลัก
- IBM Elastic Storage System 3000 (ESS 3000) ระบบจัดเก็บข้อมูลสำหรับงานประมวลผลความเร็วสูง โดยจะเป็นรุ่น NVMe Flash เพื่อให้สามารถเข้าถึงข้อมูลได้ด้วยความเร็วสูงสุด
ด้วยความที่ระบบเป็นแบบสำเร็จรูปติดตั้งมาพร้อมใช้งานนี้ ก็ทำให้ IBM ESS นี้สามารถติดตั้งใช้งานได้ภายในเวลาเพียงไม่กี่นาทีเท่านั้น และสำหรับการอัปเกรดเองก็สามารถทำได้อย่างง่ายดาย เพราะระบบนี้ใช้ Container เป็นหลักในการทำงาน ทำให้การอัปเกรดสามารถทำได้อย่างราบรื่นไม่ต้องหยุดการทำงานของระบบ
สำหรับการดูแลรักษา IBM ได้ติดตั้ง IBM Storage Insights มาให้พร้อมใช้งานได้ทันที ทำให้ทุกเหตุการณ์ที่เกิดขึ้นบน IBM ESS นี้จะถูกวิเคราะห์โดย AI และแจ้งเตือนผู้ดูแลระบบโดยอัตโนมัติทันทีหากมีแนวโน้มว่าจะเกิดปัญหาใดๆ ทำให้สามารถทำการแก้ไขป้องกันปัญหาได้ล่วงหน้าก่อนที่จะเกิดปัญหาขึ้นจริง ลดโอกาสการเกิด Downtime ที่ไม่คาดฝันลงได้อย่างมีประสิทธิภาพ
ผู้ที่สนใจโซลูชัน AI Infrastructure จาก IBM สามารถศึกษาข้อมูลเพิ่มเติมได้ที่ https://www.ibm.com/it-infrastructure/storage/ai-infrastructure
สนใจโซลูชันของ IBM ติดต่อทีมงาน Metro Connect ได้ทันที
สำหรับผู้ที่สนใจโซลูชันของ IBM สามารถติดต่อทีมงาน Metro Connect ได้ทันทีโดยสามารถขอใบเสนอราคาได้ทันทีที่แผนกการตลาด อีเมล์ anutrwan@metroconnect.co.th หรือโทร 02-089-4508
One comment
Pingback: รู้จัก IBM Elastic Storage System โซลูชันจัดเก็บข้อมูลสำหรับ AI และ Big Data สำหรับธุรกิจองค์กร | | อัพเดทเครื่องใช้