ในการทดสอบความเร็วในการทำ Hadoop Sort โดยองค์กร Transaction Processing Performance Council หรือเรียกสั้นๆ ว่า TPC (www.tpc.org) ได้แสดงผลลัพธ์ที่น่าสนใจมากว่า ผลการทดสอบเปรียบเทียบกันระหว่างการทำ Hadoop Sort บน Server จาก Dell รุ่น PowerEdge R720xd ที่ลง VMware vSphere 6.0 แล้วค่อยติดตั้งระบบปฏิบัติการลงไปเป็น Guest OS กับ Server ชุดเดียวกันที่ไม่ได้ติดตั้ง Hypervisor แต่ข้ามไปติดตั้ง OS ตรงๆ เลย ผลลัพธ์คือ ระบบที่ติดตั้ง VMware vSphere 6.0 มีความเร็วสูงว่า 8% ในการทำงานภายใต้ Environment เดียวกัน
การทดสอบในครั้งนี้ที่จริงแล้วทาง Dell เป็นผู้ยื่นให้องค์กร TPC ช่วยทำการทดสอบให้ เพื่อจะได้นำผลลัพธ์มาใช้อ้างอิงได้ว่า Dell PowerEdge R720xd สามารถนำไปใช้ในงานประมวลผล Big Data Analytics ด้วย Hadoop Cluster ได้ และลูกค้าสามารถมั่นใจในประสิทธิภาพการทำงานของ Server ได้จากผลการทดสอบทำ Hadoop Sorting รวมถึงความคุ้มค่าที่ได้รับเมื่อนำราคามาคิดคำนวนร่วมกับความเร็วในการทำ Hadoop Sort นั่นเอง โดย Dell ได้ยื่นทดสอบไปทั้งการทำ Big Data Analytics บนทั้ง Virtualization โดยใช้ VMware vSphere 6.0 และ Bare Metal คือติดตั้ง OS ลงไปตรงๆ เลย โดยมี Architecture ในการทดสอบดังนี้
ผลที่ได้รับคือ การทำ Hadoop Sort per Hour ของระบบที่ติดตั้ง VMware vSphere 6.0 เร็วกว่าแบบ Bare Metal ถึง 8% นั่นเอง ซึ่งแปลว่าการทำ Virtualization สำหรับระบบ Big Data Analytics ส่งผลดีทางด้านประสิทธิภาพนั่นเอง ซึ่งถือเป็นเรื่องที่ค่อนข้างน่าสนใจเพราะโดยทั่วไปแล้ว การเพิ่ม Layer ของ Software ในระบบใดๆ มักจะทำให้ระบบทำงานช้าลง แลกมากับประโยชน์ด้านอื่นๆ เช่น การบริหารจัดการ ความปลอดภัย หรืออื่นๆ แทน แต่ในครั้งนี้การเพิ่มชั้นของ Hypervisor เข้ามากลับทำให้ระบบโดยรวมทำงานได้เร็วขึ้น ซึ่งทีมงาน TechTalkThai ก็พอจะทราบอยู่ในแง่มุมอื่นมาจากการทดสอบ VMware ด้วยตัวเองอยู่แล้ว แต่ก็ยังไม่เคยนำไปใช้กับ Hadoop Cluster เลย
ในขณะเดียวกัน การทดสอบนี้ก็ทำเฉพาะ Hadoop Sort ซึ่งก็คงไม่อาจแทนการประมวลผล Big Data Analytics ทุกรูปแบบได้ แต่นี่ก็เป็นสัญญาณว่าในการประมวลผลบางรูปแบบ การทำ Virtualization ก็สามารถส่งผลให้ประสิทธิภาพการทำงานดีขึ้นได้เช่นกัน ดังนั้นถัดจากนี้ไป การทดสอบระบบการประมวลผลประสิทธิภาพสูงต่างๆ โดยเปรียบเทียบระหว่างการใช้ Virtualization กับไม่ใช้ เพื่อหา Best Practice เปรียบเทียบไปเรื่อยๆ ก็อาจกลายเป็นขั้นตอนที่จำเป็นเพื่อให้ได้ผลลัพธ์ที่ดีที่สุดด้วยเช่นกัน
ที่มา: http://blogs.vmware.com/vsphere/2015/03/virtualized-big-data-faster-bare-metal.html