Breaking News

IBM Integrated Analytics System: ระบบ Data Warehouse ที่ตอบโจทย์ได้ทั้ง Cloud และ Data Science

Data Warehouse นั้นยังคงถือเป็นอีกหนึ่งเทคโนโลยีสำคัญสำหรับองค์กรที่ต้องการวิเคราะห์ข้อมูลทางธุรกิจอย่างรวดเร็ว และด้วยการมาของแนวคิดด้าน AI, Machine Learning, Big Data, Cloud, Data Science, IoT ที่ทำให้ปริมาณข้อมูลที่ องค์กรต้องทำการวิเคราะห์นั้นมีปริมาณเพิ่มขึ้นอย่างรวดเร็ว เทคโนโลยีด้าน Data Warehouse เองก็ต้องปรับตัวเพื่อรองรับความต้องการเหล่านี้ให้ได้ และ IBM Integrated Analytics System หรือ IIAS นี้เองที่ IBM ได้ทำการออกแบบมาเพื่อตอบโจทย์นี้โดยเฉพาะ

 

Credit: IBM

 

Data Warehouse ต้องทำการวิเคราะห์ข้อมูลขนาดใหญ่ จากหลากหลายแหล่งข้อมูล บรรจบเข้ากับศาสตร์ทางด้าน Data Science

งานทางด้าน Data Warehouse ในอดีตมักเป็นการรวมเอาข้อมูลจาก Relational Database หลากหลายแหล่งเข้ามาด้วยกัน โดยมีขั้นตอนการทำ Extract, Transform, Load หรือ ETL เข้ามาเกี่ยวข้องเป็นหลัก เพื่อเตรียมข้อมูลให้พร้อมต่อการนำไปสร้างเป็นรายงานทางธุรกิจรูปแบบต่างๆ ที่องค์กรต้องการได้อย่างรวดเร็ว

แต่ปัจจุบันนี้ อิทธิพลจากเทคโนโลยีและแนวคิดในฝั่ง Big Data และ Data Science เองก็ได้ส่งผลต่อการวิเคราะห์ข้อมูลในระดับองค์กรมากยิ่งขึ้น โดยข้อมูลที่ถูกนำมาใช้ในการวิเคราะห์และประมวลผลนั้นอาจไม่ได้อยู่ในรูปของ Relational Database เพียงอย่างเดียว แต่อาจอยู่ในรูปของไฟล์, Unstructured Data หรือรูปแบบอื่นๆ ก็ได้ ในขณะที่แหล่งที่มาของข้อมูลเองนั้นก็เปลี่ยนไปเช่นกัน จากเดิมที่ข้อมูลทั้งหมดเคยถูกจัดเก็บอยู่ภายในองค์กรทั้งหมด คราวนี้ข้อมูลอาจถูกจัดเก็บอยู่ใน Data Center หลายแห่งขององค์กร, ถูกจัดเก็บอยู่บน Cloud ที่องค์กรใช้, ถูกจัดเก็บอยู่ในอุปกรณ์ Edge Computing เพื่อรองรับระบบ Internet of Things (IoT) หรือเป็นข้อมูลจาก 3rd Party รายอื่นๆ ที่ให้บริการข้อมูลหรือเป็นพันธมิตรและแลกเปลี่ยนข้อมูลกับองค์กรก็เป็นได้

ด้วยเหตุนี้เอง ทำให้ระบบ Data Warehouse ในปัจจุบันต้องมีการปรับตัวไปค่อนข้างมากทีเดียว โดยการเปิดรับต่อความต้องการของเหล่า Data Scientist ที่ต้องการวิเคราะห์ข้อมูลขนาดใหญ่จากแหล่งที่มาหลากหลายมากขึ้น และยังคงต้องใช้งานได้อย่างง่ายดาย ตอบโจทย์ต่อการวิเคราะห์ข้อมูลโดยเหล่านักวิเคราะห์ภายในองค์กรที่ยังคงคุ้นเคยกับการเข้าถึงข้อมูลต่างๆ ผ่านคำสั่ง SQL ให้ได้

 

การย้ายข้อมูลระหว่าง On-Premises และ Cloud นั้นคือโจทย์ใหญ่ที่องค์กรต้องเผชิญ

แน่นอนว่าโจทย์หนึ่งที่ทำให้องค์กรต่างๆ ต้องประสบกับความท้าทายครั้งใหญ่ในเวลานี้ ก็คือการที่ข้อมูลนั้นอยู่กระจัดกระจายทั้งภายในและภายนอกองค์กรนั่นเอง ประเด็นนี้ทำให้องค์กรต้องคอยพิจารณาปัจจัยต่างๆ ทั้งในแง่ของ Security และ Compliance ด้านการจัดเก็บ, โยกย้าย และนำข้อมูลมาใช้ ไปจนถึงด้านระบบเครือข่ายทั้งภายในและภายนอกองค์กรที่อาจไม่เอื้อต่อการโอนย้ายข้อมูลขนาดใหญ่

การย้ายข้อมูลนี้ไม่ได้สร้างปัญหาเพียงแค่เฉพาะในขั้นตอนการทำ Data Preparation เท่านั้น แต่ในขั้นตอนการวิเคราะห์ข้อมูลที่มีกระบวนการซับซ้อนยิ่งขึ้น ไปจนถึงการนำข้อมูลไปใช้งานต่อสำหรับผู้ใช้งานรายต่างๆ หรือการส่งผลลัพธ์ไปยังระบบอื่นๆ ต่อเนื่องนั้นก็ต้องเกิดการย้ายข้อมูลทั้งสิ้น ทำให้ประเด็นเรื่องการย้ายข้อมูลนี้เป็นปัญหาที่ถือว่าค่อนข้างใหญ่สำหรับองค์กร โดยเฉพาะอย่างยิ่งองค์กรที่ต้องการก้าวไปสู่การเป็น Data-Driven Business อย่างเต็มตัวในอนาคต และมีสาขาที่หลากหลายกระจายอยู่ทั่วโลก ซึ่งแต่ละพื้นที่เองนั้นก็ต้องถูกบังคับด้วยข้อกำหนดทางกฎหมายในรูปแบบที่แตกต่างกันไป

นอกจากประเด็นด้านความปลอดภัยและกฎหมายแล้ว การย้ายข้อมูลขนาดใหญ่เองนั้นก็ต้องใช้เวลามหาศาลเช่นกันด้วยคอขวดที่เกิดขึ้นจากการเชื่อมต่อระบบเครือข่าย ทำให้ประเด็นเรื่องการย้ายข้อมูลนี้ถือเป็นประเด็นที่ต้องให้ความสำคัญเป็นอันดับต้นๆ ในการออกแบบระบบ Data Warehouse ในระดับองค์กร เพราะไม่เช่นนั้นแล้วขั้นตอนการย้ายข้อมูลนี้เองจะเป็นคอขวดที่ใหญ่มากในการวิเคราะห์ข้อมูล จนอาจทำให้การวิเคราะห์ข้อมูลหรือแสดงรายงานต่างๆ นั้นล่าช้าเกินกว่าที่ภาคธุรกิจจะรับได้

 

IBM Integrated Analytics System: โซลูชัน Data Warehouse หนึ่งเดียวที่รวมความสามารถในการรองรับ Data Moving, Data Virtualization และ Data Science ได้พร้อมกัน

 

Credit: IBM

 

ก่อนหน้านี้หากพูดถึงชื่อของระบบ Data Warehouse จาก IBM นั้นก็มักจะนึกถึงชื่อของ IBM Netezza และ IBM PureData System for Analytics กันเป็นหลักเพราะสองผลิตภัณฑ์นี้ถือว่าประสบความสำเร็จค่อนข้างดีทีเดียว แต่ในปัจจุบันนี้ IBM ได้พัฒนาระบบ IBM Integrated Analytics System หรือ IBM IIAS ขึ้นมาเป็นโซลูชัน Data Warehouse ล่าสุดในฐานะของระบบ Appliance สำหรับติดตั้งใช้งานแบบ On-premises ได้อย่างสำเร็จรูปแทนแล้ว โดยในระบบ IIAS นี้จะประกอบไปด้วยทั้ง Software และ Hardware ที่พร้อมให้องค์กรนำไปใช้ในการรวบรวมและวิเคราะห์ข้อมูลได้ทันที ดังนี้

  • IBM Db2 Warehouse Engine ระบบ Common SQL Engine ที่มาพร้อมกับ IBM Db2 BLU Acceleration สำหรับการวิเคราะห์ข้อมูลประสิทธิภาพสูงได้ในแบบ In-memory Processing
  • IBM Data Science Experience (DSX) Local เครื่องมือในการรวบรวมและวิเคราะห์ข้อมูลสำหรับ Data Scientist โดยเฉพาะ ไม่ว่าจะเป็น R, Python, Scala, Spark และอื่นๆ
  • สามารถ Integrate เข้ากับระบบวิเคราะห์ข้อมูลอื่นๆ, ระบบ Business Intelligence (BI) หรือภาษาต่างๆ ได้ เช่น IBM SPSS, SAS, R, Fuzzy Logix, IBM Cognos, Tableau, Microstrategy, Business Objects, Microsoft Excel, SSRS, Kognitio, QlikView และอื่นๆ อีกมากมาย ทำให้สามารถนำไปต่อยอดในการทำ Data Mining, Machine Learning และอื่นๆ ได้
  • Docker สำหรับใช้ในการเพิ่มขยายบริการต่างๆ ให้สามารถทำได้อย่างสะดวกและรวดเร็ว รวมถึงรองรับการนำแนวคิดด้าน CI/CD มาใช้ในการวิเคราะห์ข้อมูลได้อีกด้วย
  • IBM Magneto สำหรับทำหน้าที่บริหารจัดการ Software Stack และติดตามการทำงานของระบบทั้งหมดโดยรวม
  • IBM Wolverine สำหรับเสริมความทนทานของระบบให้ทำงานทดแทนกันได้แบบ High Availability
  • IBM Data Server Manager (DSM) สำหรับช่วยในการบริหารจัดการข้อมูล
  • Red Hat Enterprise Linux LE for Power ระบบปฏิบัติการ Linux ที่มาพร้อมกับ Military-grade Security และประสิทธิภาพสูงสำหรับรองรับการวิเคราะห์ข้อมูล
  • IBM Spectrum Scale (GPFS) สำหรับทำหน้าที่เป็นระบบ Distributed Parallel Filesystem เพื่อใช้จัดเก็บข้อมูลสำคัญที่นำมารวบรวมและทำการวิเคราะห์รวมถึงจัดเก็บผลการวิเคราะห์ข้อมูลเอาไว้ ให้ข้อมูลเหล่านี้สามารถเข้าถึงได้อย่างรวดเร็ว ในขณะที่ยังคงมีความทนทานสูง และเพิ่มขยายความจุและประสิทธิภาพได้ง่าย
  • Call Home ระบบตรวจสอบการทำงานของส่วนประกอบต่างๆ ในโซลูชัน ทั้ง Hardware และ Software เพื่อให้ทีมงานของ IBM สามารถรับทราบถึงแนวโน้มของปัญหาและช่วยบริการได้ก่อนที่ปัญหาจะเกิดขึ้นจริง
  • IBM Power 8 S822L อุปกรณ์ Server ประสิทธิภาพสูงที่ปรับแต่งมาสำหรับการประมวลผลข้อมูลขนาดใหญ่โดยเฉพาะ ทำงานรวดเร็วกว่าระบบทั่วๆ ไป 10-100 เท่า
  • IBM Flash System 900 อุปกรณ์ All Flash Array ประสิทธิภาพระดับสูงสุดจาก IBM เพื่อให้การเข้าถึงข้อมูลมีความรวดเร็วสูงสุด พร้อมทั้งยังสามารถเพิ่ม Storage อื่นๆ เข้าไปเพื่อทำ Tiering ได้ รองรับความจุได้ระดับ Petabyte
  • อุปกรณ์เครือข่ายจาก Mellanox และ Brocade

 

Credit: IBM

 

ระบบทั้งหมดนี้ถูกติดตั้ง, ปรับแต่งและทำ Performance Tuning มาแล้วเพื่อให้สามารถนำไปใช้งานได้อย่างเต็มประสิทธิภาพ ทำให้องค์กรต่างๆ สามารถเริ่มต้นใช้งานได้อย่างรวดเร็วและง่ายดาย ในขณะที่การให้บริการหลังการขายทั้งหมดสามารถติดต่อทีมงานของ IBM เป็น Single Point of Contact (SPOC) ได้เลย ง่ายต่อการดูแลรักษาในอนาคต

ส่วนในแง่ของการเพิ่มขยายนั้น ก็สามารถเลือกได้ว่าจะเพิ่มเฉพาะกำลังประมวลผลด้วยการเพิ่ม Server, การเพิ่มความจุและประสิทธิภาพในการเข้าถึงข้อมูลด้วยการเพิ่ม Storage หรือการทำ Storage Tiering เพื่อให้การจัดเก็บข้อมูลปริมาณมหาศาลเหล่านี้เป็นไปได้อย่างคุ้มค่าสูงสุด ทำให้องค์กรสามารถเริ่มต้นจากระบบขนาดเล็กก่อน แล้วค่อยเพิ่มขยายในภายหลังได้ รองรับการนำไปใช้งานได้ในทุกอุตสาหกรรมที่มีความพร้อมในการลงทุนที่แตกต่างกันได้ทันที

 

Credit: IBM

 

จัดการกับข้อมูลได้อย่างครบถ้วน ด้วยโซลูชัน IBM Hybrid Data Management

จุดเด่นสำคัญที่สุดอันหนึ่งของ IIAS นี้ก็คือความสามารถในการวิเคราะห์ข้อมูลได้ในแบบ Hybrid ด้วยการรองรับการวิเคราะห์ข้อมูลจากหลากหลายแหล่งได้หลากหลายรูปแบบ ไม่ว่าจะเป็นการนำข้อมูลทั้งหมดมาบันทึกใน IIAS ก่อนทำการวิเคราะห์, การดึงข้อมูลเฉพาะบางส่วนจากระบบอื่นๆ มาทำการวิเคราะห์ หรือการให้ระบบอื่นๆ นั้นทำการวิเคราะห์ข้อมูลเสร็จแล้วจึงค่อยส่งผลลัพธ์มาใช้งานต่อบน IIAS ก็ได้ ทำให้สามารถควบคุมการย้ายข้อมูลได้อย่างอิสระตามความต้องการและข้อจำกัดต่างๆ ได้เป็นอย่างดี ไม่ว่าข้อมูลเหล่านั้นจะถูกจัดเก็บในรูปแบบ Structured Data หรือ Unstructured Data ก็ตาม

 

Credit: IBM

 

ในทางกลับกัน ข้อมูลและผลการวิเคราะห์ข้อมูลใน IIAS หรือข้อมูลที่ IIAS เข้าถึงได้นั้น ก็สามารถถูกระบบอื่นๆ เรียกไปใช้งานเพื่อนำไปวิเคราะห์หรือแสดงผลอีกต่อได้ด้วยเช่นกัน เนื่องจาก IIAS นี้ถูกออกแบบมาให้เป็นระบบเปิด และเชื่อมต่อกับโซลูชันอื่นๆ ได้อย่างหลากหลาย เพื่อให้องค์กรสามารถนำข้อมูลไปใช้งานได้อย่างคุ้มค่าสูงสุดด้วยเครื่องมือที่ถนัดที่สุด และรองรับการต่อยอดในอนาคตได้เป็นอย่างดีนั่นเอง

ทั้งนี้ IIAS เองก็ถือเป็นเพียงโซลูชันหนึ่งในโซลูชัน IBM Hybrid Data Management เท่านั้น โดยเทคโนโลยี Common SQL Engine ของ IBM นี้เองที่ทำให้ไม่ว่าจะเป็นเทคโนโลยีการจัดเก็บและวิเคราะห์ข้อมูลบน Cloud, บนระบบ Software-defined, บนระบบ Appliance, บนระบบ Database หรือบน Open Source Hadoop จาก Hortonworks นั้นสามารถเข้าถึงข้อมูลระหว่างกันและแลกเปลี่ยนข้อมูลกันได้อย่างอิสระตามต้องการ ทำให้องค์กรมีทางเลือกในการเลือกใช้เทคโนโลยีและสถาปัตยกรรมของระบบที่เหมาะสมกับความต้องการของตนเองได้อยู่เสมอ

 

ปลายทางจาก Data-Driven Business สู่ AI-Driven Business ที่ยืดหยุ่นด้วยการรองรับการนำข้อมูลไปใช้งานได้อย่างหลากหลาย

วิสัยทัศน์ของ IBM นั้นไม่ได้จบเพียงแค่การทำให้องค์กรสามารถจัดการข้อมูลและนำไปใช้ได้อย่างสะดวกและง่ายดายเท่านั้น แต่ IBM มองว่าในอนาคตข้อมูลเหล่านี้เองที่จะกลายเป็นทรัพยากรสำคัญขององค์กรในการพัฒนาระบบ Artificial Intelligence หรือ AI ออกมาให้บริการลูกค้าหรือทำ Automation ในหน้าที่ต่างๆ เพื่อเสริมขีดความสามารถในการแข่งขัน ดังนั้นข้อมูลที่องค์กรมีอยู่นี้จึงต้องถูกนำไปใช้งานต่อได้อย่างอิสระด้วย

IIAS ที่มีความสามารถในการเข้าถึง จัดเก็บ และจัดการกับข้อมูลได้อย่างยืดหยุ่นนี้ก็จะเป็นรากฐานที่แข็งแกร่งให้กับองค์กรในการนำข้อมูลเหล่านี้ไปใช้ต่อยอดสร้างนวัตกรรมใหม่ๆ ในอนาคต ด้วยการช่วยให้องค์กรก้าวข้ามข้อจำกัดด้านการโยกย้ายข้อมูลที่เคยเป็นขั้นตอนอันซับซ้อนและมีประเด็นปัญหาต่างๆ ที่ต้องพิจารณาค่อนข้างมากไปได้ด้วยแนวทางที่ง่ายดายและมั่นคงปลอดภัย

 

ติดต่อ IBM ได้ทันที

สำหรับผู้ที่สนใจโซลูชัน IBM Integrated Analytics System นี้ และต้องการขอข้อมูลเพิ่มเติมหรือทดสอบการใช้งานจริง สามารถอินบ็อกซ์ติดต่อทีมงาน IBM Thailand หรือติดตามข่าวสารใหม่ๆ จาก IBM ได้ที่ https://www.facebook.com/IBMThailand/




About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

ใครคือผู้รับผิดชอบที่แอปพลิเคชัน Third-party สามารถเข้าถึงข้อมูล Gmail ได้

Google ได้แถลงการณ์ยอมรับอย่างเป็นทางการต่อฝ่ายนิติบัญญัติของสหรัฐฯ ว่าตนได้อนุญาตให้แอปพลิเคชัน Third-party เข้าถึงและแชร์ข้อมูลของ Gmail ได้ แต่วันนี้เรามีอีกมุมมองจาก Howtogeek ที่จะมาเจาะลึกถึงเหตุผลว่าแท้จริงแล้วใครคือผู้ที่ต้องรับผิดชอบกันแน่

เต็ดตรา แพ้ค จัดการสัมมนาออนไลน์ เสนอแนวทางการวางแผนการบำรุงรักษาเครื่องจักรแบบอัตโนมัติล่วงหน้า ในยุคอุตสาหกรรม 4.0

26 กันยายนนี้ เวลา 11.00-12.00 น. บริษัท เต็ดตรา แพ้ค ร่วมกับ บริษัทไมโครซอฟท์ ขอเชิญร่วมฟัง การสัมมนาออนไลน์แบบไม่เสียค่าใช้จ่าย ในหัวข้อ “Predictive Maintenance …