MFEC: ก้าวแรกสู่ Digital Transformation และ Big Data Analytics กับการทำ Data Cleansing บนข้อมูลภาษาไทย

mfec_logopremier-business-partner-logo_h90

ทางทีมงาน TechTalkThai มีโอกาสได้ไปสัมภาษณ์ทีมงานของ MFEC ถึงเทคโนโลยีที่ทาง MFEC ได้พัฒนาขึ้นมาเพื่อช่วยให้เหล่าองค์กรต่างๆ สามารถแปลงข้อมูลภาษาไทยที่มีอยู่ให้พร้อมต่อการนำไปใช้ประโยชน์ต่อยอด เพื่อปรับปรุงการเข้าสู่การทำ Digital Transformation และ Big Data Analytics ด้วยการใช้เทคโนโลยี Data Cleansing ที่ปรับแต่งมาสำหรับภาษาไทยโดยเฉพาะ องค์กรไหนที่กำลังมองหาเทคโนโลยีสำหรับจัดการข้อมูลที่มีอยู่ให้มีความพร้อมต่อการปรับตัว ก็ลองศึกษาดูกันได้เลยนะครับ

 

บทสรุปผู้บริหาร

mfec_005

การนำข้อมูลที่มีอยู่ภายในองค์กรมาต่อยอดธุรกิจและนำเสนอสิ่งใหม่ๆ แก่ลูกค้านั้นไม่ใช่เรื่องง่ายเสมอไปในทางปฏิบัติ เพราะถึงแม้องค์กรจะมีการรวบรวมข้อมูลของลูกค้าที่มาติดต่อทำธุรกรรมต่างๆ เอาไว้ แต่เมื่อจะนำข้อมูลมาใช้งานจริงๆ ก็อาจจะพบได้ว่าข้อมูลเหล่านั้นไม่มีคุณภาพที่เพียงพอต่อการนำมาใช้งาน

อีกเหตุการณ์หนึ่งที่มักจะพบได้ในองค์กรขนาดใหญ่ที่มี Business Unit ที่หลากหลาย ก็คือการที่แต่ละ Business Unit มีซอฟต์แวร์สำหรับสนับสนุนการทำงานของตนเอง และเมื่อองค์กรต้องการจะรวบรวมข้อมูลเหล่านั้นทั้งหมดเข้าด้วยกัน กลับพบว่ารูปแบบการจัดเก็บข้อมูลแตกต่างกันในเชิงรายละเอียด และมีความซ้ำซ้อนกันเป็นอย่างมาก

MFEC ในฐานะของบริษัทที่มีประสบการณ์ในการพัฒนาระบบงานต่างๆ สำหรับองค์กรหลากหลายรูปแบบ และผ่านการจัดการปัญหาทางด้านระบบ IT ขององค์กรมาเป็นจำนวนมาก ก็พบว่าทางออกเดียวที่ทุกๆ องค์กรจะต้องทำก่อนนำข้อมูลทั้งหมดเหล่านี้มาใช้ประโยชน์ได้ ก็คือการจัดการทำความสะอาดข้อมูล หรือเรียกว่าการทำ Data Cleansing นั่นเอง

ในการทำ Data Cleansing ให้ประสบความสำเร็จในประเทศไทยได้นั้น ประสบการณ์และความเข้าใจในธุรกิจขององค์กรลูกค้านั้นถือเป็นสิ่งสำคัญ เนื่องจากการจัดการข้อมูลที่เป็นภาษาไทยนั้นไม่ใช่เรื่องง่าย ทั้งด้วยตัวธรรมชาติของภาษาเอง, เครื่องไม้เครื่องมือที่อาจมีไม่เพียบพร้อม รวมถึงความเชี่ยวชาญของทีมงานในการวิเคราะห์ปัญหาและการจัดการข้อมูลให้เป็นไปตามรูปแบบความต้องการในการใช้งาน

MFEC จึงได้นำเทคโนโลยี IBM InfoSphere QualityStage สำหรับการจัดการทำความสะอาดข้อมูลโดยเฉพาะมาทำการต่อยอดเพื่อให้รองรับภาษาไทย และใช้ประสบการณ์และความเชี่ยวชาญของทีมงานนักพัฒนาซอฟต์แวร์เพื่อพัฒนาระบบเหล่านีต่อยอดให้สามารถทำงานได้ตามกระบวนการการทำงานของแต่ละองค์กร พร้อมทีมผู้เชี่ยวชาญที่จะคอยให้คำปรึกษาการจัดการทำความสะอาดข้อมูลโดยเฉพาะ เพื่อเป็นก้าวแรกสำหรับทุกๆ องค์กรที่ต้องการต่อยอดธุรกิจด้วยข้อมูลภายในองค์กร รวมถึงการเปิดศักราชของ Big Data Analytics สำหรับข้อมูลที่เป็นภาษาไทย

 

Challenge: การรวมข้อมูลจากหลายระบบงานเข้าด้วยกัน ไม่ใช่เรื่องง่าย

mfec_006

คำถามเบื้องต้นสำหรับทุๆ องค์กรที่ควรถามตัวเองให้ได้ก่อนที่จะนำข้อมูลลูกค้าภายในองค์กรมาต่อยอดให้ได้ก่อนนั้น ก็คือคำถามที่ว่า “ปัจจุบันนี้องค์กรมีลูกค้าอยู่กี่คน? แต่ละคนเป็นใครบ้าง?”

สำหรับองค์กรที่มีฐานข้อมูลเพียงฐานข้อมูลเดียวก็อาจตอบคำถามนี้ได้ทันทีจากการนับจำนวนบรรทัดของฐานข้อมูลลูกค้าภายในองค์กร ส่วนองค์กรที่มีหลายระบบงานและมีหลายฐานข้อมูล ก็อาจเจอความยุ่งยากในการนำข้อมูลลูกค้าทั้งหมดมารวมกัน และตัดข้อมูลของลูกค้าที่ซ้ำซ้อนออกไป

แต่จากประสบการณ์ของ MFEC นั้น การตอบคำถามนี้ไม่ใช่เรื่องง่ายนัก เพราะข้อมูลภาษาไทยนั้นมีความซับซ้อนมากกว่าที่คิด ไม่ว่าจะเป็น

  • คำนำหน้าชื่อของแต่ละคนที่มีความหลากหลาย ทั้งการระบุเพศ, ยศ และการที่ลูกค้าแต่ละคนจะใส่ข้อมูลอย่างครบถ้วนหรือใส่ไม่ครบถ้วนในแต่ละครั้ง
  • ตัวอักษรย่อและตัวอักษรเต็ม ทั้งในคำนำหน้าชื่อ, ที่อยู่ และข้อมูลอื่นๆ
  • การเลือกใส่ข้อมูลบางส่วนเป็นภาษาอังกฤษ และข้อมูลบางส่วนที่เป็นภาษาไทย
  • ประเด็นปัญหาอื่นๆ อีกมากมาย

ซึ่งถ้าหากพิจารณาถึงความเป็นไปได้ที่ข้อมูลลูกค้าภายในองค์กรจะมีปัญหาเหล่านี้แล้ว การย้อนกลับไปตอบคำถามของแต่ละองค์กรว่า “ปัจจุบันนี้องค์กรมีลูกค้าอยู่กี่คน? แต่ละคนเป็นใครบ้าง?” นั้น ก่อนที่องค์กรจะตอบได้ก็อาจต้องไปทำการตรวจสอบข้อมูลที่มีอยู่ให้ชัดเจนเสียก่อน แม้ว่าจะมีฐานข้อมูลเพียงฐานข้อมูลเดียวก็ตาม เพราะนั่นอาจหมายถึงการที่องค์กรอาจมีข้อมูลที่ไม่ครบถ้วนของลูกค้าบางคนจนไม่สามารถนำมาใช้งานได้ หรืออาจมีข้อมูลของลูกค้าบางคนที่ซ้ำซ้อนอยู่ก็เป็นได้เช่นกัน

ทั้งนี้ถ้าหากองค์กรนำข้อมูลเหล่านั้นไปใช้งานต่อทันทีโดยไม่ได้มีการตรวจสอบหรือแก้ไขข้อมูลเหล่านั้นให้เรียบร้อย องค์กรก็อาจพบกับปัญหาดังต่อไปนี้

  • การส่งจดหมายการตลาดไปให้ลูกค้ารายเดิมซ้ำๆ ทำให้ลูกค้าเกิดความรำคาญ และเป็นความรู้สึกเชิงลบต่อแบรนด์ขององค์กร
  • การส่งเอกสารไปยังที่อยู่ที่ไม่มีอยู่จริง ทำให้เกิดค่าใช้จ่ายที่สูญเปล่า
  • การประเมินจำนวนลูกค้าผิด ทำให้การคำนวนทางสถิติทั้งหมดผิดพลาด และสร้างความเสียหายที่ประเมินค่าได้ยากในระยะยาว

MFEC จึงเชื่อว่าก่อนการนำข้อมูลที่องค์กรมีอยู่ไปต่อยอดเชิงธุรกิจนั้น การตรวจสอบและจัดการข้อมูลเหล่านั้นให้พร้อมต่อการนำไปใช้งานจึงถือเป็นขั้นตอนสำคัญที่ทุกองค์กรไม่อาจละเลยได้ ไม่ว่าข้อมูลเหล่านั้นจะมีจำนวนเท่าใดก็ตาม

 

Solution: สร้างฐานข้อมูลกลางและขจัดความซ้ำซ้อนของข้อมูล ด้วยการทำ Data Cleansing

mfec_002

จากประสบการณ์ในการให้คำปรึกษาและแก้ไขปัญหาให้แก่ลูกค้าองค์กรทุกระดับ ทำให้ MFEC มีความเชี่ยวชาญในการจัดการข้อมูลของลูกค้าเป็นพิเศษ และได้พัฒนาโซลูชั่นการทำความสะอาดข้อมูลหรือ Data Cleansing สำหรับใช้งานกับข้อมูลภาษาไทยโดยเฉพาะ พร้อมทั้งยังสามารถปรับแต่งการทำงานของระบบทำความสะอาดข้อมูลนี้ให้เข้ากับ Workflow การทำงานขององค์กรได้อีกด้วย

ระบบทำความสะอาดข้อมูลที่ MFEC พัฒนาต่อยอดจาก IBM InfoSphere QualityStage นี้จึงกลายเป็นคำตอบสำหรับหลายๆ องค์กรที่ต้องการนำข้อมูลมาใช้งานต่อยอดได้อย่างสมบูรณ์ ซึ่งรองรับทั้งกรณีการจัดการข้อมูลจากฐานข้อมูลเดียว และการจัดการข้อมูลจากหลายๆ ฐานข้อมูลร่วมกัน โดยมีขั้นตอนการทำงานดังต่อไปนี้

mfec_001

1. การศึกษาข้อมูล (Data Profiling)

ขั้นตอนแรกสุดคือการศึกษาข้อมูลที่มีอยู่เดิม เพื่อดูว่าองค์กรมีการจัดเก็บข้อมูลอะไรในรูปแบบไหน และมีวัตถุประสงค์จะนำข้อมูลแต่ละส่วนไปใช้ต่อยอดทำอะไรบ้าง เพื่อให้การจัดการข้อมูลสามารถตอบโจทย์ข้อมูลที่มีอยู่ และความผิดปกติที่เกิดขึ้นภายในข้อมูลที่องค์กรจัดเก็บอยู่ได้

2. การกำหนดมาตรฐานข้อมูล (Data Standardization)

ขั้นตอนถัดมาคือการกำหนดกฎในการจัดเก็บข้อมูลต่างๆ ของ Master Data ว่าแต่ละ Field ของข้อมูลจะมีการจัดเก็บข้อมูลอะไรในรูปแบบไหน เพื่อให้ Master Data ที่จะสร้างขึ้นมานั้นมีความเป็นมาตรฐาน และถูกต้องเพียงพอต่อการนำไปใช้งานจริง ซึ่งทางทีมงาน MFEC เองก็มีการพัฒนา Dictionary ภาษาไทยโดยเฉพาะเข้ามาใช้เสริมความเป็นมาตรฐานให้กับ Field ต่างๆ สำหรับให้นำไปใช้งานได้ทันทีเพิ่มเติม เช่น คำนำหน้า, ที่อยู่ เป็นต้น

3. การผูกข้อมูล (Data Matching)

หลังจากที่กำหนดมาตรฐานข้อมูลเสร็จแล้ว ข้อมูลจากฐานข้อมูลทั้งหมดก็จะถูกนำมาผูกเข้าด้วยกัน และรวมออกมาเป็นข้อมูลกลางสำหรับเตรียมนำไปใช้ต่อเป็น Master Data พร้อมทั้งมีการให้คะแนนความน่าเชื่อถือแก่ข้อมูลแต่ละบรรทัดตามผลลัพธ์ที่ได้จากการผูกข้อมูลเข้าด้วยกัน เพื่อนำไปใช้ประกอบการตัดสินใจการขั้นตอนการคัดเลือกข้อมูลต่อไปด้วย

4. การคัดเลือกข้อมูล (Data Survivorship)

ในขั้นตอนนี้จะเป็นขั้นตอนที่ทำงานผสมผสานกันระหว่างระบบอัตโนมัติและการใช้มนุษย์ตัดสินใจ โดยข้อมูลที่มีความน่าเชื่อถือสูงกว่าเกณฑ์ที่กำหนดหรือความน่าเชื่อถือเต็ม 100% นั้นก็จะสามารถนำไปใช้เป็น Master Data ได้ทันที ในขณะที่ข้อมูลที่มีความน่าเชื่อถือต่ำกว่าที่กำหนด หรือเป็นข้อมูลที่ไม่อาจนำมาผูกเข้าด้วยกันได้สำเร็จนั้นก็อาจต้องมีขั้นตอนให้เจ้าหน้าที่ที่เกี่ยวข้องมาทำการศึกษาและตัดสินใจเป็นกรณีๆ ไป

 

เมื่อผ่านกระบวนการเหล่านี้ไปจนหมดสิ้นแล้ว องค์กรก็จะมีชุดของ Master Data ที่รวบรวมข้อมูลที่สมบูรณ์พร้อมสำหรับนำไปใช้อ้างอิงในการต่อยอดทางธุรกิจได้อย่างถูกต้องแม่นยำ เป็นผลลัพธ์ของการทำความสะอาดข้อมูลหรือ Data Cleansing นั่นเอง

IBM InfoSphere QualityStage ได้เข้ามามีบทบาทในการทำความสะอาดข้อมูลนี้เป็นอย่างมาก ด้วยความสามารถในการจัดการตรวจสอบคุณภาพของข้อมูลได้แบบอัตโนมัติ ซึ่งช่วยลดเวลาที่ต้องใช้ในการพัฒนาระบบเหล่านี้ขึ้นมา รวมถึงช่วยลดภาระงานในการจัดการคุณภาพของข้อมูลลงเป็นอย่างมาก ซึ่งเมื่อประกอบกับการปรับแต่งให้ IBM InfoSphere QualityStage สามารถรองรับภาษาไทยได้โดย MFEC แล้ว การจัดการข้อมูลให้มีคุณภาพจึงกลายเป็นเรื่องที่ง่ายดายยิ่งกว่าเดิม

mfec_003

ในแง่ของการประมวลผล IBM Power Systems ได้เข้ามามีบทบาทในฐานะของ Server ประสิทธิภาพสูงสำหรับการตรวจสอบข้อมูลต่างๆ ในทุกขั้นตอน และ IBM Storage ก็ได้กลายเป็นทางเลือกหลักในการจัดเก็บข้อมูลทั้งหมดทั้งก่อนการทำความสะอาดข้อมูล และการจัดเก็บ Master Data โดยมี IBM AIX เป็นระบบปฏิบัติการหลักที่มีทั้งความทนทานและความปลอดภัยสูง เพื่อเก็บรักษาข้อมูลอันประเมินค่าไม่ได้ขององค์กรทั้งหมดนั่นเอง

นอกจากนี้ MFEC ยังได้ทำการพัฒนาซอฟต์แวร์ต่างๆ มาต่อยอดให้ตรงกับความต้องการและ Workflow ในการทำงานของแต่ละองค์กร ไม่ว่าจะเป็นการพัฒนาระบบ Manual Correction เพื่อใช้เสริมในขั้นตอนการทำ Data Survivorship เพื่อให้แต่ละองค์กรสามารถมีขั้นตอนและเจ้าหน้าที่ผู้รับผิดชอบในการตัดสินใจเลือกปรับแต่งข้อมูลขั้นสุดท้ายก่อนที่จะเป็น Master Data ได้หากข้อมูลมีความไม่ชัดเจนสูง หรือแม้แต่การพัฒนาระบบ Data Cleansing Report ให้องค์กรสามารถติดตามได้ว่าข้อมูลที่ต้องถูกจัดการยังมีอีกมากน้อยแค่ไหน

 

Result: ต่อยอดธุรกิจและนำเสนอสิ่งใหม่ๆ แก่ลูกค้า ด้วยฐานข้อมูลที่เชื่อถือได้

mfec_004

จากประสบการณ์การทำงานของ MFEC ในการทำความสะอาดข้อมูลมาเป็นระยะเวลาเกือบ 10 ปี ทำให้ MFEC สามารถนำเสนอความเป็นไปได้ในการทำความสะอาดข้อมูลแก่ลูกค้าองค์กรได้อย่างรวดเร็ว ส่งผลให้เหล่าลูกค้าองค์กรขนาดใหญ่ โดยเฉพาะธุรกิจธนาคารสามารถเดินหน้าต่อยอดธุรกิจไปสู่การทำ Digital Transformation เพื่อนำข้อมูลที่มีอยู่ในองค์กรที่หลากหลายมาใช้งานได้อย่างมีประสิทธิภาพสูงสุด และแก้ปัญหาดังต่อไปนี้ให้กับองค์กร

  1. ลดข้อมูลที่ซ้ำซ้อนขององค์กรลงไป และทำให้ข้อมูลต่างๆ มีความถูกต้องแม่นยำมากยิ่งขึ้น ทำให้สามารถช่วยประหยัดค่าใช้จ่ายในการทำการตลาดจากข้อมูลที่มีความซ้ำซ้อนลงไปได้เป็นมูลค่าหลายล้านบาทต่อปี
  2. ลดความยุ่งยากในการนำข้อมูลที่กระจายเป็น Silo ของแต่ละ Business Unit ลงไป ทำให้การประเมินตัวเลขเชิงสถิติต่างๆ และการวางแผนงบประมาณ หรือการวางกลยุทธ์ต่างๆ มีความถูกต้องแม่นยำมากยิ่งขึ้น
  3. ช่วยให้องค์กรพร้อมที่จะก้าวไปสู่การใช้งาน Big Data Analytics ได้รวดเร็วและง่ายดายยิ่งขึ้น ด้วยการเตรียมข้อมูลมีที่มีคุณภาพเพียงพอสำหรับการนำไปใช้วิเคราะห์และทำ Correlation ได้ดีขึ้น
  4. สร้างความเป็นไปได้ใหม่ๆ ในการทำการตลาดขององค์กร ด้วยการนำข้อมูลภายในองค์กรเข้าไปผูกกับข้อมูลจาก Social Media และทำความเข้าใจพฤติกรรมของลูกค้าได้ดียิ่งขึ้น
  5. การนำข้อมูลของลูกค้าไปใช้วิเคราะห์เพื่อให้เข้ากับการทำงานของแต่ละ Business Unit และเป็นไปตามข้อบังคับทางธุรกิจหรือกฎหมายต่างๆ สามารถทำได้อย่างแม่นยำมากยิ่งขึ้น โดยเฉพาะการทำตามข้อกำหนดทางการเงินของธนาคารต่างๆ ในการกู้หนี้ยืมสิน ทำให้การตรวจสอบต่างๆ เป็นไปได้อย่างรวดเร็วและมีความอัตโนมัติมากยิ่งขึ้น

ด้วยข้อดีทั้งหมดดังนี้ ทำให้ MFEC กลายเป็นทางเลือกหลักขององค์กรในการจัดการทำความสะอาดข้อมูล เพื่อเป็นก้าวแรกสู่การเปลี่ยนแปลงองค์กรให้เติบโตก้าวหน้ายิ่งขึ้นต่อไป

 

เกี่ยวกับ MFEC

mfec_logopremier-business-partner-logo_h90

บริษัท เอ็ม เอฟ อี ซี จำกัด (มหาชน) หรือ MFEC ก่อตั้งขึ้นเมื่อปีพ.ศ. 2540 เพื่อประกอบธุรกิจบริการให้คำปรึกษา พัฒนาและวางระบบคอมพิวเตอร์และเครือข่ายงานเทคโนโลยีสารสนเทศให้กับบริษัทวิสาหกิจทั้งขนาดกลางและขนาดใหญ่ โดยก้าวขึ้นมาเป็นกลุ่มผู้ประกอบธุรกิจให้บริการที่ปรึกษาและพัฒนาระบบเครือข่ายงานเทคโนโลยีสารสนเทศที่เติบโตอย่างรวดเร็วมากที่สุดในประเทศ และมีกลุ่มลูกค้าครอบคลุมในทุกอุตสาหกรรมทั่วประเทศไทย โดยมีวิสัยทัศน์ที่จะเป็น “ที่ปรึกษาและเพื่อนคู่คิด” ให้แก่ทุกองค์กรในประเทศไทยด้วยแนวคิด “ลูกค้าเสมือนหุ้นส่วน” ด้วยมาตรฐานบริการที่ได้รับการยอมรับทั่วโลก http://www.mfec.co.th/

 

สุดท้ายนี้ทางทีมงาน TechTalkThai ก็ต้องขอขอบคุณทีมงาน MFEC ที่ช่วยสละเวลามาให้สัมภาษณ์กับทางทีมงานนะครับ


About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

ชมย้อนหลัง งาน ISS & SAP User Conference 2019

เมื่อวันพฤหัสบดีที่ 17 ตุลาคมที่ผ่านมา ISS Consulting ได้จัดงาน ISS & SAP User Conference 2019 ขึ้นภายใต้ธีม “Innovation Now” …

Veeam กับเป้าหมายเบอร์ 1 ด้าน Cloud Data Management ในยุค Hybrid Cloud

เมื่อปริมาณข้อมูลเติบโตมากขึ้น และมีความต้องการในการใช้ข้อมูลมากขึ้น สิ่งที่เติบโตตามขึ้นมาคือความต้องการ Ecosystem ที่จะช่วยให้ธุรกิจสามารถมีระบบข้อมูลที่พร้อมใช้งานตลอดเวลา มีการจัดการกับข้อมูลได้อย่างมีประสิทธิภาพ และการรักษาความปลอดภัยที่ดี Veeam เป็นหนึ่งในธุรกิจที่อาสาเข้ามาตอบโจทย์ตรงนี้