Mostly AI บริษัทผู้เชี่ยวชาญด้านการสร้างข้อมูลเทียมได้เปิดตัวฟีเจอร์ใหม่ชื่อ Synthetic Text เพื่อช่วยธุรกิจแก้ปัญหาการขาดแคลนข้อมูลและปัญหาความเป็นส่วนตัวในการเทรน AI ด้วยการนำข้อมูลที่มีอยู่แล้วภายในองค์กรมาสร้างข้อมูลเทียมขึ้นมาใหม่โดยปราศจากข้อมูลส่วนบุคคลที่ใช้ระบุตัวตนได้ (PII) และข้อจำกัดในด้านความหลากหลาย ส่งผลให้องค์กรสามารถพัฒนานวัตกรรมได้รวดเร็วขึ้นและตัดสินใจได้ดึขึ้นโดยไม่ต้องพึ่งพาเพียงแหล่งข้อมูลสาธารณะอีกต่อไป

ข้อมูลเทียมได้กลายเป็นทางเลือกที่มีคุณค่าสำหรับองค์กรที่เผชิญกับปัญหาเมื่อข้อมูลจริงมีความขาดแคลน ราคาแพง มีความลำเอียง หรือไม่สามารถใช้งานได้ แม้ว่าองค์กรต่างๆ ได้มีการใช้งานข้อมูลเทียมประเภทรูปภาพมาเป็นระยะเวลาหนึ่งแล้ว แต่ความก้าวหน้าของ Gen AI กำลังส่งผลให้การใช้งานครอบคลุมไปยังประเภทข้อมูลที่หลากหลายมากยิ่งขึ้น โดย Gartner คาดการณ์ว่าภายในปี 2026 บริษัทจำนวนมากถึง 75% จะใช้ Gen AI เพื่อสร้างข้อมูลเทียม ซึ่งเพิ่มขึ้นอย่างมากจากไม่ถึง 5% ในปี 2023
อย่างไรก็ตาม ข้อมูลเทียมมักจะยังขาดบริบทและข้อมูลเชิงลึกเฉพาะของแต่ละองค์กร ทำให้โมเดลปลายน้ำเรียนรู้และประสบความสำเร็จได้ไม่เท่าที่คาดหวัง ในขณะเดียวกันชุดข้อมูลข้อความเฉพาะภายในแต่ละองค์กร เช่น อีเมล การสนทนากับแชทบอท และข้อความที่ถอดเสียงจากการให้บริการลูกค้า แม้จะถูกรวบรวมในปริมาณมาก แต่ก็มีปัญหาในการใช้งาน เนื่องจากมักจะมี PII และข้อจำกัดด้านความหลากหลายรวมอยู่ด้วย
Mostly AI จึงเข้ามาตอบโจทย์เหล่านี้ด้วยแพลตฟอร์มที่ช่วยให้ธุรกิจนำข้อมูลรูปแบบข้อความภายในองค์กรมาใช้เทรน AI ของตัวเองที่สามารถตรวจจับรายละเอียดและข้อมูลเชิงลึกเพื่อนำมาสร้างข้อมูลเทียมที่ปราศจาก PII หรือข้อจำกัดด้านความหลากหลายที่มีอยู่ในชุดข้อมูลตั้งต้นได้แบบเรียลไทม์ นอกจากนี้ ผู้ใช้ยังมีตัวเลือกโมเดลภาษาที่หลากหลาย เช่น Mistral-7B และ Viking-7B อีกด้วย
ที่มา: https://venturebeat.com/data-infrastructure/mostly-ais-synthetic-text-tool-can-unlock-enterprise-emails-and-conversations-for-ai-training/