Google ใช้ AI ช่วยในการแบ่งแยกเสียงจากฝูงชน

นักวิจัยจาก Google ได้ใช้เทคโนโลยี Deep learning เพื่อแยกเสียงจากข้อมูล Audio ที่ถูกบันทึกในสภาพแวดล้อมที่มีมวลชนจำนวนมาก โดยระบบที่พัฒนาขึ้นเทียบเคียงได้กับความสามารถของสมอง หรือ ‘Cocktail party’ ที่แยกแยะและโฟกัสไปยังเสียงที่สนใจ 1 หรือมากกว่าในฝูงชนได้

credit: Bleepingcomputer

ระบบถูกออกแบบมาให้ทำงานกับข้อมูล Audio และวีดีโอพร้อมๆ กัน โดยอาศัยข้อมูลจากวีดีโอคุณภาพสูงของการพูดหรือการเรียนบน Youtube จำนวนกว่า 1 แสนวีดีโอ ทุกการพูดเกิดจากผู้พูดเพียงคนเดียวซึ่งทีมงานได้เทรนให้ AI จดจำเสียงตามการขยับริมฝีปากหรือปาก หลังจากนั้นนักวิจัยได้ขยายการทดลองโดยมีผู้พูดหลายคนและไม่มีพื้นฐานเกี่ยวกับเสียงนั้นมาก่อนเพื่อจำลองเหตุการณ์คล้ายกับความสามารถของสมอง ผลลัพธ์คือระบบสามารถแยกแยะเสียงที่มีผู้พูดหลายคนได้ อย่างไรก็ตามข้อจำกัดคือต้องปรากฏหน้าผู้พูดบนหน้าจอด้วยเพื่อให้ AI ทำงานเชื่อมโยงเสียงกับผู้พูดและจัดลำดับสิ่งที่ได้ยินได้

Google มีแผนที่จะนำเทคโนโลยีนี้ไปใช้กับผลิตภัณฑ์ของตน เช่น Assistant/Smart Speaker หรือการแสดงบทพูดแบบทันทีบน Google Glasses สำหรับผู้พิการหูหนวก หรือ การระบบแสดงบทพูดบน Youtube และ การแสดงบทพูดในซอฟต์แวร์จัดประชุมผ่านวีดีโอ นอกจากนี้ในสถานการณ์ของกล้องวงจรปิดที่บันทึกไว้ก็สามารถประยุกต์ใช้เพื่อช่วยเจ้าหน้าที่แยกแยะเสียงของบุคคลที่สนใจออกจากการรบกวนต่างๆ

ผู้สนใจสามารถติดตามเพิ่มเติมได้ที่  “Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech Separation.” หรือชมวีดีโอตามด้านล่าง

ที่มา : https://www.bleepingcomputer.com/news/technology/google-develops-ai-that-can-separate-voices-in-a-crowd/



About nattakon

จบการศึกษา ปริญญาตรีและโท สาขาวิศวกรรมคอมพิวเตอร์ KMITL เคยทำงานด้าน Engineer/Presale ดูแลผลิตภัณฑ์ด้าน Network Security และ Public Cloud ในประเทศ ปัจจุบันเป็นนักเขียน Full-time ที่ TechTalkThai

Check Also

เตือนมัลแวร์ Roaming Mantis เริ่มพุ่งเป้า Apple iOS และ PC ทั่วโลก

หลังจากที่ Roaming Mantis ซึ่งเป็นมัลแวร์ DNS Hijacking เริ่มแพร่ระบาดเมื่อปลายเดือนเมษายนที่ผ่านมา โดยพุ่งเป้าอุปกรณ์ Android ในเขตภูมิภาคเอเชียตะวันออกเฉียงใต้ ล่าสุดพบว่าแฮ็กเกอร์เบื้องหลังมัลแวร์ได้ทำการอัปเกรดให้สามารถโจมตีอุปกรณ์ Apple iOS และ Desktop …

M.Tech กลับมาขาย Citrix อีกครั้ง เตรียมดัน NetScaler ตอบโจทย์ Multi-Cloud สำหรับองค์กร

เมื่อต้นปี 2018 ที่ผ่านมา ทาง M.Tech และ Citrix ได้ประกาศความเป็นพันธมิตรร่วมกันอีกครั้งหนึ่ง ให้ M.Tech ได้กลับมาเป็น Distributor ให้กับ Citrix และผลักดันตลาดของ …