Breaking News

Google Cloud อัปเดตความสามารถให้ Text-to-Speech ได้หลายภาษามากขึ้น

Google ได้ประกาศอัปเดตความสามารถให้ AI รองรับการทำ Text-to-Speech ได้หลายภาษามากขึ้น รวมถึงจำนวนของเสียงเพิ่มขึ้นด้วย

credit : Cloud.google.com

ความสามารถที่ Google ได้ประกาศอัปเดตให้ Text-to-Speech มีดังนี้

  • เพิ่มภาษาใหม่ 7 ภาษาคือ Danish, Portuguese/Portugal, Russian, Polish, Slovakian, Ukrainian และ Norwegian Bokmål นั่นทำให้เทคโนโลยีดังกล่าวสามารถรองรับการทำงานได้ถึง 21 ภาษาแล้ว
  • เพิ่มจำนวนเสียงมาตรฐานถึง 21 เสียงและ WaveNet 31 เสียง (คือการใช้ Deep Neural Network ไปเรียนรู้เสียงต่างๆ มาเพื่อสร้างเสียงที่เป็น Natural มากขึ้นกว่าเสียงมาตรฐาน) โดยเทคโนโลยีนี้ถูกคิดค้นจาก DeepMind นั่นเอง ทำให้ตอนนี้มีจำนวนเสียงถึง 106 เสียง
  • เปิดให้ฟีเจอร์ Device Profile หรือความสามารถให้ผู้ใช้ปรับแต่งการเล่นเสียงกับฮาร์ดแวร์ต่างๆ กันเป็นสถานะพร้อมใช้งาน

ในฝั่งของเทคโนโลยี Speech-to-Text ก็มีการเพิ่มความสามารถด้วยเช่นกัน เช่น ปรับให้ Premium model for Video and Enhancement phone เข้าสู่สถานะพร้อมใช้งาน(เทคโนโลยีคล้ายกับที่ใช้แสดงซับในยูทูป) ซึ่งมีความแม่นยำมากขึ้น รวมถึงประกาศความสามารถในการแยกแยะเสียงผู้พูดหลายคน (multi-channel recognition) เข้าสู่สถานะพร้อมใช้งานเช่นกัน

ที่มา : https://www.zdnet.com/article/google-cloud-updates-ai-powered-speech-tools-for-enterprises/



About nattakon

จบการศึกษา ปริญญาตรีและโท สาขาวิศวกรรมคอมพิวเตอร์ KMITL เคยทำงานด้าน Engineer/Presale ดูแลผลิตภัณฑ์ด้าน Network Security และ Public Cloud ในประเทศ ปัจจุบันเป็นนักเขียน Full-time ที่ TechTalkThai

Check Also

Dell’Oro Group เผย Huawei ครองตลาด Wi-Fi 6 เป็นอันดับ 1 ของโลก

Dell’Oro Group ผู้นำด้านการวิเคราะห์และวิจัยตลาดระดับโลก ออกรายงานข้อมูลส่วนแบ่งการตลาด Access Point แบบใช้งานภายในอาคารมาตรฐาน Wi-Fi 6 ทั่วโลกในช่วงระหว่างไตรมาสที่ 3 ของปี 2018 ถึงไตรมาสที่ 3 …

นักวิจัยพัฒนาเครื่องมือตรวจจับปัญหาที่เกิดจากการอัปเดตซอฟต์แวร์

ทีมนักวิจัยจากมหาวิทยาลัย Texas A&M ร่วมกับ Intel Labs พัฒนาเครื่องมือช่วยตรวจจับปัญหาความผิดพลาด ที่เกิดจากการอัปเดตซอฟต์แวร์ด้วยการใช้ Deep Learning