Google Cloud อัปเดตความสามารถให้ Text-to-Speech ได้หลายภาษามากขึ้น

Google ได้ประกาศอัปเดตความสามารถให้ AI รองรับการทำ Text-to-Speech ได้หลายภาษามากขึ้น รวมถึงจำนวนของเสียงเพิ่มขึ้นด้วย

credit : Cloud.google.com

ความสามารถที่ Google ได้ประกาศอัปเดตให้ Text-to-Speech มีดังนี้

  • เพิ่มภาษาใหม่ 7 ภาษาคือ Danish, Portuguese/Portugal, Russian, Polish, Slovakian, Ukrainian และ Norwegian Bokmål นั่นทำให้เทคโนโลยีดังกล่าวสามารถรองรับการทำงานได้ถึง 21 ภาษาแล้ว
  • เพิ่มจำนวนเสียงมาตรฐานถึง 21 เสียงและ WaveNet 31 เสียง (คือการใช้ Deep Neural Network ไปเรียนรู้เสียงต่างๆ มาเพื่อสร้างเสียงที่เป็น Natural มากขึ้นกว่าเสียงมาตรฐาน) โดยเทคโนโลยีนี้ถูกคิดค้นจาก DeepMind นั่นเอง ทำให้ตอนนี้มีจำนวนเสียงถึง 106 เสียง
  • เปิดให้ฟีเจอร์ Device Profile หรือความสามารถให้ผู้ใช้ปรับแต่งการเล่นเสียงกับฮาร์ดแวร์ต่างๆ กันเป็นสถานะพร้อมใช้งาน

ในฝั่งของเทคโนโลยี Speech-to-Text ก็มีการเพิ่มความสามารถด้วยเช่นกัน เช่น ปรับให้ Premium model for Video and Enhancement phone เข้าสู่สถานะพร้อมใช้งาน(เทคโนโลยีคล้ายกับที่ใช้แสดงซับในยูทูป) ซึ่งมีความแม่นยำมากขึ้น รวมถึงประกาศความสามารถในการแยกแยะเสียงผู้พูดหลายคน (multi-channel recognition) เข้าสู่สถานะพร้อมใช้งานเช่นกัน

ที่มา : https://www.zdnet.com/article/google-cloud-updates-ai-powered-speech-tools-for-enterprises/

About nattakon

จบการศึกษา ปริญญาตรีและโท สาขาวิศวกรรมคอมพิวเตอร์ KMITL เคยทำงานด้าน Engineer/Presale ดูแลผลิตภัณฑ์ด้าน Network Security และ Public Cloud ในประเทศ ปัจจุบันเป็นนักเขียน Full-time ที่ TechTalkThai

Check Also

[Video] ERP for Manufacturing 2026 webinar series” โดย ProSoft และ Infor

บรรยายโดย คุณปราโมทย์ สุขศรี – Solution Consultant, Sr. Manager จาก Infor ในงานสัมมนาออนไลน์ หัวข้อ “ERP for Manufacturing …

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce