Google เปิดบริการ Cloud Text-to-Speech โดยใช้เทคโนโลยี DeepMind WaveNet

Google Cloud Platform (GCP) ได้ออกมาประกาศเปิดตัวบริการ Cloud Text-to-Speech โดยใช้เทคโนโลยีจาก DeepMind WaveNet เพื่อให้เสียงพูดนั้นเป็นธรรมชาติมากขึ้น

 

Credit: Google

 

บริการ Cloud Text-to-Speech นี้จะทำให้เหล่านักพัฒนาเพิ่มความสามารถให้ Application ของตนอธิบายข้อมูลหรือเนื้อหาต่างๆ ทางเสียงได้เหมือนกับที่ Google Assistant, Google Map หรือ Google Search ทำได้ ซึ่ง Google ก็ได้ออกมาแนะนำกรณีการใช้งานที่น่าสนใจเช่น

  • ระบบตอบสนองทางเสียงสำหรับ Call Center (IVR) ที่สามารถโต้ตอบบทสนทนาได้อย่างเป็นธรรมชาติแบบ Real-time
  • เพิ่มความสามารถให้อุปกรณ์ IoT สามารถโต้ตอบกลับมาด้วยเสียงได้
  • เปลี่ยนสื่อที่เป็นเนื้อหาตัวอักษรให้กลายเป็นเสียง สร้างเป็น Podcast หรือ Audio Book ได้

ทั้งนี้เทคโนโลยีของ DeepMind WaveNet ที่นำมาผสานในบริการนี้ด้วย คือระบบ Neural Network ที่ทำการ Train ด้วยข้อมูลเสียงพูดจำนวนมากมาตั้งแต่ช่วงปลายปี 2016 เพื่อทำความเข้าใจโครงสร้างธรรมชาติของการออกเสียงในบทสนทนา ให้มีจังหวะจะโคนที่สมจริง อีกทั้งยังได้นำ Google TPU เข้ามาช่วยประมวลผลให้สามารถสร้างเสียงพูดแบบเป็นธรรมชาติได้เร็วขึ้นกว่าเดิมถึง 1,000 เท่า สร้างเสียงพูดความยาว 1 วินาทีได้โดยใช้เวลาเพียง 50 Millisecond และ Resolution ของเสียงก็มากถึง 16-bit ทำให้มีความสมจริงเป็นอย่างมาก

ปัจจุบันบริการ Cloud Text-to-Speech นี้ยังอยู่ในสถานะ Beta อยู่ โดยรองรับ 32 เสียงจาก 12 ภาษา ผู้ที่สนใจสามารถเข้าไปศึกษาเพิ่มเติมและทดสอบได้ที่ https://cloud.google.com/text-to-speech/ รวมถึงสามารถตรวจสอบแผนราคาได้ที่ https://cloud.google.com/text-to-speech/pricing ครับ

 

ที่มา: https://cloudplatform.googleblog.com/2018/03/introducing-Cloud-Text-to-Speech-powered-by-Deepmind-WaveNet-technology.html

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce

Cisco ออกแพตช์แก้ช่องโหว่ Zero-day บน Catalyst SD-WAN Manager ที่ถูกใช้โจมตียกระดับสิทธิ์เป็น root

Cisco ปล่อยอัปเดตด้านความปลอดภัยแก้ช่องโหว่บน Catalyst SD-WAN Manager (เดิมคือ SD-WAN vManage) หลังพบว่าถูกใช้โจมตีจริงในลักษณะ Zero-day เพื่อยกระดับสิทธิ์เป็น root บนระบบที่ได้รับผลกระทบ