Amazon เปิดบริการสร้างเสียงพูดจากข้อความให้ใช้งานได้ผ่าน Cloud ภายใต้บริการ Amazon Polly ที่มีเสียงของผู้หญิงและผู้ชายให้เลิอกใช้มากถึง 47 เสียง และรองรับการใช้งานได้มากถึง 24 ภาษาด้วยกัน
การสร้างเสียงจากข้อความนี้รองรับทั้งข้อความที่เป็น Plaintext และข้อความที่เป็น Speech Synthesis Markup Language เพื่อให้ Amazon Polly สามารถออกสำเนียงในบางคำได้ถูกต้องยิ่งขึ้น เช่น ในกรณีที่มีการใช้บางคำจากภาษาอื่นๆ ในประโยค อย่างการใช้ภาษาอังกฤษผสมกับภาษาฝรั่งเศส เป็นต้น
นอกจากการป้อนคำหรือประโยคเข้าไปผ่านทางหน้า Console เพื่อสร้างเสียงใหม่ๆ ขึ้นมาแล้ว Amazon Polly ยังรองรับการเรียกใช้งานได้ผ่านทา API เพื่อให้ Amazon Polly สร้างเสียงสำหรับประโยคต่างๆ ได้อย่างยืดหยุ่น รวมถึงสามารถเลือกคุณภาพเสียงได้หลากหลายระดับ ไม่ว่าจะเป็น High Quality ที่ 22 kHz Sampling Rate ใน MP3 หรือ Vorbis และ Telephony-quality (8 kHz) ใน PCM รวมถึงยังสร้างไฟล์สำหรับ Playback เป็น MP3 หรือ Ogg ก็ได้ด้วยเช่นกัน
เสียงที่สร้างขึันจาก Amazon Polly นี้สามารถนำไปใช้ได้ทั้งในการ Integrate เข้ากับ Application หรือ Website เพื่อให้โต้ตอบกับผู้ใช้งานได้ด้วยเสียงแบบ Real-time Interactive และสามารถเซฟออกไปเป็น .mp3 เพื่อนำไปใช้งานแบบ Offline ได้อีกด้วย
ข้อมูลเสียงของ Amazon Polly นี้จะถูกเข้ารหัสและส่งผ่าน SSL Connection รวมถึงจะมีการเก็บเสียงแบบเข้ารหัสเอาไว้ 6 เดือน
ปัจจุบัน Amazon Polly นี้ยังไม่รองรับภาษาไทย แต่ Amazon เองก็มีแผนที่จะรองรับภาษาอื่นๆ เพิ่มเติมขึ้นไปอีกในอนาคตด้วยเช่นกัน ก็ต้องติดตามกันต่อไป
บริการ Amazon Polly นี้เปิดให้ใช้งานฟรีสำหรับการประมวลผล 5 ล้านตัวอักษรในแต่ละเดือน และหากเกินจากนั้นจะมีค่าใช้จ่ายอยู่ที่ 0.000004 เหรียญสำหรับแต่ละตัวอักษร หรือคิดคร่าวๆ คือ 0.004 เหรียญสำหรับการสร้างประโยคพูดความยาว 1 นาที
ผู้ที่สนใจสามารถศึกษารายละเอียดเพิ่มเติมได้ที่ http://aws.amazon.com/polly ทันที
ที่มา: https://aws.amazon.com/blogs/aws/polly-text-to-speech-in-47-voices-and-24-languages/