Amazon เปิดตัว Polly บริการ Text to Speech ที่รองรับ 47 เสียงและ 24 ภาษาให้ใช้งานได้บน Cloud

December 1, 2016 Applications, AWS, Cloud and Systems, Cloud Services, Products

Amazon เปิดบริการสร้างเสียงพูดจากข้อความให้ใช้งานได้ผ่าน Cloud ภายใต้บริการ Amazon Polly ที่มีเสียงของผู้หญิงและผู้ชายให้เลิอกใช้มากถึง 47 เสียง และรองรับการใช้งานได้มากถึง 24 ภาษาด้วยกัน

การสร้างเสียงจากข้อความนี้รองรับทั้งข้อความที่เป็น Plaintext และข้อความที่เป็น Speech Synthesis Markup Language เพื่อให้ Amazon Polly สามารถออกสำเนียงในบางคำได้ถูกต้องยิ่งขึ้น เช่น ในกรณีที่มีการใช้บางคำจากภาษาอื่นๆ ในประโยค อย่างการใช้ภาษาอังกฤษผสมกับภาษาฝรั่งเศส เป็นต้น

นอกจากการป้อนคำหรือประโยคเข้าไปผ่านทางหน้า Console เพื่อสร้างเสียงใหม่ๆ ขึ้นมาแล้ว Amazon Polly ยังรองรับการเรียกใช้งานได้ผ่านทา API เพื่อให้ Amazon Polly สร้างเสียงสำหรับประโยคต่างๆ ได้อย่างยืดหยุ่น รวมถึงสามารถเลือกคุณภาพเสียงได้หลากหลายระดับ ไม่ว่าจะเป็น High Quality ที่ 22 kHz Sampling Rate ใน MP3 หรือ Vorbis และ Telephony-quality (8 kHz) ใน PCM รวมถึงยังสร้างไฟล์สำหรับ Playback เป็น MP3 หรือ Ogg ก็ได้ด้วยเช่นกัน

เสียงที่สร้างขึันจาก Amazon Polly นี้สามารถนำไปใช้ได้ทั้งในการ Integrate เข้ากับ Application หรือ Website เพื่อให้โต้ตอบกับผู้ใช้งานได้ด้วยเสียงแบบ Real-time Interactive และสามารถเซฟออกไปเป็น .mp3 เพื่อนำไปใช้งานแบบ Offline ได้อีกด้วย

ข้อมูลเสียงของ Amazon Polly นี้จะถูกเข้ารหัสและส่งผ่าน SSL Connection รวมถึงจะมีการเก็บเสียงแบบเข้ารหัสเอาไว้ 6 เดือน

ปัจจุบัน Amazon Polly นี้ยังไม่รองรับภาษาไทย แต่ Amazon เองก็มีแผนที่จะรองรับภาษาอื่นๆ เพิ่มเติมขึ้นไปอีกในอนาคตด้วยเช่นกัน ก็ต้องติดตามกันต่อไป

บริการ Amazon Polly นี้เปิดให้ใช้งานฟรีสำหรับการประมวลผล 5 ล้านตัวอักษรในแต่ละเดือน และหากเกินจากนั้นจะมีค่าใช้จ่ายอยู่ที่ 0.000004 เหรียญสำหรับแต่ละตัวอักษร หรือคิดคร่าวๆ คือ 0.004 เหรียญสำหรับการสร้างประโยคพูดความยาว 1 นาที

ผู้ที่สนใจสามารถศึกษารายละเอียดเพิ่มเติมได้ที่ http://aws.amazon.com/polly ทันที

ที่มา: https://aws.amazon.com/blogs/aws/polly-text-to-speech-in-47-voices-and-24-languages/

Anthropic เปิดตัว Claude Opus 5 ชูความฉลาดใกล้ระดับ Fable 5 ในราคาครึ่งเดียว

Anthropic เปิดตัว Claude Opus 5 โมเดล AI ที่ให้ความสามารถใกล้เคียงระดับ frontier ของ Claude Fable 5 ในราคาครึ่งเดียว โดยยังคิดค่าบริการเท่ากับ …

Dell Pro Precision x Dell Pro AI Studio: จุดเริ่มต้น AI ที่ใช่สำหรับทุกองค์กร [Guest Post]

ในยุคที่ AI กลายเป็นหัวใจของการขับเคลื่อนธุรกิจ องค์กรทุกขนาดต่างมองหา “จุดเริ่มต้น” ที่แข็งแรงพอจะรองรับงานตั้งแต่การออกแบบ วิเคราะห์ข้อมูล ไปจนถึงการพัฒนาโมเดล AI ของตัวเอง Dell Pro Precision คือคำตอบ workstations …

TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย

Amazon เปิดตัว Polly บริการ Text to Speech ที่รองรับ 47 เสียงและ 24 ภาษาให้ใช้งานได้บน Cloud

About techtalkthai

Related Articles

Check Also

Anthropic เปิดตัว Claude Opus 5 ชูความฉลาดใกล้ระดับ Fable 5 ในราคาครึ่งเดียว

Dell Pro Precision x Dell Pro AI Studio: จุดเริ่มต้น AI ที่ใช่สำหรับทุกองค์กร [Guest Post]

Amazon เปิดตัว Polly บริการ Text to Speech ที่รองรับ 47 เสียงและ 24 ภาษาให้ใช้งานได้บน Cloud

Share this:

About techtalkthai

Related Articles

Check Also