Google Cloud Speech API ประกาศรองรับเพิ่มอีก 30 ภาษา พร้อมเสริมฟีเจอร์ใหม่
Cloud Speech API เปิดตัวครั้งแรกในปี 2016 ช่วยให้นักพัฒนาสามารถใช้งาน Speech Recognition ในแอพพลิเคชันที่พัฒนาได้อย่างง่ายดาย ถูกนำไปประยุกต์ใช้งานหลายรูปแบบ เช่น ระบบ Voice-activated Command, Call Center Routing และ Speech Analytics โดยล่าสุด Google ได้ประกาศรองรับเพิ่มอีก 30 ภาษา พร้อมเพิ่มฟีเจอร์ใหม่ดังนี้
- รองรับภาษาใหม่เพิ่มเติมอีก 30 ภาษา จากก่อนหน้านี้ที่รองรับอยู่ 89 ภาษา เพื่อให้นักพัฒนาสามารถเข้าถึงประเทศอื่นๆได้มากขึ้น ผู้ที่สนใจสามารถดูรายละเอียดภาษาที่รองรับได้ที่ https://cloud.google.com/speech/docs/languages
- รองรับ Word-level timestamps โดยเป็นฟีเจอร์ที่มีการร้องขอเข้ามาเป็นจำนวนมาก ซึ่งทำให้ Cloud Speech API สามารถแปลเสียงพูดเป็นคำ พร้อมกับระบุเวลาที่ออกเสียงคำนั้นๆได้
- รองรับไฟล์เสียงแบบ Long-form ที่ยาวถึง 3 ชั่วโมง ก่อนหน้านี้ Cloud Speech API รองรับไฟล์ยาวแค่ 80 นาทีเท่านั้น
ปัจจุบัน Google Cloud Speech API เปิดให้ใช้ฟรีเดือนละ 60 นาที หากใช้งานมากกว่านั้น จะมีค่าใช้จ่ายอยู่ที่ 0.006 เหรียญต่อ 15 นาที ผู้ที่สนใจสามารถศึกษารายละเอียดเพิ่มเติมได้ที่ https://cloud.google.com/speech/