Baidu เปิดตัว web application SwiftScribe แอปที่ใช้พลังจาก AI ช่วยให้สามารถถอดเสียงจากที่อัดไว้ได้อย่างรวดเร็วขึ้นกว่ามนุษย์ 1.67 เท่า
SwiftScribe ถอดเสียงจากไฟล์ .wav หรือ .mp3 ที่ผู้ใช้อัพโหลดขึ้นไปยังหน้าเว็บไซต์ http://swiftscribe.ai จากการทดลองสามารถถอดเสียงไฟล์ความยาว 30 วินาทีในเวลา 10 วินาที รองรับไฟล์ความยาวสูงสุดที่ 1 ชั่วโมงซึ่งจะใช้เวลาถอดเสียง 20 นาที ซึ่งถือว่ารวดเร็วแม้จะต้องมาแก้ไขข้อความให้เป็นประโยคด้วยการเติมตัวใหญ่และเครื่องหมายท้ายประโยคในภายหลัง
หนึ่งในทีมผู้พัฒนาเล่าถึงต้นกำเนิดแอปนี้ว่าได้แรงบันดาลใจมาจากประสบการณ์การถอดเสียงบทสัมภาษณ์เมื่อครั้งยังเรียนปริญญาโท ซึ่งใช้เวลากว่า 10 ชั่วโมงในการถอดเสียงไฟล์ความยาว 1 ชั่วโมงสำหรับผู้ที่ไม่ได้มีภาษาอังกฤษเป็นภาษาแม่ SwiftScribe จึงเป็นแอปที่จะเข้ามาช่วยคนเหล่านี้และนักถอดเสียงมืออาชีพให้ใช้เวลาสั้นลงในการถอดเสียง
SwiftScribe เป็นอีกหนึ่งแอปพลิเคชันจาก DeepSpeech ซอฟต์แวร์ Speech Recognition ของ Baidu ซึ่งก่อนหน้านี้ถูกนำไปพัฒนาเป็นคีย์บอร์ด TalkType บนแอนดรอยด์ที่เน้นการป้อนคำด้วยเสียงมากกว่าการพิมพ์ และในอนาคตจะมีการพัฒนาให้สามารถถอดเสียงจากวิดีโอ รองรับ format ไฟล์เพิ่ม และเพิ่มความสามารถในการใส่เครื่องหมายในประโยคโดยอัตโนมัติอีกด้วย
ที่มา: http://venturebeat.com/2017/03/13/baidu-launches-swiftscribe-an-app-that-transcribes-audio-with-ai/