Baidu เปิดตัว SwiftScribe แอปถอดเสียงด้วย AI

Baidu เปิดตัว web application SwiftScribe แอปที่ใช้พลังจาก AI ช่วยให้สามารถถอดเสียงจากที่อัดไว้ได้อย่างรวดเร็วขึ้นกว่ามนุษย์ 1.67 เท่า

SwiftScribe ถอดเสียงจากไฟล์ .wav หรือ .mp3 ที่ผู้ใช้อัพโหลดขึ้นไปยังหน้าเว็บไซต์ http://swiftscribe.ai จากการทดลองสามารถถอดเสียงไฟล์ความยาว 30 วินาทีในเวลา 10 วินาที รองรับไฟล์ความยาวสูงสุดที่ 1 ชั่วโมงซึ่งจะใช้เวลาถอดเสียง 20 นาที ซึ่งถือว่ารวดเร็วแม้จะต้องมาแก้ไขข้อความให้เป็นประโยคด้วยการเติมตัวใหญ่และเครื่องหมายท้ายประโยคในภายหลัง

หนึ่งในทีมผู้พัฒนาเล่าถึงต้นกำเนิดแอปนี้ว่าได้แรงบันดาลใจมาจากประสบการณ์การถอดเสียงบทสัมภาษณ์เมื่อครั้งยังเรียนปริญญาโท ซึ่งใช้เวลากว่า 10 ชั่วโมงในการถอดเสียงไฟล์ความยาว 1 ชั่วโมงสำหรับผู้ที่ไม่ได้มีภาษาอังกฤษเป็นภาษาแม่ SwiftScribe จึงเป็นแอปที่จะเข้ามาช่วยคนเหล่านี้และนักถอดเสียงมืออาชีพให้ใช้เวลาสั้นลงในการถอดเสียง

SwiftScribe เป็นอีกหนึ่งแอปพลิเคชันจาก DeepSpeech ซอฟต์แวร์ Speech Recognition ของ Baidu ซึ่งก่อนหน้านี้ถูกนำไปพัฒนาเป็นคีย์บอร์ด TalkType บนแอนดรอยด์ที่เน้นการป้อนคำด้วยเสียงมากกว่าการพิมพ์ และในอนาคตจะมีการพัฒนาให้สามารถถอดเสียงจากวิดีโอ รองรับ format ไฟล์เพิ่ม และเพิ่มความสามารถในการใส่เครื่องหมายในประโยคโดยอัตโนมัติอีกด้วย

 

ที่มา: http://venturebeat.com/2017/03/13/baidu-launches-swiftscribe-an-app-that-transcribes-audio-with-ai/

Check Also

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce

Ericsson เปิดตัวโซลูชัน AI in RAN ยกระดับ 5G ไปอีกขั้นด้วยโครงข่ายที่ฝัง AI อยู่ภายใน

Ericsson เปิดตัว AI in RAN ซอฟต์แวร์แบบ Subscription ล่าสุดที่ฝัง AI ลงในแพลตฟอร์ม Radio Access Network (RAN) โดยตรง …