Baidu เปิดตัว SwiftScribe แอปถอดเสียงด้วย AI

Baidu เปิดตัว web application SwiftScribe แอปที่ใช้พลังจาก AI ช่วยให้สามารถถอดเสียงจากที่อัดไว้ได้อย่างรวดเร็วขึ้นกว่ามนุษย์ 1.67 เท่า

SwiftScribe ถอดเสียงจากไฟล์ .wav หรือ .mp3 ที่ผู้ใช้อัพโหลดขึ้นไปยังหน้าเว็บไซต์ http://swiftscribe.ai จากการทดลองสามารถถอดเสียงไฟล์ความยาว 30 วินาทีในเวลา 10 วินาที รองรับไฟล์ความยาวสูงสุดที่ 1 ชั่วโมงซึ่งจะใช้เวลาถอดเสียง 20 นาที ซึ่งถือว่ารวดเร็วแม้จะต้องมาแก้ไขข้อความให้เป็นประโยคด้วยการเติมตัวใหญ่และเครื่องหมายท้ายประโยคในภายหลัง

หนึ่งในทีมผู้พัฒนาเล่าถึงต้นกำเนิดแอปนี้ว่าได้แรงบันดาลใจมาจากประสบการณ์การถอดเสียงบทสัมภาษณ์เมื่อครั้งยังเรียนปริญญาโท ซึ่งใช้เวลากว่า 10 ชั่วโมงในการถอดเสียงไฟล์ความยาว 1 ชั่วโมงสำหรับผู้ที่ไม่ได้มีภาษาอังกฤษเป็นภาษาแม่ SwiftScribe จึงเป็นแอปที่จะเข้ามาช่วยคนเหล่านี้และนักถอดเสียงมืออาชีพให้ใช้เวลาสั้นลงในการถอดเสียง

SwiftScribe เป็นอีกหนึ่งแอปพลิเคชันจาก DeepSpeech ซอฟต์แวร์ Speech Recognition ของ Baidu ซึ่งก่อนหน้านี้ถูกนำไปพัฒนาเป็นคีย์บอร์ด TalkType บนแอนดรอยด์ที่เน้นการป้อนคำด้วยเสียงมากกว่าการพิมพ์ และในอนาคตจะมีการพัฒนาให้สามารถถอดเสียงจากวิดีโอ รองรับ format ไฟล์เพิ่ม และเพิ่มความสามารถในการใส่เครื่องหมายในประโยคโดยอัตโนมัติอีกด้วย

 

ที่มา: http://venturebeat.com/2017/03/13/baidu-launches-swiftscribe-an-app-that-transcribes-audio-with-ai/

Check Also

VMware เปิดตัว VCF 9.1 ยกระดับ Private Cloud เพิ่มความคุ้มค่าและความปลอดภัย ตอบโจทย์ยุค AI

VMware ได้ประกาศเปิดตัว VMware Cloud Foundation หรือ VCF 9.1 อย่างเป็นทางการ หวังยกระดับ Private Cloud ให้เป็นแพลตฟอร์มที่บริหารจัดการได้ง่าย คุ้มค่าต่อการลงทุน และมาพร้อมกับระบบรักษาความปลอดภัยที่แข็งแกร่งตั้งแต่ระดับโครงสร้างพื้นฐาน …

Blitzy ระดมทุน 200 ล้านดอลลาร์ที่มูลค่า 1.4 พันล้านดอลลาร์ ช่วยองค์กรดีพลอยเอเจนต์เขียนโค้ดหลายพันตัวพร้อมกัน

Blitzy สตาร์ทอัพพัฒนาซอฟต์แวร์อัตโนมัติกล่าวว่า บริษัทได้ระดมทุนรอบใหม่มูลค่า 200 ล้านดอลลาร์ด้วยมูลค่ากิจการ 1.4 พันล้านดอลลาร์เพื่อขยายแพลตฟอร์มการเขียนโค้ดสำหรับองค์กร