Baidu เปิดตัว SwiftScribe แอปถอดเสียงด้วย AI

Baidu เปิดตัว web application SwiftScribe แอปที่ใช้พลังจาก AI ช่วยให้สามารถถอดเสียงจากที่อัดไว้ได้อย่างรวดเร็วขึ้นกว่ามนุษย์ 1.67 เท่า

SwiftScribe ถอดเสียงจากไฟล์ .wav หรือ .mp3 ที่ผู้ใช้อัพโหลดขึ้นไปยังหน้าเว็บไซต์ http://swiftscribe.ai จากการทดลองสามารถถอดเสียงไฟล์ความยาว 30 วินาทีในเวลา 10 วินาที รองรับไฟล์ความยาวสูงสุดที่ 1 ชั่วโมงซึ่งจะใช้เวลาถอดเสียง 20 นาที ซึ่งถือว่ารวดเร็วแม้จะต้องมาแก้ไขข้อความให้เป็นประโยคด้วยการเติมตัวใหญ่และเครื่องหมายท้ายประโยคในภายหลัง

หนึ่งในทีมผู้พัฒนาเล่าถึงต้นกำเนิดแอปนี้ว่าได้แรงบันดาลใจมาจากประสบการณ์การถอดเสียงบทสัมภาษณ์เมื่อครั้งยังเรียนปริญญาโท ซึ่งใช้เวลากว่า 10 ชั่วโมงในการถอดเสียงไฟล์ความยาว 1 ชั่วโมงสำหรับผู้ที่ไม่ได้มีภาษาอังกฤษเป็นภาษาแม่ SwiftScribe จึงเป็นแอปที่จะเข้ามาช่วยคนเหล่านี้และนักถอดเสียงมืออาชีพให้ใช้เวลาสั้นลงในการถอดเสียง

SwiftScribe เป็นอีกหนึ่งแอปพลิเคชันจาก DeepSpeech ซอฟต์แวร์ Speech Recognition ของ Baidu ซึ่งก่อนหน้านี้ถูกนำไปพัฒนาเป็นคีย์บอร์ด TalkType บนแอนดรอยด์ที่เน้นการป้อนคำด้วยเสียงมากกว่าการพิมพ์ และในอนาคตจะมีการพัฒนาให้สามารถถอดเสียงจากวิดีโอ รองรับ format ไฟล์เพิ่ม และเพิ่มความสามารถในการใส่เครื่องหมายในประโยคโดยอัตโนมัติอีกด้วย

 

ที่มา: http://venturebeat.com/2017/03/13/baidu-launches-swiftscribe-an-app-that-transcribes-audio-with-ai/

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Stripe ยกระดับระบบชำระเงินสู่โครงสร้างพื้นฐานสำหรับ Machine-to-Machine รับยุค Agentic AI

Stripe เปิดตัวผลิตภัณฑ์ใหม่ 288 รายการ พร้อมส่งแผนพลิกโฉมระบบชำระเงินจากเดิมที่เป็นโครงสร้างพื้นฐานในการทำธุรกรรมสำหรับมนุษย์ ให้กลายเป็นโครงสร้างพื้นฐานที่สามารถตั้งโปรแกรมได้และทำงานอย่างต่อเนื่องเพื่อรองรับธุรกกรรมแบบ Machine-to-Machine ถือเป็นการปูทางเข้าสู่ระบบเศรษฐกิจแบบ Agentic AI อย่างเต็มรูปแบบ