Black Hat Asia 2023

Baidu เปิดตัว SwiftScribe แอปถอดเสียงด้วย AI

Baidu เปิดตัว web application SwiftScribe แอปที่ใช้พลังจาก AI ช่วยให้สามารถถอดเสียงจากที่อัดไว้ได้อย่างรวดเร็วขึ้นกว่ามนุษย์ 1.67 เท่า

SwiftScribe ถอดเสียงจากไฟล์ .wav หรือ .mp3 ที่ผู้ใช้อัพโหลดขึ้นไปยังหน้าเว็บไซต์ http://swiftscribe.ai จากการทดลองสามารถถอดเสียงไฟล์ความยาว 30 วินาทีในเวลา 10 วินาที รองรับไฟล์ความยาวสูงสุดที่ 1 ชั่วโมงซึ่งจะใช้เวลาถอดเสียง 20 นาที ซึ่งถือว่ารวดเร็วแม้จะต้องมาแก้ไขข้อความให้เป็นประโยคด้วยการเติมตัวใหญ่และเครื่องหมายท้ายประโยคในภายหลัง

หนึ่งในทีมผู้พัฒนาเล่าถึงต้นกำเนิดแอปนี้ว่าได้แรงบันดาลใจมาจากประสบการณ์การถอดเสียงบทสัมภาษณ์เมื่อครั้งยังเรียนปริญญาโท ซึ่งใช้เวลากว่า 10 ชั่วโมงในการถอดเสียงไฟล์ความยาว 1 ชั่วโมงสำหรับผู้ที่ไม่ได้มีภาษาอังกฤษเป็นภาษาแม่ SwiftScribe จึงเป็นแอปที่จะเข้ามาช่วยคนเหล่านี้และนักถอดเสียงมืออาชีพให้ใช้เวลาสั้นลงในการถอดเสียง

SwiftScribe เป็นอีกหนึ่งแอปพลิเคชันจาก DeepSpeech ซอฟต์แวร์ Speech Recognition ของ Baidu ซึ่งก่อนหน้านี้ถูกนำไปพัฒนาเป็นคีย์บอร์ด TalkType บนแอนดรอยด์ที่เน้นการป้อนคำด้วยเสียงมากกว่าการพิมพ์ และในอนาคตจะมีการพัฒนาให้สามารถถอดเสียงจากวิดีโอ รองรับ format ไฟล์เพิ่ม และเพิ่มความสามารถในการใส่เครื่องหมายในประโยคโดยอัตโนมัติอีกด้วย

 

ที่มา: http://venturebeat.com/2017/03/13/baidu-launches-swiftscribe-an-app-that-transcribes-audio-with-ai/


Check Also

Salesforce เปิดตัว Einstein GPT

พลังของเทคโนโลยี OpenAI กับ CRM ด้วย Einstein GPT ลูกค้าของ Salesforce สามารถเชื่อมต่อข้อมูลนั้นกับโมเดล AI ขั้นสูงของ OpenAI ได้ทันที  

5 เทรนด์เทคโนโลยีธุรกิจห้ามพลาดแห่งปี 2023-2025

เมื่อเทคโนโลยีถูกพัฒนาอย่างก้าวกระโดด และเป็นตัวกำหนดความต้องการของผู้บริโภคที่เปลี่ยนไป ไม่ว่าจะเป็น ความต้องการประสบการณ์ใหม่ๆ ในการดำเนินชีวิต, ความรวดเร็วในการบริการ, ความปลอดภัยและความเป็นส่วนตัวในการใช้งาน และการร่วมเป็นส่วนหนึ่งในการรักษาสิ่งแวดล้อม ส่งผลให้ธุรกิจต้องมีการปรับตัวและอัปเดตเทรนด์เทคโนโลยีที่จะเกิดขึ้นอยู่เสมอ ซึ่งในบทความนี้ ทีมงานขอพาผู้อ่านไปพบกับ 5 เทรนด์เทคโนโลยีที่จะเกิดขึ้นในปี 2023 – …