ทีมนักวิจัยจาก Microsoft ได้ออกมาประกาศความสำเร็จในการพัฒนาเทคโนโลยี Speech Recognition ที่มีอัตราความผิดพลาดน้อยจนเทียบเท่ากับมนุษย์ได้แล้ว

ทีม Microsoft Artificial Intelligence and Research ได้รายงานว่าสามารถลดความผิดพลาดของเทคโนโลยี Speech Recognition จากเดิมที่เคยมีอัตราความผิดพลาด 6.3% ให้ลดลงเหลือ 5.9% ได้สำเร็จแล้ว ซึ่งตัวเลขนี้เป็นอัตราความผิดพลาดที่ใกล้เคียงกับอัตราความผิดพลาดของมนุษย์ ซึ่งถือเป็นครั้งแรกของโลกที่สามารถพัฒนาเทคโนโลยีได้ในระดับนี้ และแม้แต่ทีมงานของ Microsoft เองก็ยังไม่เชื่อมาก่อนว่าจะสามารถก้าวมาถึงจุดนี้ได้
งานวิจัยชิ้นนี้ใช้เวลานานเกินกว่า 20 ปี และหลังจากนี้ก็จะถูกนำไปใช้ในผลิตภัณฑ์ทั้งกลุ่ม Consumer และ Business ของ Microsoft ต่อไป เช่น Xbox และ Cortana เป็นต้น
เทคโนโลยีที่ทีมวิจัยนี้ใช้ก็คือการทำ Deep Neural Network เพื่อเรียนรู้จากข้อมูลจำนวนมาก โดยใช้เครื่องมือ Open Source อย่าง Computational Network Toolkit หรือ CNTK (https://www.cntk.ai/) ของ Microsoft เองในการทำ Deep Learning นั่นเอง
หลังจากนี้เป้าหมายของทีมวิจัยก็จะมุ่งเน้นไปที่การทำให้คอมพิวเตอร์สามารถเข้าใจสิ่งที่พูดและโต้ตอบกลับมาเป็นบทสนทนาได้ ซึ่งการทำให้คอมพิวเตอร์เข้าใจความหมายของคำพูดหรือบทสนทนาได้อย่างถ่องแท้นั้นก็ยังเป็นระยะทางที่ยาวไกลต่อไปอีกในอนาคต
ผู้ที่สนใจสามารถอ่าน Paper ฉบับเต็มได้ที่ https://arxiv.org/abs/1610.05256 เลยนะครับ หรือถ้าหากต้องการทดลองใช้งาน CNTK ก็สามารถใช้งานได้ที่ https://github.com/Microsoft/CNTK เลยครับ