มีรายงานว่า OpenAI กำลังพัฒนาโมเดลปัญญาประดิษฐ์ตัวใหม่ที่ได้รับการปรับแต่งให้เหมาะกับงานสร้างเสียงเป็นหลัก

The Information รายงานโดยอ้างแหล่งข่าวว่าอัลกอริทึมดังกล่าวจะถูกเปิดตัวภายในสิ้นเดือนมีนาคม โดยคาดว่าจะสามารถสร้างเสียงพูดที่ฟังดูเป็นธรรมชาติมากกว่าโมเดลปัจจุบันของ OpenAI นอกจากนี้ AI รุ่นใหม่ยังจะสามารถรับมือกับการโต้ตอบแบบเรียลไทม์กับผู้ใช้งานได้ดีขึ้นด้วย
มีรายงานว่า OpenAI จะพัฒนาโมเดลนี้บนสถาปัตยกรรมใหม่ โดยโมเดลเสียงแบบเรียลไทม์ระดับเรือธงในปัจจุบันอย่าง GPT-realtime ใช้สถาปัตยกรรมทรานส์ฟอร์เมอร์ที่แพร่หลายอยู่แล้ว แต่ยังไม่ชัดเจนว่าบริษัทจะเปลี่ยนไปใช้การออกแบบอัลกอริทึมแบบใหม่ทั้งหมด หรือเพียงใช้เวอร์ชันใหม่ของทรานส์ฟอร์เมอร์
โมเดลเสียงที่ใช้ทรานส์ฟอร์เมอร์บางรุ่นสามารถประมวลผลเสียงพูดได้โดยตรง ขณะที่บางรุ่น เช่นอัลกอริทึม Whisper ที่ OpenAI เปิดตัวในปี 2022 จะเปลี่ยนไฟล์เสียงให้เป็นกราฟที่เรียกว่าสเปกโตรแกรมก่อนประมวลผล ทั้งนี้ Whisper และโมเดลเสียงรุ่นใหม่ของบริษัทมีให้เลือกหลายเวอร์ชันตามคุณภาพผลลัพธ์ และมีความเป็นไปได้ว่า OpenAI จะนำแนวทางเดียวกันมาใช้กับอัลกอริทึมใหม่ที่จะเปิดตัวในไตรมาสนี้เช่นกัน
มีรายงานว่าบริษัทได้รวมทีมวิศวกรรม ผลิตภัณฑ์ และวิจัยหลายทีมเข้าด้วยกันเพื่อสนับสนุนความพยายามด้านโมเดลเสียง โดยโครงการนี้คาดว่าจะนำโดย Kundan Kumar อดีตนักวิจัยจาก Character.AI ซึ่งเป็นผู้ให้บริการ AI ที่ได้รับการสนับสนุนจากนักลงทุน ทั้งนี้ พนักงานจำนวนมากของสตาร์ทอัพดังกล่าวได้ย้ายไปยัง Google ในช่วงปลายปี 2024 จากดีล Reverse Acquihire มูลค่า 2.7 พันล้านดอลลาร์
ยังมีความเป็นไปได้ว่าโมเดลใหม่ของ OpenAI อาจไม่ได้มุ่งเน้นเฉพาะการสร้างเสียงพูดเท่านั้น ตลาดเพลงที่สร้างด้วย AI ซึ่งยังอยู่ในช่วงเริ่มต้นกำลังเติบโตอย่างรวดเร็ว โดย The Wall Street Journal รายงานเมื่อไม่นานมานี้ว่าผู้เล่นรายหนึ่งในตลาดอย่างสตาร์ทอัพ Suno สร้างรายได้ต่อปีมากกว่า 200 ล้านดอลลาร์ การเข้ามาแข่งขันในตลาดนี้อาจช่วยเสริมธุรกิจผู้บริโภคของ OpenAI
โมเดลเสียงใหม่นี้ยังเป็นส่วนหนึ่งของความพยายามที่ใหญ่ขึ้นของบริษัทในการเข้าสู่ตลาดอุปกรณ์อิเล็กทรอนิกส์สำหรับผู้บริโภค โดยตามรายงานของ The Information ระบุว่า OpenAI วางแผนเปิดตัว “อุปกรณ์ส่วนบุคคลที่เน้นเสียงเป็นหลัก” ภายในเวลาประมาณหนึ่งปี และเชื่อกันว่าบริษัทอาจเปิดตัวพอร์ตโฟลิโออุปกรณ์เต็มรูปแบบ รวมถึงลำโพงอัจฉริยะและแว่นตาอัจฉริยะในอนาคต
เมื่อเดือนพฤษภาคมที่ผ่านมา OpenAI ได้เข้าซื้อกิจการสตาร์ทอัพด้านการออกแบบผลิตภัณฑ์อย่าง io Products เพื่อสนับสนุนการขยายสู่ฮาร์ดแวร์ผู้บริโภค โดยดีลนี้ประเมินมูลค่าสตาร์ทอัพที่ก่อตั้งโดย Jony Ive ไว้ที่ 6.5 พันล้านดอลลาร์ ต่อมาในเดือนตุลาคม Financial Times รายงานว่า Ive กำลังทำงานบนอุปกรณ์ขนาดใกล้เคียงสมาร์ทโฟนที่ออกแบบมาเพื่อวางบนโต๊ะหรือพื้นผิวการทำงาน
OpenAI อาจพัฒนาโมเดลเสียงแบบเบาเพื่อประมวลผลบนอุปกรณ์โดยตรงเพื่อสนับสนุนการรุกเข้าสู่ตลาดฮาร์ดแวร์ผู้บริโภค เนื่องจากการประมวลผลคำสั่งในเครื่องมีต้นทุนต่ำกว่าการส่งไปยังคลาวด์ Google ใช้แนวทางคล้ายกันกับสมาร์ทโฟนตระกูล Pixel ซึ่งใช้โมเดลบนอุปกรณ์ที่ชื่อ Gemini Nano เพื่อขับเคลื่อนฟีเจอร์ AI บางส่วน
ที่มา: https://siliconangle.com/2026/01/01/report-openai-plans-launch-new-audio-model-first-quarter/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






