ChatGPT เปิดให้ผู้ใช้งานโต้ตอบด้วยเสียงและส่งรูปภาพได้แล้ว
OpenAI ได้ประกาศอัปเดต ChatGPT ระบบ Generative AI Chatbot ใหม่ โดยเป็นการเพิ่มเติมฟีเจอร์ให้ผู้ใช้งานสามารถโต้ตอบด้วยเสียงและส่งรูปภาพไปยังระบบ AI ได้ ซึ่งเสียงที่ส่งเข้าสู่ระบบจะถูกถอดความและแปลงเป็นข้อความให้ AI เข้าใจ ผ่านโมเดลที่คล้ายกับ Whisper model ซึ่งเป็นโมเดลด้าน Speech to text หลังจากนั้นระบบสามารถใช้ Text-to-speech AI เพื่อสร้างเสียงพูดโต้ตอบกลับมาหาผู้ใช้งานได้ ปัจจุบันมีเสียงเริ่มต้นให้ใช้งาน 5 แบบ ได้แก่ Juniper,” “Ember,” “Sky,” “Cove” และ “Breeze” สามารถใช้งานในด้านที่ต่างกันออกไป เช่น การเล่าเรื่อง, การอ่านข่าว และการพูดคุยทั่วไป โดย OpenAI ยังเปิดให้นักพัฒนาสามารถนำเสียงพูดของบุคคลอื่นมาใช้งานเป็นเสียงโต้ตอบของ AI ได้อีกด้วย นอกจากนี้ OpenAI กำลังร่วมมือกับ Spotify ในการสร้าง Voice Translation เพื่อให้ผู้ที่ทำพอดแคสต์สามารถเปลี่ยนภาษาของพอดแคสต์นั้นๆเป็นภาษาอื่นได้ทันที
สำหรับฟีเจอร์ด้านการส่งรูปภาพนั้น ก็มีการเพิ่มเติมเข้ามาในเวอร์ชันนี้ โดยผู้ใช้งานสามารถถ่ายภาพหรืออัปโหลดรูปภาพและส่งเข้าระบบ AI ได้ทันที เพื่อให้ AI ทำการวิเคราะห์รูปภาพเหล่านั้น OpenAI ได้ยกตัวอย่างการนำไปใช้งานที่หลากหลาย เช่น การแยกวัตถุในรูป, การอ่านเอกสาร และการค้นหาเส้นทาง ปัจจุบันมีการทำงานร่วมกับแอพพลิเคชันอย่าง Be My Eyes ที่นำเทคโนโลยีนี้ไปใช้งานช่วยอำนวยความสะดวกให้กับผู้พิการทางสายตา