ChatGPT เปิดให้ผู้ใช้งานโต้ตอบด้วยเสียงและส่งรูปภาพได้แล้ว

September 26, 2023 AI, Cloud and Systems

OpenAI ได้ประกาศอัปเดต ChatGPT ระบบ Generative AI Chatbot ใหม่ โดยเป็นการเพิ่มเติมฟีเจอร์ให้ผู้ใช้งานสามารถโต้ตอบด้วยเสียงและส่งรูปภาพไปยังระบบ AI ได้ ซึ่งเสียงที่ส่งเข้าสู่ระบบจะถูกถอดความและแปลงเป็นข้อความให้ AI เข้าใจ ผ่านโมเดลที่คล้ายกับ Whisper model ซึ่งเป็นโมเดลด้าน Speech to text หลังจากนั้นระบบสามารถใช้ Text-to-speech AI เพื่อสร้างเสียงพูดโต้ตอบกลับมาหาผู้ใช้งานได้ ปัจจุบันมีเสียงเริ่มต้นให้ใช้งาน 5 แบบ ได้แก่ Juniper,” “Ember,” “Sky,” “Cove” และ “Breeze” สามารถใช้งานในด้านที่ต่างกันออกไป เช่น การเล่าเรื่อง, การอ่านข่าว และการพูดคุยทั่วไป โดย OpenAI ยังเปิดให้นักพัฒนาสามารถนำเสียงพูดของบุคคลอื่นมาใช้งานเป็นเสียงโต้ตอบของ AI ได้อีกด้วย นอกจากนี้ OpenAI กำลังร่วมมือกับ Spotify ในการสร้าง Voice Translation เพื่อให้ผู้ที่ทำพอดแคสต์สามารถเปลี่ยนภาษาของพอดแคสต์นั้นๆเป็นภาษาอื่นได้ทันที

สำหรับฟีเจอร์ด้านการส่งรูปภาพนั้น ก็มีการเพิ่มเติมเข้ามาในเวอร์ชันนี้ โดยผู้ใช้งานสามารถถ่ายภาพหรืออัปโหลดรูปภาพและส่งเข้าระบบ AI ได้ทันที เพื่อให้ AI ทำการวิเคราะห์รูปภาพเหล่านั้น OpenAI ได้ยกตัวอย่างการนำไปใช้งานที่หลากหลาย เช่น การแยกวัตถุในรูป, การอ่านเอกสาร และการค้นหาเส้นทาง ปัจจุบันมีการทำงานร่วมกับแอพพลิเคชันอย่าง Be My Eyes ที่นำเทคโนโลยีนี้ไปใช้งานช่วยอำนวยความสะดวกให้กับผู้พิการทางสายตา

ที่มา: https://siliconangle.com/2023/09/25/openais-chatgpt-chatbot-now-allows-users-use-voice-pictures-get-answers/

Anthropic เปิดตัว Claude Opus 5 ชูความฉลาดใกล้ระดับ Fable 5 ในราคาครึ่งเดียว

Anthropic เปิดตัว Claude Opus 5 โมเดล AI ที่ให้ความสามารถใกล้เคียงระดับ frontier ของ Claude Fable 5 ในราคาครึ่งเดียว โดยยังคิดค่าบริการเท่ากับ …

Google Cloud รายได้โต 82% ในไตรมาส 2 ปี 2026 ดัน Backlog แตะ 5.14 แสนล้านดอลลาร์

Alphabet ประกาศผลประกอบการไตรมาสที่ 2 ปี 2026 โดย Google Cloud มีรายได้เติบโต 82% เมื่อเทียบกับช่วงเดียวกันของปีก่อน และมียอด Backlog สะสมแตะระดับ 5.14 …

TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย

ChatGPT เปิดให้ผู้ใช้งานโต้ตอบด้วยเสียงและส่งรูปภาพได้แล้ว

About เด็กฝึกงาน TechTalkThai หมายเลข 1

Related Articles

Check Also

Anthropic เปิดตัว Claude Opus 5 ชูความฉลาดใกล้ระดับ Fable 5 ในราคาครึ่งเดียว

Google Cloud รายได้โต 82% ในไตรมาส 2 ปี 2026 ดัน Backlog แตะ 5.14 แสนล้านดอลลาร์

ChatGPT เปิดให้ผู้ใช้งานโต้ตอบด้วยเสียงและส่งรูปภาพได้แล้ว

Share this:

About เด็กฝึกงาน TechTalkThai หมายเลข 1

Related Articles

Check Also