ChatGPT เปิดให้ผู้ใช้งานโต้ตอบด้วยเสียงและส่งรูปภาพได้แล้ว

ChatGPT เปิดให้ผู้ใช้งานโต้ตอบด้วยเสียงและส่งรูปภาพได้แล้ว

Credit: OpenAI

OpenAI ได้ประกาศอัปเดต ChatGPT ระบบ Generative AI Chatbot ใหม่ โดยเป็นการเพิ่มเติมฟีเจอร์ให้ผู้ใช้งานสามารถโต้ตอบด้วยเสียงและส่งรูปภาพไปยังระบบ AI ได้ ซึ่งเสียงที่ส่งเข้าสู่ระบบจะถูกถอดความและแปลงเป็นข้อความให้ AI เข้าใจ ผ่านโมเดลที่คล้ายกับ Whisper model ซึ่งเป็นโมเดลด้าน Speech to text หลังจากนั้นระบบสามารถใช้ Text-to-speech AI เพื่อสร้างเสียงพูดโต้ตอบกลับมาหาผู้ใช้งานได้ ปัจจุบันมีเสียงเริ่มต้นให้ใช้งาน 5 แบบ ได้แก่ Juniper,” “Ember,” “Sky,” “Cove” และ “Breeze” สามารถใช้งานในด้านที่ต่างกันออกไป เช่น การเล่าเรื่อง, การอ่านข่าว และการพูดคุยทั่วไป โดย OpenAI ยังเปิดให้นักพัฒนาสามารถนำเสียงพูดของบุคคลอื่นมาใช้งานเป็นเสียงโต้ตอบของ AI ได้อีกด้วย นอกจากนี้ OpenAI กำลังร่วมมือกับ Spotify ในการสร้าง Voice Translation เพื่อให้ผู้ที่ทำพอดแคสต์สามารถเปลี่ยนภาษาของพอดแคสต์นั้นๆเป็นภาษาอื่นได้ทันที

สำหรับฟีเจอร์ด้านการส่งรูปภาพนั้น ก็มีการเพิ่มเติมเข้ามาในเวอร์ชันนี้ โดยผู้ใช้งานสามารถถ่ายภาพหรืออัปโหลดรูปภาพและส่งเข้าระบบ AI ได้ทันที เพื่อให้ AI ทำการวิเคราะห์รูปภาพเหล่านั้น OpenAI ได้ยกตัวอย่างการนำไปใช้งานที่หลากหลาย เช่น การแยกวัตถุในรูป, การอ่านเอกสาร และการค้นหาเส้นทาง ปัจจุบันมีการทำงานร่วมกับแอพพลิเคชันอย่าง Be My Eyes ที่นำเทคโนโลยีนี้ไปใช้งานช่วยอำนวยความสะดวกให้กับผู้พิการทางสายตา

ที่มา: https://siliconangle.com/2023/09/25/openais-chatgpt-chatbot-now-allows-users-use-voice-pictures-get-answers/

 

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Stripe ยกระดับระบบชำระเงินสู่โครงสร้างพื้นฐานสำหรับ Machine-to-Machine รับยุค Agentic AI

Stripe เปิดตัวผลิตภัณฑ์ใหม่ 288 รายการ พร้อมส่งแผนพลิกโฉมระบบชำระเงินจากเดิมที่เป็นโครงสร้างพื้นฐานในการทำธุรกรรมสำหรับมนุษย์ ให้กลายเป็นโครงสร้างพื้นฐานที่สามารถตั้งโปรแกรมได้และทำงานอย่างต่อเนื่องเพื่อรองรับธุรกกรรมแบบ Machine-to-Machine ถือเป็นการปูทางเข้าสู่ระบบเศรษฐกิจแบบ Agentic AI อย่างเต็มรูปแบบ