OpenAI เปิดตัว ChatGPT Images 2.0 โมเดลสร้างภาพ AI ที่แม่นยำและฉลาดขึ้น

OpenAI เปิดตัว ChatGPT Images 2.0 โมเดลสร้างภาพรุ่นใหม่ที่สามารถเรนเดอร์ข้อความในภาพได้แม่นยำขึ้น รองรับหลายภาษา พร้อมความสามารถ thinking สำหรับงานที่ซับซ้อน เปิดให้ใช้งานแล้วบน ChatGPT, Codex และ API

Credit: OpenAI

ChatGPT Images 2.0 เป็นโมเดลสร้างภาพรุ่นล่าสุดของ OpenAI ที่ยกระดับความสามารถด้านการทำตามคำสั่งอย่างละเอียด การจัดวางวัตถุในภาพอย่างแม่นยำ และการเรนเดอร์ข้อความหนาแน่นในภาพ ซึ่งเป็นจุดอ่อนของโมเดลสร้างภาพรุ่นก่อนหน้า โมเดลนี้รองรับ aspect ratio ที่หลากหลายตั้งแต่ 3:1 ไปจนถึง 1:3 และความละเอียดสูงสุด 2K ผ่าน API ทำให้สร้างภาพที่พร้อมใช้งานจริงได้ทันที ไม่ว่าจะเป็น banner, poster, social media graphics หรือ presentation slides

จุดเด่นสำคัญของ Images 2.0 คือความสามารถด้าน multilingual ที่ดีขึ้นอย่างมาก โดยเฉพาะการเรนเดอร์ข้อความภาษาที่ไม่ใช่ Latin script เช่น ภาษาญี่ปุ่น เกาหลี จีน ฮินดี และเบงกาลี ไม่ใช่แค่แปลป้ายชื่อสั้นๆ แต่สามารถสร้างภาพที่ภาษาเป็นส่วนหนึ่งของการออกแบบได้อย่างสมบูรณ์ นอกจากนี้เมื่อเลือกใช้โหมด thinking บน ChatGPT โมเดลจะทำงานเชิง agentic มากขึ้น สามารถค้นหาข้อมูลจากเว็บ สร้างภาพหลายภาพจาก prompt เดียวได้สูงสุด 8 ภาพพร้อมกัน และตรวจสอบผลลัพธ์ของตัวเองก่อนส่งมอบ นับเป็นครั้งแรกที่ระบบสร้างภาพใน ChatGPT รองรับการสร้างภาพหลายภาพในคราวเดียว

สำหรับนักพัฒนาและองค์กร OpenAI เปิดให้เข้าถึงความสามารถเดียวกันผ่าน API ในชื่อโมเดล gpt-image-2 ที่รองรับทั้งการสร้างและแก้ไขภาพ เหมาะสำหรับงาน localized advertising, infographic, สื่อการเรียนการสอน และ design tools โดยมีองค์กรอย่าง Canva, Figma, Adobe Firefly และ OpenArt ที่เริ่มนำไปใช้ในผลิตภัณฑ์แล้ว ส่วน ราคา จะแตกต่างกันตามคุณภาพและความละเอียดของภาพที่เลือก ทั้งนี้ OpenAI ระบุว่าโมเดลยังมีข้อจำกัดในบางงาน เช่น การสร้างภาพที่ต้องอาศัยโมเดลโลกทางกายภาพที่สมบูรณ์ หรือรายละเอียดที่ซ้ำกันหนาแน่นมาก รายละเอียดด้านความปลอดภัยสามารถอ่านเพิ่มเติมได้จาก system card

ที่มา: https://openai.com/index/introducing-chatgpt-images-2-0/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

[Video Webinar] ปลดล็อกศักยภาพการทำงานยุคใหม่ด้วย Microsoft 365 Copilot โดย NTT DATA

สำหรับผู้ที่ไม่ได้เข้าฟังการบรรยาย NTT DATA Webinar เรื่อง “ปลดล็อกศักยภาพการทำงานยุคใหม่ด้วย Microsoft 365 Copilot” – ผู้ช่วย AI ส่วนตัวระดับใช้งานในองค์กร พร้อมเจาะลึกฟีเจอร์ใหม่ล่าสุด และสาธิตการจัดการงานที่ยุ่งยากและซับซ้อนให้เสร็จเรียบร้อยในพริบตา …

เจาะลึก Zero Touch Provisioning บน VCF Edge 9.1 พลิกโฉมการขยาย Edge Site ด้วยระบบอัตโนมัติแบบครบวงจร

งานด้าน Edge Computing ต้องการความรวดเร็ว ความสม่ำเสมอ และความแม่นยำในการติดตั้งระบบเป็นอย่างมาก ในอดีต การติดตั้ง VMware Cloud Foundation (VCF) Edge Site มักต้องอาศัยผู้เชี่ยวชาญเดินทางไปที่สาขา …