ไมโครซอฟท์เปิดตัว MAI-Image-2 โมเดล AI เน้นความสมจริงและแก้ปัญหาการแสดงผลข้อความ

Microsoft ได้ประกาศเปิดตัว MAI-Image-2 ซึ่งเป็นโมเดลแปลงข้อความเป็นภาพ (text-to-image) รุ่นล่าสุดที่พัฒนาขึ้นเองภายในบริษัท โดยมีเป้าหมายเพื่อสร้างภาพที่สมจริงและสามารถนำไปใช้งานจริงในงานสร้างสรรค์ได้ดียิ่งขึ้น ซึ่งถืออีกก้าวของบริษัทในการพัฒนาเทคโนโลยีสร้างภาพของตนเองต่อจาก MAI-Image-1

ไมโครซอฟท์วางตำแหน่ง MAI-Image-2 ให้เป็นเครื่องมือสำหรับ Workflow งานสร้างสรรค์ในโลกแห่งความเป็นจริง มากกว่าจะเป็นเพียงการทดลองทางภาพถ่าย เน้นไปที่ ความสมจริง (Photorealism) เช่น การให้แสงที่เป็นธรรมชาติ สีผิวที่แม่นยำ และสภาพแวดล้อมที่ดูเหมือนมีคนอาศัยอยู่จริง ซึ่งจะช่วยให้ครีเอเตอร์ ลดเวลาในการแก้ไขงานหลังการผลิต (post-production) และมีเวลาในการสร้างสรรค์ผลงานมากขึ้น โดยการพัฒนานี้ได้รับคำแนะนำโดยตรงจากช่างภาพ นักออกแบบ และนักเล่าเรื่องด้วยภาพ เพื่อแก้ปัญหาข้อจำกัดของเครื่องมือ AI ในปัจจุบัน

  • ไฮไลต์ในการอัปเกรตคือความสามารถในการ สร้างภาพที่มีข้อความ (Text Rendering) ที่มักเป็นจุดอ่อนของโมเดล AI ส่วนใหญ่
  • ไมโครซอฟท์ระบุว่าโมเดลนี้สามารถสร้างภาพที่มีองค์ประกอบของข้อความ เช่น โปสเตอร์ อินโฟกราฟิก สไลด์ และไดอะแกรม ได้อย่างแม่นยำและตรงตามคำสั่ง (prompt) มากขึ้น

MAI-Image-2 ได้ไต่อันดับขึ้นมาอยู่ใน 3 อันดับแรกของโลก (Top 3) ในกลุ่มแล็บพัฒนา AI สร้างภาพจากข้อความบน Arena.ai แม้ว่าในปัจจุบันจะยังคงตามหลังคู่แข่งอย่างโมเดล Gemini ของ Google และระบบ GPT-Image ของ OpenAI แต่ก็นับเป็นการพัฒนาที่ก้าวกระโดดจากรุ่นแรกอย่างเห็นได้ชัด

ปัจจุบันผู้ใช้งานสามารถทดสอบ MAI-Image-2 ได้แล้วที่ MAI Playground และกำลังเริ่มทยอยเปิดให้ใช้งานบน Copilot และ Bing Image Creator สำหรับลูกค้าองค์กรบางกลุ่มสามารถเข้าถึงได้ผ่าน API และจะเปิดให้นักพัฒนาทั่วไปใช้งานผ่าน Foundry ในเร็วๆ นี้

การเปิดตัวครั้งนี้ยังตอกย้ำถึงกลยุทธ์ของไมโครซอฟท์ที่หันมามุ่งเน้นการ พัฒนาโมเดล AI ของตนเองภายในบริษัท แทนที่จะพึ่งพาเพียงความร่วมมือกับ OpenAI เพียงอย่างเดียว

ที่มา : https://www.eweek.com/news/microsoft-mai-image-2-ai-image-model-launch/

About nattakon

จบการศึกษา ปริญญาตรีและโท สาขาวิศวกรรมคอมพิวเตอร์ KMITL เคยทำงานด้าน Engineer/Presale ดูแลผลิตภัณฑ์ด้าน Network Security และ Public Cloud ในประเทศ ปัจจุบันเป็นนักเขียน Full-time ที่ TechTalkThai

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้