Tag Archives: Multimodal

Microsoft AI เปิดตัว 7 โมเดลใหม่ตระกูล MAI พร้อม Frontier Tuning สำหรับองค์กร

Microsoft AI เปิดตัวโมเดล AI ตระกูล MAI จำนวน 7 รุ่น ครอบคลุม Reasoning, Coding, Image, Transcription และ Voice พร้อมเทคโนโลยี Frontier Tuning ที่ให้องค์กรปรับแต่งโมเดลด้วยข้อมูลของตนเองได้

Read More »

Google เปิดตัว Gemini 3.5 Flash และ Omni รุกตลาด AI Agent และสร้างวิดีโอ

Google เปิดตัวโมเดล AI ใหม่ 2 รุ่นในตระกูล Gemini ได้แก่ Gemini 3.5 Flash สำหรับขับเคลื่อน AI Agent และ Gemini Omni สำหรับสร้างและแก้ไขวิดีโอจาก input หลากหลายรูปแบบ

Read More »

OpenAI เปิดตัว ChatGPT Images 2.0 โมเดลสร้างภาพ AI ที่แม่นยำและฉลาดขึ้น

OpenAI เปิดตัว ChatGPT Images 2.0 โมเดลสร้างภาพรุ่นใหม่ที่สามารถเรนเดอร์ข้อความในภาพได้แม่นยำขึ้น รองรับหลายภาษา พร้อมความสามารถ thinking สำหรับงานที่ซับซ้อน เปิดให้ใช้งานแล้วบน ChatGPT, Codex และ API

Read More »

Anthropic เปิดตัว Claude Opus 4.7 เพิ่มประสิทธิภาพงาน Coding และรองรับภาพความละเอียดสูง

Anthropic เปิดตัว Claude Opus 4.7 โมเดล AI รุ่นใหม่ที่พัฒนาต่อจาก Opus 4.6 โดยเน้นการปรับปรุงงาน Software Engineering ขั้นสูง งาน agentic ที่ทำงานต่อเนื่องระยะยาว และเพิ่มความสามารถด้านการประมวลผลภาพที่ความละเอียดสูงขึ้นกว่าเดิมอย่างชัดเจน

Read More »

Meta เปิดตัว Muse Spark โมเดล AI Multimodal จาก Meta Superintelligence Labs

Meta เปิดตัว Muse Spark โมเดล AI แรกจาก Meta Superintelligence Labs ที่รองรับการประมวลผลแบบ multimodal พร้อมความสามารถด้าน reasoning, tool-use และ multi-agent orchestration โดยเปิดให้ใช้งานแล้วผ่าน meta.ai และแอป Meta AI

Read More »

Google เปิดตัว Gemma 4 โมเดล AI แบบ Open Source ประสิทธิภาพสูง

Google เปิดตัว Gemma 4 โมเดล AI แบบ Open Source ตระกูลใหม่ที่พัฒนาจากเทคโนโลยีเดียวกับ Gemini 3 มาพร้อม 4 ขนาดให้เลือกใช้ รองรับงาน Agentic Workflow และเปิดให้ใช้งานภายใต้สัญญาอนุญาต Apache 2.0

Read More »

OpenAI เปิดตัว GPT-5.4 mini และ nano โมเดล AI ขนาดเล็กที่เร็วและประหยัดกว่าเดิม

OpenAI เปิดตัว GPT-5.4 mini และ GPT-5.4 nano โมเดล AI ขนาดเล็กรุ่นใหม่ที่ออกแบบมาเพื่องาน coding และ subagent โดยเฉพาะ พร้อมประสิทธิภาพที่เข้าใกล้โมเดลขนาดใหญ่ในราคาที่ประหยัดกว่า

Read More »

Microsoft เปิดซอร์สโมเดลการใช้เหตุผลแบบมัลติโหมด ขนาด 15 พันล้านพารามิเตอร์

Microsoft ได้เปิดตัว Phi-4-reasoning-vision-15B ซึ่งเป็นโมเดลการใช้เหตุผลที่มีประสิทธิภาพการใช้ฮาร์ดแวร์สูง โดยสามารถประมวลผลไฟล์หลายรูปแบบ เช่น แผนภูมิทางวิทยาศาสตร์ ได้

Read More »

Alibaba เปิดตัว Qwen3.5 โมเดล AI แบบ Mixture of Experts เอาชนะ GPT-5.2 และ Claude 4.5 Opus

Alibaba เปิดตัว Qwen3.5 โมเดล AI รุ่นใหม่ล่าสุดแบบ Mixture of Experts ขนาด 397 พันล้าน parameters ที่สามารถทำคะแนน benchmark บางตัวได้เหนือกว่า GPT-5.2 และ Claude 4.5 Opus โดยเปิดให้ใช้งานแบบ Open Source บน Hugging Face แล้ว

Read More »

Moonshot AI เปิดตัว Kimi K2.5 โมเดล AI แบบ Open Source ขนาด 1 ล้านล้านพารามิเตอร์

Moonshot AI เปิดตัว Kimi K2.5 โมเดล AI แบบ Open Source ที่มีขนาด 1 ล้านล้าน parameters พร้อมประสิทธิภาพที่เหนือกว่า GPT-5.2 ในหลายมาตรฐานการทดสอบ

Read More »

Google เปิดตัว Gemini 3 Flash โมเดล AI ระดับ Frontier ที่เน้นความเร็วในราคาประหยัด

Google เปิดตัว Gemini 3 Flash โมเดล AI รุ่นใหม่ในตระกูล Gemini 3 ที่ผสานความฉลาดระดับ frontier เข้ากับความเร็วในการประมวลผล

Read More »

fal ผู้ให้บริการ Multimodal AI ระดมทุน 140 ล้านดอลลาร์ ท่ามกลางการเติบโตอย่างรวดเร็ว

บริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์ fal ประกาศว่าระดมทุนได้มูลค่า 140 ล้านดอลลาร์ผ่านการระดมทุนรอบที่สามของปีนี้ โดยมี Sequoia เป็นผู้นำการลงทุน Series D รอบนี้และมีการเข้าร่วมจากหน่วยลงทุนของ Nvidia, Salesforce และ Shopify รวมถึงนักลงทุนรายอื่น ๆ

Read More »

AWS เปิดตัว Nova 2 โมเดล AI 4 รุ่นใหม่ในงาน re:Invent 2025

Amazon Web Services เปิดตัวโมเดล AI ตระกูล Nova 2 จำนวน 4 รุ่นใหม่ ได้แก่ Lite, Pro, Sonic และ Omni ในงาน AWS re:Invent 2025 ที่ Las Vegas โดยมุ่งเน้นประสิทธิภาพด้านราคาและความสามารถ multimodal ที่ครอบคลุม

Read More »

Google เปิดตัว Gemini 3 โมเดล AI อัจฉริยะที่สุดรองรับ Multimodal และ Reasoning ขั้นสูง

Google ประกาศเปิดตัว Gemini 3 โมเดล AI รุ่นใหม่ล่าสุดที่มีความสามารถด้าน Reasoning และการประมวลผล Multimodal ขั้นสูงที่สุด พร้อมให้บริการผ่าน Gemini app, Google AI Studio และ Vertex AI

Read More »

Google เปิดตัว Gemini 2.5 Flash-Lite พร้อมปรับราคาโมเดลในซีรีส์ใหม่

Google เปิดตัว Gemini 2.5 Flash-Lite โมเดล LLM ระดับเริ่มต้นตัวใหม่ประมวลผลเร็วขึ้น ราคาถูกกว่า Pro ถึง 10 เท่า พร้อมใช้งาน mixture-of-experts เพิ่มประสิทธิภาพ

Read More »

Google Workspace เตรียมเพิ่มฟีเจอร์ AI มัลติโมดอลใหม่ ช่วยทำงานให้โดยอัตโนมัติ

Google กำลังเพิ่มฟีเจอร์ปัญญาประดิษฐ์ใหม่ให้กับ Google Workspace เพื่อช่วยให้ผู้ใช้สามารถเขียนอีเมล แปลงสไลด์โชว์เป็นวิดีโอ และทำงานอื่น ๆ ได้ง่ายยิ่งขึ้น

Read More »

Google เปิดตัว Gemini 2.5 Pro Preview พร้อมความสามารถด้านการเขียนโค้ดที่เหนือชั้น

Google ประกาศเปิดตัว Gemini 2.5 Pro Preview เวอร์ชันล่าสุดของโมเดล AI ชั้นนำของบริษัท ที่มาพร้อมความสามารถด้านการเขียนโค้ดที่พัฒนาขึ้นอย่างมีนัยสำคัญ โดยเปิดให้เข้าถึงในโหมด early access แล้ววันนี้ ก่อนงานประชุมนักพัฒนา Google I/O 2025 ที่จะมีขึ้นในอีกไม่กี่สัปดาห์ข้างหน้า

Read More »

Meta อัปเกรดเอไอสู่ Llama 4 ยกระดับความอัจฉริยะผ่าน Multimodal ประมวลผลได้หลากหลาย [PR]

Meta ประกาศเปิดตัว Llama 4 ปัญญาประดิษฐ์เวอร์ชันอัปเดตล่าสุดอย่างเป็นทางการ ซึ่งเป็นชุดโมเดลภาษาขนาดใหญ่ (LLMs) แบบโอเพนซอร์ส ที่จะช่วยยกระดับขีดความสามารถของ Meta AI ในประเทศไทยอย่างมีนัยสำคัญ และเป็นอีกก้าวหนึ่งในการพัฒนานวัตกรรมอย่างต่อเนื่องของ Meta เพื่อให้ผู้ใช้ทุกคน จากทุกที่ สามารถ เข้าถึง AI ระดับโลกได้

Read More »

Thinking Machines ของ Mira Murati กำลังระดมทุน 2 พันล้านดอลลาร์

มีรายงานว่า Thinking Machines Lab ซึ่งเป็นสตาร์ทอัพด้านปัญญาประดิษฐ์ที่นำโดย Mira Murati อดีตประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของ OpenAI กำลังระดมทุนรอบ seed มูลค่า 2 พันล้านดอลลาร์

Read More »

Google Search เพิ่มความสามารถค้นหาด้วยภาพใหม่ให้ AI Mode

Google กำลังอัปเดตฟีเจอร์ใหม่ให้ “AI Mode” ใน Google Search โดยเพิ่มความสามารถแบบมัลติโหมด ที่ช่วยให้ระบบสามารถ “มองเห็น” ภาพที่ผู้ใช้อัปโหลดเข้ามา เพื่อให้ตอบคำถามได้อย่างมีประสิทธิภาพมากยิ่งขึ้น

Read More »