IBM Flashsystem

จับตา Liquid AI เปิดตัวโมเดล Multimodal AI ใหม่ ที่ไม่ได้อิงจาก Transformer

Generative AI ที่เกิดขึ้นมาก่อนหน้านี้และที่กำลังใช้งานกันอยู่ในปัจจุบัน ส่วนใหญ่นั้นจะเป็นการอิงโครงสร้างสถาปัตยกรรม Transformer ซึ่งอ้างอิงมาจากงานตีพิมพ์ Attention Is All You Need อันโด่งดัง หากแต่ล่าสุด Liquid AI ได้ออกมาเปิดตัวโมเดลใหม่ที่ไม่ได้อิง Transformer และอาจเป็นโมเดล Generative AI แห่งอนาคต

Liquid AI คือสตาร์ตอัปที่ก่อตั้งโดยอดีตนักวิจัยจากห้องปฏิบัติการ CSAIL แห่ง MIT ซึ่งล่าสุดได้ประกาศเปิดตัวโมเดล Multimodal ภายใต้ชื่อ “Liquid Foundation Models (LFMs)” โดยสิ่งที่น่าสนใจและควรจับตาอย่างยิ่งคือ โมเดล Generative AI นี้ ไม่ได้อิงจากสถาปัตยกรรม Transformer แต่อย่างใดแล้ว

โดย Liquid AI ได้กล่าวว่าเป้าหมายของการสร้างสิ่งนี้ “คือการค้นหาแนวทางใหม่ในการสร้าง Foundation Model ที่เหนือกว่าโมเดลที่เป็น Generative Pre-trained Transformers (GPTs)” ซึ่ง LFM นี้เป็นเหมือนรากฐานสำหรับการสร้างสิ่งต่าง ๆ ที่ต่อยอดขึ้นไป เหมือนเครื่องยนต์แล้วต่อด้วยรถยนต์ แล้วก็เครื่องบิน เป็นต้น

ปัจ จุบัน Liquid AI ได้เปิดตัว LFMs ออกมาใน 3 ขนาด ได้แก่ LFM 1.3B (เล็กที่สุด), LFM 3B และ LFM 40B MoE (Mixture-of-Experts ที่เหมือนกับ Mixtral ของ Mistral) ซึ่ง Liquid AI เคลมว่า LFM 1.3B ที่เล็กที่สุดนั้นมีความสามารถที่เหนือกว่า Llama 3.2 1.2B ของ Meta และ Phi-1.5 ของ Microsoft แล้วในหลาย ๆ การทดสอบ 

Credit : Liquid AI

ดูเหมือนว่าสิ่งที่ Yan LeCunn หนึ่งในผู้เชี่ยวชาญด้าน AI ชั้นนำของโลกได้ออกมากล่าวว่า “ถ้าหากจะสร้าง AI สำหรับยุคถัดไป อย่าโฟกัสที่ LLM อาจจะกำลังเกิดขึ้น จึงควรจับตาวิวัฒนาการของ Liquid AI ที่ Spin Off มาจาก CSAIL แห่ง MIT อย่างยิ่ง ว่าจะสามารถต่อยอดโมเดล LFMs ให้พัฒนาเหนือกว่า LLMs ที่ใช้ Transformer เป็นฐานได้ขนาดไหนต่อไป

ที่มา: https://venturebeat.com/ai/mit-spinoff-liquid-debuts-non-transformer-ai-models-and-theyre-already-state-of-the-art/

About chatchai

Tech Writer แห่ง TechTalk Thai ที่สนใจในทุกนวัตกรรมและเทคโนโลยี

Check Also

ปลดล็อกทุกขีดจำกัดของข้อมูล Hybrid Multicloud ด้วยสถาปัตยกรรมใหม่จาก Nutanix AOS

แผนของ Hybrid Multicloud ในทางปฏิบัตินั้นยังมีความท้าทายอยู่ไม่น้อย ในประเด็นด้านการบูรณาการของเครื่องมือและข้อมูล โดยการออกแบบแอปพลิเคชันสมัยใหม่ควรให้ความสำคัญในเรื่องของ Cloud native ที่ถูกบริหารจัดการด้วย Kubernetes แต่ในชีวิตจริงการย้ายข้อมูลข้ามไปยังคลาวด์หรือ On-premise ไม่ใช่เรื่องที่ง่ายเช่นนั้น เพราะขาดซึ่งแพลตฟอร์มข้อมูลกลางที่ยึดโยงข้อมูลเข้ากับแอปพลิเคชันอย่างแท้จริง นั่นจึงนำไปสู่การเปิดตัวสถาปัตยกรรมด้านสตอเรจใหม่จาก …

ขอเชิญร่วมงานสัมมนา Microsoft Azure “Migrate to Innovate: Be AI-Ready and secure your IT foundation” [4 มิ.ย. 2568 — 9.00น.]

Metro Systems Corporation ร่วมกับ Microsoft ขอเชิญผู้สนใจเข้าร่วมงานสัมมนาในหัวข้อ “Migrate to Innovate: Be AI-Ready and secure your IT …