OpenAI จับมือ Broadcom เปิดตัว Jalapeño ชิป Inference สำหรับ LLM โดยเฉพาะ

OpenAI ร่วมกับ Broadcom เปิดตัว Jalapeño ชิป Intelligence Processor ตัวแรกของ OpenAI ที่ออกแบบมาเพื่องาน inference ของ LLM โดยเฉพาะ พร้อมเตรียมนำไปใช้งานในระดับ gigawatt scale ภายในสิ้นปี 2026

Credit: OpenAI

Jalapeño เป็น AI accelerator ตัวแรกในแพลตฟอร์มด้านการประมวลผลแบบ multi-generation ที่ทั้งสองบริษัทพัฒนาร่วมกัน โดย OpenAI ออกแบบชิปขึ้นใหม่ตั้งแต่ต้นจากความเข้าใจในพื้นฐานการทำงานของ LLM ทั้ง kernel, serving system และความต้องการของผลิตภัณฑ์จริง ขณะที่ Broadcom รับผิดชอบส่วน chip implementation, networking และการผลิตในระดับ large-scale ส่วน Celestica ดูแลด้าน board, rack และการประกอบระบบ ปัจจุบัน engineering sample ของ Jalapeño กำลังรัน ML workload อยู่ในห้องแล็บที่ความถี่และระดับพลังงานตามเป้าหมายการผลิตจริง รวมถึงการรันโมเดล GPT-5.3-Codex-Spark ด้วย

จุดเด่นสำคัญของ Jalapeño คือการออกแบบใหม่ทั้งหมดสำหรับงาน inference ของ LLM ยุคปัจจุบัน ไม่ใช่การนำ accelerator สำหรับงาน AI แบบทั่วไปมาปรับใช้ สถาปัตยกรรมเน้นลดการเคลื่อนย้ายข้อมูล (data movement) และจัดสมดุลทรัพยากรด้าน compute, memory และ networking เพื่อให้ได้ utilization ที่ใกล้เคียงกับประสิทธิภาพสูงสุดทางทฤษฎีมากขึ้น โดยใช้เทคโนโลยี networking ของ Broadcom รวมถึงชิป Tomahawk เข้ามาช่วยรองรับการผลิตในระดับ large-scale แม้ OpenAI จะยังอยู่ระหว่างการวัดประสิทธิภาพขั้นสุดท้าย แต่ผลการทดสอบในช่วงแรกชี้ว่า Jalapeño จะให้ performance per watt ที่ดีกว่าเทคโนโลยี state-of-the-art ในปัจจุบันอย่างมีนัยสำคัญ และจะมีรายงานทางเทคนิคโดยละเอียดตามมาในอีกไม่กี่เดือนข้างหน้า

อีกประเด็นที่น่าสนใจคือ Jalapeño ใช้เวลาพัฒนาตั้งแต่ขั้นออกแบบจนถึง manufacturing tape-out เพียง 9 เดือน ซึ่ง OpenAI ระบุว่าเป็นรอบการพัฒนา ASIC ที่เร็วที่สุดเท่าที่เคยมีมาในกลุ่ม semiconductor ประสิทธิภาพสูง โดยส่วนหนึ่งเป็นผลจากการนำโมเดล AI ของ OpenAI เองมาช่วยเร่งกระบวนการออกแบบและ optimization ทำให้โมเดลที่ให้บริการผู้ใช้งานอยู่กลายเป็นเครื่องมือช่วยพัฒนา infrastructure สำหรับรันโมเดลรุ่นถัดไป

Jalapeño ถือเป็นก้าวแรกของแพลตฟอร์มการประมวลผลแบบ multi-generation ที่วางแผนเริ่ม deploy ช่วงแรกภายในสิ้นปี 2026 และจะขยายต่อในปีถัด ๆ ไป โดย Broadcom ระบุว่าการ deploy data center ระดับ gigawatt scale จะเริ่มต้นในปี 2026 ร่วมกับ Microsoft และพันธมิตรรายอื่น ซึ่งสะท้อนกลยุทธ์ full-stack ของ OpenAI ที่ขยายจากการพัฒนาโมเดลและผลิตภัณฑ์ มาสู่การออกแบบ infrastructure ระดับชิปด้วยตนเอง เพื่อให้บริการ AI ได้เร็วขึ้น เสถียรขึ้น และเข้าถึงได้ในวงกว้างมากขึ้น

ที่มา: https://openai.com/index/openai-broadcom-jalapeno-inference-chip/

About เด็กฝึกงาน TechTalkThai หมายเลข 1

นักเขียนผู้มีความสนใจใน Enterprise IT ด้วยประสบการณ์กว่า 10 ปีในไทย ปัจจุบันใช้ชีวิตอยู่ที่สหรัฐอเมริกา แต่ยังคงมุ่งมั่นในการแบ่งปันความรู้และประสบการณ์ด้านเทคโนโลยีให้กับทุกคน

Check Also

รู้จัก IBM FlashSystem x600: AI-Driven Storage รุ่นล่าสุด เปลี่ยนนิยามสู่ระบบจัดเก็บข้อมูลที่รวมเร็ว มั่นคง ปลอดภัย พร้อม Agentic AI ในตัว โดย Ingram Micro Thailand

เมื่อต้นปี 2026 ที่ผ่านมา IBM ได้ออกมาประกาศเปิดตัว IBM FlashSystem ใหม่ล่าสุดในตระกูล x600 ที่นอกจากจะมาพร้อมกับ Hardware และ Software ใหม่ๆ ซึ่งช่วยเพิ่มประสิทธิภาพและความมั่นคงปลอดภัยแล้ว …

ชวนเรียน TWA Skills: Web for Life ทำเว็บไซต์ด้วยเครื่องมือ Google Gemini กับ คุณกษิดิศ สตางค์มงคล (ทอย)

อยากทำเว็บ แต่ทำเว็บไม่เป็น ไม่มีพื้นฐานไอที คิดว่ามันยากและไกลตัว แต่วันนี้ เรามีตัวช่วย หากคุณเข้าร่วมอบรม ในงาน “TWA Skills: Web for Life” ทำเว็บไซต์ด้วยเครื่องมือ Google …