OpenAI ร่วมกับ Broadcom เปิดตัว Jalapeño ชิป Intelligence Processor ตัวแรกของ OpenAI ที่ออกแบบมาเพื่องาน inference ของ LLM โดยเฉพาะ พร้อมเตรียมนำไปใช้งานในระดับ gigawatt scale ภายในสิ้นปี 2026

Jalapeño เป็น AI accelerator ตัวแรกในแพลตฟอร์มด้านการประมวลผลแบบ multi-generation ที่ทั้งสองบริษัทพัฒนาร่วมกัน โดย OpenAI ออกแบบชิปขึ้นใหม่ตั้งแต่ต้นจากความเข้าใจในพื้นฐานการทำงานของ LLM ทั้ง kernel, serving system และความต้องการของผลิตภัณฑ์จริง ขณะที่ Broadcom รับผิดชอบส่วน chip implementation, networking และการผลิตในระดับ large-scale ส่วน Celestica ดูแลด้าน board, rack และการประกอบระบบ ปัจจุบัน engineering sample ของ Jalapeño กำลังรัน ML workload อยู่ในห้องแล็บที่ความถี่และระดับพลังงานตามเป้าหมายการผลิตจริง รวมถึงการรันโมเดล GPT-5.3-Codex-Spark ด้วย
จุดเด่นสำคัญของ Jalapeño คือการออกแบบใหม่ทั้งหมดสำหรับงาน inference ของ LLM ยุคปัจจุบัน ไม่ใช่การนำ accelerator สำหรับงาน AI แบบทั่วไปมาปรับใช้ สถาปัตยกรรมเน้นลดการเคลื่อนย้ายข้อมูล (data movement) และจัดสมดุลทรัพยากรด้าน compute, memory และ networking เพื่อให้ได้ utilization ที่ใกล้เคียงกับประสิทธิภาพสูงสุดทางทฤษฎีมากขึ้น โดยใช้เทคโนโลยี networking ของ Broadcom รวมถึงชิป Tomahawk เข้ามาช่วยรองรับการผลิตในระดับ large-scale แม้ OpenAI จะยังอยู่ระหว่างการวัดประสิทธิภาพขั้นสุดท้าย แต่ผลการทดสอบในช่วงแรกชี้ว่า Jalapeño จะให้ performance per watt ที่ดีกว่าเทคโนโลยี state-of-the-art ในปัจจุบันอย่างมีนัยสำคัญ และจะมีรายงานทางเทคนิคโดยละเอียดตามมาในอีกไม่กี่เดือนข้างหน้า
อีกประเด็นที่น่าสนใจคือ Jalapeño ใช้เวลาพัฒนาตั้งแต่ขั้นออกแบบจนถึง manufacturing tape-out เพียง 9 เดือน ซึ่ง OpenAI ระบุว่าเป็นรอบการพัฒนา ASIC ที่เร็วที่สุดเท่าที่เคยมีมาในกลุ่ม semiconductor ประสิทธิภาพสูง โดยส่วนหนึ่งเป็นผลจากการนำโมเดล AI ของ OpenAI เองมาช่วยเร่งกระบวนการออกแบบและ optimization ทำให้โมเดลที่ให้บริการผู้ใช้งานอยู่กลายเป็นเครื่องมือช่วยพัฒนา infrastructure สำหรับรันโมเดลรุ่นถัดไป
Jalapeño ถือเป็นก้าวแรกของแพลตฟอร์มการประมวลผลแบบ multi-generation ที่วางแผนเริ่ม deploy ช่วงแรกภายในสิ้นปี 2026 และจะขยายต่อในปีถัด ๆ ไป โดย Broadcom ระบุว่าการ deploy data center ระดับ gigawatt scale จะเริ่มต้นในปี 2026 ร่วมกับ Microsoft และพันธมิตรรายอื่น ซึ่งสะท้อนกลยุทธ์ full-stack ของ OpenAI ที่ขยายจากการพัฒนาโมเดลและผลิตภัณฑ์ มาสู่การออกแบบ infrastructure ระดับชิปด้วยตนเอง เพื่อให้บริการ AI ได้เร็วขึ้น เสถียรขึ้น และเข้าถึงได้ในวงกว้างมากขึ้น
ที่มา: https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย








