เมื่อต้นเดือนมิถุนายนที่ผ่านมา Intel ที่มีการปรับโครงสร้างองค์กรขนานใหญ่ ซึ่งหน่วยงานใหม่นั่นก็คือ ‘Accelerated Computing Unit’ ซึ่ง Raja M. Koduri, ผู้อำนวยการอวุโสคนใหม่ชี้ว่าชิปทุกตัวไม่ว่าจะเป็น CPU, GPU และ IPU ต่างมีความสามารถด้าน Matrix Accelerator
Koduri เชื่อว่าการพัฒนาประสิทธิภาพของการทำ Matrix Multiplication คือหัวใจสำคัญของ Neural Network และ Intel จะต้องมีชิปประมวลผลสำหรับ Machine Learning และ Deep Learning ที่เร็วที่สุด แม้กระทั่งงานด้านอื่นๆที่เกี่ยวข้องกับ AI และในงาน Architecture เมื่อไม่กี่วันก่อน Intel ก็ได้แสดงแสนยานุภาพใหม่ๆ ออกมาเช่น
1.) ‘Ponte Vecchio’ GPU ตัวใหม่ที่กำลังจะคลอดออกมาแสดงผลได้เหนือกว่า GPU A100 จากค่าย Nvidia ด้วยการรันเทียบระหว่างงานจัดประเภทรูปภาพด้วย ResNet-50 NN ซึ่งทำลายสถิติด้วยการประมวลผลรูปภ่พได้ถึง 3,400 ภาพต่อวินาทีจากสถิติเดิม 3,000 ภาพ ในมุม Inference สามารถทำนายภาพได้ที่ 43,000 ภาพต่อวินาทีจากเดิม 40,000 ภาพ
2.) สถาปัตยกรรมการออกแบบชิปกำลังเปลี่ยนไป โดยจะใส่ใจเรื่องของการควบคุม datapath เช่น การเก็บและกู้คืนตัวเลข หรือการเคลื่อนไหวของคำสั่งรอบๆชิป ซึ่งเรื่องนี้ Intel ได้คิดมาสักพักใหญ่แล้ว และในงานนี้เองยังมีการเปิดตัวเทคโนโลยีที่ชื่อ Thread Director หรือสิ่งที่ทำหน้าที่ควบคุมว่ามีการทำ Schedule การ Execute Thread บนหน่วยประมวลผลอย่างไร เช่น การใช้พลังงาน หรือเพื่อลดงานให้ OS ซึ่ง Koduri กล่าวว่า “ทุกทางที่ OS ปฏิสัมพันธ์กับ Hardware ก็คือสิ่งใหม่ๆของฮาร์ดแวร์” ด้วยเหตุนี้เองการให้ข้อมูล telemetry สถานะของคอร์และคำสั่งของ Thread จะเสริมพลังให้ OS สามารถจัดการงานได้ดีขึ้น
3.) วิธีการที่ CPU ใช้งาน Memory Bandwidth ก็มีเรื่องใหม่ๆเช่นกัน นั่นก็คือ Sapphire Rapids หรือชิประดับดาต้าเซ็นเตอร์ตัวใหม่ที่กำลังออกมาจะสามารถกระจายข้อมูลผ่านได้ทั้ง DDR5 และ high-bandwidth HBM memory โดยไม่ต้องให้แอปพลิเคชันรู้เกี่ยวกับชิปเลย ยิ่งดีกับงานด้าน AI ที่มักต้องการทั้งเรื่อง Memory และ I/O
4.) Sapphire Rapids ซึ่งเป็นชิปใหม่ของตระกูล Xeon จะทำงานได้ที่ 2,048 คำสั่งต่อสัญญาณนาฬิกาบนข้อมูล Integer ขนาด 8 บิต ด้วยเทคโนโลยี advance matrix extension (AMX) หรือกระบวนการทำ Matrix Multiplication แบบพิเศษที่สามารถทำงานได้ข้าม Tile ของแต่ละชิป ซึ่งถ้าดูรูปประกอบด้านล่างจะเห็นว่าชิปถูกแบ่งออกเป็น 4 Tile ที่แต่ละตัวมี CPU, Accelerator และ Input/Output ของตัวเอง อย่างไรก็ดี OS จะมองว่าทั้งหมดคือ CPU เดียวกัน โดยแต่ละชิปมีสะพานเชื่อมต่อการทำงานเข้าหากัน ทั้งนี้ Koduri เสริมว่าสิ้นสุดยุคของ Mooer Law แล้ว ทำให้ Intel พยายามพัฒนาสิ่งเทคโนโลยีการผลิตที่เรียกว่า ‘Intel7’ (เปลี่ยนชื่อมากจาก 10nm Enhanced SuperFin) ซึ่งคือการเพิ่มทรานซิสเตอร์แบบ 3 แกนที่มีประสิทธิภาพมากขึ้น
สุดท้ายแล้ว Koduri ปิดท้ายว่า “Workload กำลังมุ่งหน้าไปทาง CPU, GPU และ DPU และ Memory จะคุยกับทางอื่นมากขึ้น องค์ประกอบเหล่านี้จะประสานงานกันมากขึ้นเพื่อทำให้งานสำเร็จ ซึ่งแตกต่างจากยุค 5 ปีแรกของ Deep Learning (2016-2021) “
ที่มา : https://www.zdnet.com/article/intel-architect-koduri-says-every-chip-will-be-a-neural-net-processor/