Google เปิดตัว TPU v5p และ AI Hypercomputer สถาปัตยกรรมใหม่สำหรับ Supercomputer แห่งอนาคต

สัปดาห์ที่ผ่านมา Google ได้ออกมาประกาศเปิดตัวถึง 2 สิ่งใหม่สำหรับการประมวลผล AI ได้แก่ Google Cloud TPU v5p ระบบ AI Accelerator รุ่นใหม่ล่าสุดที่มีความเร็ว, การเพิ่มขยาย และความยืดหยุ่นสูงสุดเท่าที่เคยมีมา และ AI Hypercomputer สถาปัตยกรรม Supercomputer ใหม่บน Google Cloud สำหรับรองรับงาน AI โดยเฉพาะ

Credit: Google

 

สำหรับ Google Cloud TPU v5p นี้จะถูกติดตั้งในแบบ Pod โดยแต่ละ Pod จะมีชิปมากถึง 8,960 ชิป พร้อมการเชื่อมต่อแบบ Inter-Chip Interconnect (ICI) ทีความเร็วสูงถึง 4,800Gbps/Chip บน 3D Torus Topology

เมื่อเทียบกับ TPU v4 แล้ว TPU v5p จะมี FLOPS สูงกว่าถึง 2 เท่า และมี High-Bandwidth Memory (HBM) สูงกว่าถึง 3 เท่า ทำให้สามารถเทรน LLM Model ขนาดใหญ่ได้เร็วขึ้นถึง 2.8 เท่า และเทรน Embedding-Dense Model ได้เร็วขึ้นถึง 1.9 เท่า

Credit: Google

 

ทางด้าน AI Hypercomputer นั้น Google ได้เล็งเห็นมาเป็นเวลานานแล้วว่า Hardware และ Software แบบดั้งเดิมนั้นไม่สามารถตอบโจทย์ของการทำ AI/ML ได้อย่างเพียงพอ จึงได้ผสานรวมงานวิจัยและการพัฒนาในช่วงหลายสิบปีที่ผ่านมา นำมาออกแบบสถาปัตยกรรมใหม่เพื่อรองรับ AI Workload โดยเฉพาะ ดังนี้

Credit: Google

 

  • ใช้ Hardware ที่ปรับปรุงด้านประสิทธิภาพมาโดยเฉพาะ ตั้งแต่การใช้ Ultrascale Data Center Infrastructure เพื่อให้มีความหนาแน่นสูงสุด, การระบายความร้อนด้วยของเหลว, การใช้ระบบเครือข่ายบนเทคโนโลยี Jupiter Data Center Network ที่ Google พัฒนาขึ้นมาเอง ไปจนถึงการใช้พลังงานสะอาด, การใช้น้ำอย่างมีประสิทธิภาพ และการมุ่งสู่เป้าหมาย Carbon-Free
  • ใช้ Open Software เพื่อให้นักพัฒนาสามารถใช้งาน Software เพื่อปรับแต่ง, บริหารจัดการ และทำการ Train และ Inference สำหรับ AI ได้อย่างมีประสิทธิภาพสูงสุด โดยรองรับ ML Framework อย่าง JAX, TensorFlow, PyTorch พร้อมทั้งรองรับการทำ Multislice Training และ Multihost Inferencing ได้ ทำให้การรองรับ AI Workload เหล่านี้ง่ายดายและต่อเนื่องมากยิ่งขึ้น อีกทั้งยังสามารถทำงานร่วมกับ Google Kubernetes Engine (GKE) และ Google Compute Engine เพื่อให้สามารถบริหารจัดการทรัพยากรเป็นไปได้ง่ายด้วยประสบการณ์ของ Cloud
  • คิดค่าใช้จ่ายแบบยืดหยุ่น ด้วยการคำนวณค่าใช้จ่ายผ่านทาง Dynamic Workload Scheduler ที่สามารถเลือกใช้ได้ทั้งแบบ Flex Start Mode ที่จะได้รับทรัพยากรมาใช้งานมากกว่าและประหยัดกว่า กับแบบ Calendar Mode ที่ต้องการความแน่นอนสำหรับกำหนดการการประมวลผล

 

ที่มา: https://cloud.google.com/blog/products/ai-machine-learning/introducing-cloud-tpu-v5p-and-ai-hypercomputer


About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Tenable ออกโซลูชันใหม่ Tenable One for OT/IoT

IT ไม่ใช่ช่องทางเดียวที่จะถูกโจมตีได้ แต่ยังมีธุรกิจอีกจำนวนมากที่ต้องพึ่งพาระบบ OT และ IoT ในการปฏิบัติการ ด้วยเหตุนี้เองการรู้จักช่องโหว่ที่เป็นความเสี่ยงจึงเป็นเรื่องสำคัญไม่น้อยไปกว่าระบบ IT ล่าสุด Tenable ผู้เชี่ยวชาญด้านการบริหารจัดการช่องโหว่ได้ขยายความสามารถใหม่ให้แพลตฟอร์ม Tenable One รองรับการบริหารจัดการช่องโหว่สำหรับ …

Google เสริมแกร่ง Gemini ด้วยข้อมูลจาก Stack Overflow

Stack Overflow ถือเป็นแหล่งข้อมูลยอดนิยมของเหล่านักพัฒนาแอปพลิเคชันมานานแสนนาน ซึ่งล่าสุดได้เปิด API ที่ชื่อว่า OverflowAPI ประเดิมด้วยพาร์ทเนอร์รายแรกอย่าง Google Gemini for Google Cloud