Microsoft Azure by Ingram Micro (Thailand)

Google เปิดตัว TPU v5p และ AI Hypercomputer สถาปัตยกรรมใหม่สำหรับ Supercomputer แห่งอนาคต

สัปดาห์ที่ผ่านมา Google ได้ออกมาประกาศเปิดตัวถึง 2 สิ่งใหม่สำหรับการประมวลผล AI ได้แก่ Google Cloud TPU v5p ระบบ AI Accelerator รุ่นใหม่ล่าสุดที่มีความเร็ว, การเพิ่มขยาย และความยืดหยุ่นสูงสุดเท่าที่เคยมีมา และ AI Hypercomputer สถาปัตยกรรม Supercomputer ใหม่บน Google Cloud สำหรับรองรับงาน AI โดยเฉพาะ

Credit: Google

 

สำหรับ Google Cloud TPU v5p นี้จะถูกติดตั้งในแบบ Pod โดยแต่ละ Pod จะมีชิปมากถึง 8,960 ชิป พร้อมการเชื่อมต่อแบบ Inter-Chip Interconnect (ICI) ทีความเร็วสูงถึง 4,800Gbps/Chip บน 3D Torus Topology

เมื่อเทียบกับ TPU v4 แล้ว TPU v5p จะมี FLOPS สูงกว่าถึง 2 เท่า และมี High-Bandwidth Memory (HBM) สูงกว่าถึง 3 เท่า ทำให้สามารถเทรน LLM Model ขนาดใหญ่ได้เร็วขึ้นถึง 2.8 เท่า และเทรน Embedding-Dense Model ได้เร็วขึ้นถึง 1.9 เท่า

Credit: Google

 

ทางด้าน AI Hypercomputer นั้น Google ได้เล็งเห็นมาเป็นเวลานานแล้วว่า Hardware และ Software แบบดั้งเดิมนั้นไม่สามารถตอบโจทย์ของการทำ AI/ML ได้อย่างเพียงพอ จึงได้ผสานรวมงานวิจัยและการพัฒนาในช่วงหลายสิบปีที่ผ่านมา นำมาออกแบบสถาปัตยกรรมใหม่เพื่อรองรับ AI Workload โดยเฉพาะ ดังนี้

Credit: Google

 

  • ใช้ Hardware ที่ปรับปรุงด้านประสิทธิภาพมาโดยเฉพาะ ตั้งแต่การใช้ Ultrascale Data Center Infrastructure เพื่อให้มีความหนาแน่นสูงสุด, การระบายความร้อนด้วยของเหลว, การใช้ระบบเครือข่ายบนเทคโนโลยี Jupiter Data Center Network ที่ Google พัฒนาขึ้นมาเอง ไปจนถึงการใช้พลังงานสะอาด, การใช้น้ำอย่างมีประสิทธิภาพ และการมุ่งสู่เป้าหมาย Carbon-Free
  • ใช้ Open Software เพื่อให้นักพัฒนาสามารถใช้งาน Software เพื่อปรับแต่ง, บริหารจัดการ และทำการ Train และ Inference สำหรับ AI ได้อย่างมีประสิทธิภาพสูงสุด โดยรองรับ ML Framework อย่าง JAX, TensorFlow, PyTorch พร้อมทั้งรองรับการทำ Multislice Training และ Multihost Inferencing ได้ ทำให้การรองรับ AI Workload เหล่านี้ง่ายดายและต่อเนื่องมากยิ่งขึ้น อีกทั้งยังสามารถทำงานร่วมกับ Google Kubernetes Engine (GKE) และ Google Compute Engine เพื่อให้สามารถบริหารจัดการทรัพยากรเป็นไปได้ง่ายด้วยประสบการณ์ของ Cloud
  • คิดค่าใช้จ่ายแบบยืดหยุ่น ด้วยการคำนวณค่าใช้จ่ายผ่านทาง Dynamic Workload Scheduler ที่สามารถเลือกใช้ได้ทั้งแบบ Flex Start Mode ที่จะได้รับทรัพยากรมาใช้งานมากกว่าและประหยัดกว่า กับแบบ Calendar Mode ที่ต้องการความแน่นอนสำหรับกำหนดการการประมวลผล

 

ที่มา: https://cloud.google.com/blog/products/ai-machine-learning/introducing-cloud-tpu-v5p-and-ai-hypercomputer

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Brother ประกาศวิสัยทัศน์ “ทรานส์ฟอร์มเพื่ออนาคตที่ยั่งยืน” พร้อมตั้งเป้าโต 7% ในปี 2568

Brother ผู้นำโซลูชันด้านการพิมพ์จากประเทศญี่ปุ่นที่ดำเนินธุรกิจในประเทศไทยมากว่า 28 ปีแล้ว ล่าสุดปลายสัปดาห์ที่ผ่านมาได้ประกาศความสำเร็จโดยปิดปีงบประมาณ 2567 เติบโตโดยภาพรวมถึง 9% สูงกว่าตลาดโดยรวมเกือบ 2 เท่า พร้อมประกาศวิสัยทัศน์ “Transforming for a …

การ์ทเนอร์คาดการณ์ อีกสองปี AI Agents จะทำให้เวลาที่ใช้โจมตีช่องโหว่ของบัญชีลดลงถึง 50% [PR]  

การ์ทเนอร์คาดการณ์ในอีกสองปีข้างหน้านี้ (พ.ศ.2570) AI Agents จะลดเวลาในการโจมตีช่องโหว่ของบัญชีลง 50%