Tag Archives: ai inference

Amazon เตรียมลงทุนใน Anthropic เพิ่ม 800,000 ล้านบาท ส่วน Anthropic บอกจะใช้ AWS 3.2 ล้านล้านบาทในอีก 10 ปี เตรียมขยาย Claude สู่เอเชียและยุโรป

Amazon และ Anthropic ได้ออกมาเผยถึงความร่วมมือในอนาคต โดยทาง Amazon นั้นจะลงทุนใน Anthropic เป็นเงินสดเพิ่มที่ 5,000 ล้านเหรียญหรือราวๆ 160,000 ล้านบาททันที และจะลงทุนเพิ่มอีก 20,000 ล้านเหรียญหรือ 640,000 ล้านบาทในอนาคต

Read More »

Microsoft เปิดตัว Maia 200 ชิป AI สำหรับ Cloud ประสิทธิภาพแรงกว่าคู่แข่ง 3 เท่า

Microsoft เปิดตัว Maia 200 ชิป AI รุ่นที่ 2 ที่พัฒนาขึ้นเอง โดยระบุว่าเป็นชิปที่ทรงพลังที่สุดในบรรดาผู้ให้บริการ Public Cloud ทุกราย พร้อมประสิทธิภาพเหนือกว่า AWS Trainium ถึง 3 เท่าในบาง Benchmark

Read More »

Oracle เปิดตัว OCI Ampere A4 Standard Instance ใช้ CPU AmpereOne M ประสิทธิภาพสูงขึ้น 35%

Oracle ประกาศเปิดตัว OCI Ampere A4 Standard Instance รุ่นใหม่ล่าสุดในตระกูล Arm-based Compute ใช้ CPU AmpereOne M มอบประสิทธิภาพสูงขึ้น 35% พร้อม Memory Bandwidth เพิ่มขึ้น 2 เท่า เหมาะสำหรับ Cloud-native Applications และ AI Inference

Read More »

AMD เข้าซื้อกิจการ MK1 เสริมความสามารถ Inference และ Reasoning บนชิป AI Instinct GPU

AMD ประกาศเข้าซื้อกิจการ MK1 บริษัท Startup ที่พัฒนาซอฟต์แวร์สำหรับเพิ่มประสิทธิภาพการทำ inference และ reasoning บนชิปประมวลผล AI เพื่อเสริมความแข็งแกร่งให้กับ Instinct GPU

Read More »

Qualcomm เปิดตัว AI200 และ AI250 โซลูชัน Data Center สำหรับ AI Inference ระดับ Rack-Scale

Qualcomm Technologies ประกาศเปิดตัวโซลูชัน AI Inference รุ่นใหม่สำหรับ Data Center ด้วยชิป AI200 และ AI250 ที่ออกแบบมาเพื่อรองรับการประมวลผล Generative AI แบบ Rack-Scale พร้อมหน่วยความจำขนาดใหญ่และต้นทุนการดำเนินงานที่คุ้มค่า

Read More »

NVIDIA เปิดตัว Rubin CPX GPU ใหม่รองรับการประมวลผล Million-Token Context สำหรับ AI Inference

NVIDIA ประกาศเปิดตัว Rubin CPX ซึ่งเป็น GPU ประเภทใหม่ที่ออกแบบมาเฉพาะเพื่อรองรับการประมวลผล Massive-Context Processing สามารถจัดการงานประมวลผล AI ในการเขียนโค้ดและสร้างวิดีโอระดับ Million-Token

Read More »

OpenRouter ระดมทุน 40 ล้านดอลลาร์ พัฒนา AI Inference API สำหรับองค์กร

OpenRouter ผู้ให้บริการ AI Inference API ประกาศระดมทุนสำเร็จ 40 ล้านดอลลาร์ จาก Andreessen Horowitz และ Menlo Ventures เพื่อขยายบริการที่ช่วยให้นักพัฒนาเข้าถึงโมเดล AI จากกว่า 60 บริษัทผ่าน API เดียว

Read More »

ธุรกิจยุค AI – ความไวคือปีศาจ Gen AI คืออาวุธลับ

ในยุคที่เทคโนโลยีเปลี่ยนแปลงอย่างรวดเร็ว ธุรกิจต่างๆ จำเป็นต้องปรับตัวให้ทันต่อการเปลี่ยนแปลง เพื่อรักษาความสามารถในการแข่งขัน ความไวในการตอบสนองต่อความต้องการของลูกค้าและตลาดจึงเป็นสิ่งสำคัญอย่างยิ่ง องค์กรใดที่สามารถนำเทคโนโลยีมาใช้ได้อย่างรวดเร็วและมีประสิทธิภาพ จะสามารถสร้างความได้เปรียบในการแข่งขันได้อย่างยั่งยืน

Read More »

AMD เปิดตัว Threadripper Pro 9000 และ Radeon AI Pro R9700

AMD เปิดตัว CPU ใหม่ตระกูล Threadripper Pro 9000 พร้อม GPU Radeon AI Pro R9700 ที่มาพร้อม RDNA 4 และ vRAM 32GB สำหรับตลาด workstation

Read More »

AI Inference คืออะไร?

หลายคนคงเคยเห็นคำว่า AI Inference ตามประกาศหน้าข่าวเกี่ยวกับ AI โดยเฉพาะประสิทธิภาพในด้านของฮาร์ดแวร์ว่าจะช่วยกระบวนการ AI Inference ได้ดีขึ้นกี่เท่าหรือกี่ % เทียบกับรุ่นก่อนหน้าหรือผลิตภัณฑ์ของคู่แข่งแล้ว AI Inference มีความหมายอย่างไรกันแน่มาติดตามกันได้ในบทความนี้

Read More »

Google Cloud Run ประกาศรองรับการทำ AI Inference ด้วย GPU Nvidia L4

Google Cloud ประกาศเพิ่มการรองรับ GPU Nvidia L4 สำหรับ Google Cloud Run แพลตฟอร์ม Serverless เพื่อช่วยให้นักพัฒนาสามารถรันแอปพลิเคชัน AI บน Cloud ได้ง่ายและรวดเร็วยิ่งขึ้น

Read More »

Ampere จับมือ Qualcomm พัฒนาโซลูชันฮาร์ดแวร์สำหรับทำ AI Inference

Ampere จับมือ Qualcomm พัฒนาโซลูชันฮาร์ดแวร์สำหรับทำ AI Inference แบบประหยัดพลังงาน

Read More »

Intel เปิดตัว Gaudi 3 ชิปประมวลผล AI

Intel เปิดตัว Gaudi 3 ชิปประมวลผล AI รุ่นใหม่ ประสิทธิภาพดีขึ้น 4 เท่า

Read More »

NVIDIA เปิดตัว TensorRT-LLM ช่วยเร่งความเร็วการทำ Inference สำหรับ Large Language Model

NVIDIA เปิดตัว TensorRT-LLM ช่วยเร่งความเร็วการทำ Inference สำหรับ Large Language Model บน NVIDIA H100 GPU

Read More »

MLCommons ออกรายงานผลทดสอบ MLPerf Inference benchmark ล่าสุด

MLCommons รายงานผลทดสอบ MLPerf Inference benchmark ฉบับล่าสุด ประกอบด้วยผลทดสอบมากกว่า 5,300 รายการ

Read More »