Amazon และ Anthropic ได้ออกมาเผยถึงความร่วมมือในอนาคต โดยทาง Amazon นั้นจะลงทุนใน Anthropic เป็นเงินสดเพิ่มที่ 5,000 ล้านเหรียญหรือราวๆ 160,000 ล้านบาททันที และจะลงทุนเพิ่มอีก 20,000 ล้านเหรียญหรือ 640,000 ล้านบาทในอนาคต
Read More »Microsoft เปิดตัว Maia 200 ชิป AI สำหรับ Cloud ประสิทธิภาพแรงกว่าคู่แข่ง 3 เท่า
Microsoft เปิดตัว Maia 200 ชิป AI รุ่นที่ 2 ที่พัฒนาขึ้นเอง โดยระบุว่าเป็นชิปที่ทรงพลังที่สุดในบรรดาผู้ให้บริการ Public Cloud ทุกราย พร้อมประสิทธิภาพเหนือกว่า AWS Trainium ถึง 3 เท่าในบาง Benchmark
Read More »Oracle เปิดตัว OCI Ampere A4 Standard Instance ใช้ CPU AmpereOne M ประสิทธิภาพสูงขึ้น 35%
Oracle ประกาศเปิดตัว OCI Ampere A4 Standard Instance รุ่นใหม่ล่าสุดในตระกูล Arm-based Compute ใช้ CPU AmpereOne M มอบประสิทธิภาพสูงขึ้น 35% พร้อม Memory Bandwidth เพิ่มขึ้น 2 เท่า เหมาะสำหรับ Cloud-native Applications และ AI Inference
Read More »AMD เข้าซื้อกิจการ MK1 เสริมความสามารถ Inference และ Reasoning บนชิป AI Instinct GPU
AMD ประกาศเข้าซื้อกิจการ MK1 บริษัท Startup ที่พัฒนาซอฟต์แวร์สำหรับเพิ่มประสิทธิภาพการทำ inference และ reasoning บนชิปประมวลผล AI เพื่อเสริมความแข็งแกร่งให้กับ Instinct GPU
Read More »Qualcomm เปิดตัว AI200 และ AI250 โซลูชัน Data Center สำหรับ AI Inference ระดับ Rack-Scale
Qualcomm Technologies ประกาศเปิดตัวโซลูชัน AI Inference รุ่นใหม่สำหรับ Data Center ด้วยชิป AI200 และ AI250 ที่ออกแบบมาเพื่อรองรับการประมวลผล Generative AI แบบ Rack-Scale พร้อมหน่วยความจำขนาดใหญ่และต้นทุนการดำเนินงานที่คุ้มค่า
Read More »NVIDIA เปิดตัว Rubin CPX GPU ใหม่รองรับการประมวลผล Million-Token Context สำหรับ AI Inference
NVIDIA ประกาศเปิดตัว Rubin CPX ซึ่งเป็น GPU ประเภทใหม่ที่ออกแบบมาเฉพาะเพื่อรองรับการประมวลผล Massive-Context Processing สามารถจัดการงานประมวลผล AI ในการเขียนโค้ดและสร้างวิดีโอระดับ Million-Token
Read More »OpenRouter ระดมทุน 40 ล้านดอลลาร์ พัฒนา AI Inference API สำหรับองค์กร
OpenRouter ผู้ให้บริการ AI Inference API ประกาศระดมทุนสำเร็จ 40 ล้านดอลลาร์ จาก Andreessen Horowitz และ Menlo Ventures เพื่อขยายบริการที่ช่วยให้นักพัฒนาเข้าถึงโมเดล AI จากกว่า 60 บริษัทผ่าน API เดียว
Read More »ธุรกิจยุค AI – ความไวคือปีศาจ Gen AI คืออาวุธลับ
ในยุคที่เทคโนโลยีเปลี่ยนแปลงอย่างรวดเร็ว ธุรกิจต่างๆ จำเป็นต้องปรับตัวให้ทันต่อการเปลี่ยนแปลง เพื่อรักษาความสามารถในการแข่งขัน ความไวในการตอบสนองต่อความต้องการของลูกค้าและตลาดจึงเป็นสิ่งสำคัญอย่างยิ่ง องค์กรใดที่สามารถนำเทคโนโลยีมาใช้ได้อย่างรวดเร็วและมีประสิทธิภาพ จะสามารถสร้างความได้เปรียบในการแข่งขันได้อย่างยั่งยืน
Read More »AMD เปิดตัว Threadripper Pro 9000 และ Radeon AI Pro R9700
AMD เปิดตัว CPU ใหม่ตระกูล Threadripper Pro 9000 พร้อม GPU Radeon AI Pro R9700 ที่มาพร้อม RDNA 4 และ vRAM 32GB สำหรับตลาด workstation
Read More »AI Inference คืออะไร?
หลายคนคงเคยเห็นคำว่า AI Inference ตามประกาศหน้าข่าวเกี่ยวกับ AI โดยเฉพาะประสิทธิภาพในด้านของฮาร์ดแวร์ว่าจะช่วยกระบวนการ AI Inference ได้ดีขึ้นกี่เท่าหรือกี่ % เทียบกับรุ่นก่อนหน้าหรือผลิตภัณฑ์ของคู่แข่งแล้ว AI Inference มีความหมายอย่างไรกันแน่มาติดตามกันได้ในบทความนี้
Read More »Google Cloud Run ประกาศรองรับการทำ AI Inference ด้วย GPU Nvidia L4
Google Cloud ประกาศเพิ่มการรองรับ GPU Nvidia L4 สำหรับ Google Cloud Run แพลตฟอร์ม Serverless เพื่อช่วยให้นักพัฒนาสามารถรันแอปพลิเคชัน AI บน Cloud ได้ง่ายและรวดเร็วยิ่งขึ้น
Read More »Ampere จับมือ Qualcomm พัฒนาโซลูชันฮาร์ดแวร์สำหรับทำ AI Inference
Ampere จับมือ Qualcomm พัฒนาโซลูชันฮาร์ดแวร์สำหรับทำ AI Inference แบบประหยัดพลังงาน
Read More »Intel เปิดตัว Gaudi 3 ชิปประมวลผล AI
Intel เปิดตัว Gaudi 3 ชิปประมวลผล AI รุ่นใหม่ ประสิทธิภาพดีขึ้น 4 เท่า
Read More »NVIDIA เปิดตัว TensorRT-LLM ช่วยเร่งความเร็วการทำ Inference สำหรับ Large Language Model
NVIDIA เปิดตัว TensorRT-LLM ช่วยเร่งความเร็วการทำ Inference สำหรับ Large Language Model บน NVIDIA H100 GPU
Read More »MLCommons ออกรายงานผลทดสอบ MLPerf Inference benchmark ล่าสุด
MLCommons รายงานผลทดสอบ MLPerf Inference benchmark ฉบับล่าสุด ประกอบด้วยผลทดสอบมากกว่า 5,300 รายการ
Read More »
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย





