TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย

Tag Archives: ai inference

Amazon เตรียมลงทุนใน Anthropic เพิ่ม 800,000 ล้านบาท ส่วน Anthropic บอกจะใช้ AWS 3.2 ล้านล้านบาทในอีก 10 ปี เตรียมขยาย Claude สู่เอเชียและยุโรป

techtalkthai April 21, 2026 AI, Anthropic, AWS, Cloud and Systems, Cloud Services, Products

Amazon และ Anthropic ได้ออกมาเผยถึงความร่วมมือในอนาคต โดยทาง Amazon นั้นจะลงทุนใน Anthropic เป็นเงินสดเพิ่มที่ 5,000 ล้านเหรียญหรือราวๆ 160,000 ล้านบาททันที และจะลงทุนเพิ่มอีก 20,000 ล้านเหรียญหรือ 640,000 ล้านบาทในอนาคต

Microsoft เปิดตัว Maia 200 ชิป AI สำหรับ Cloud ประสิทธิภาพแรงกว่าคู่แข่ง 3 เท่า

เด็กฝึกงาน TechTalkThai หมายเลข 1 January 27, 2026 AI, Cloud and Systems, Microsoft, Products

Microsoft เปิดตัว Maia 200 ชิป AI รุ่นที่ 2 ที่พัฒนาขึ้นเอง โดยระบุว่าเป็นชิปที่ทรงพลังที่สุดในบรรดาผู้ให้บริการ Public Cloud ทุกราย พร้อมประสิทธิภาพเหนือกว่า AWS Trainium ถึง 3 เท่าในบาง Benchmark

Oracle เปิดตัว OCI Ampere A4 Standard Instance ใช้ CPU AmpereOne M ประสิทธิภาพสูงขึ้น 35%

เด็กฝึกงาน TechTalkThai หมายเลข 1 December 16, 2025 Cloud and Systems, Cloud Services, Oracle, Products

Oracle ประกาศเปิดตัว OCI Ampere A4 Standard Instance รุ่นใหม่ล่าสุดในตระกูล Arm-based Compute ใช้ CPU AmpereOne M มอบประสิทธิภาพสูงขึ้น 35% พร้อม Memory Bandwidth เพิ่มขึ้น 2 เท่า เหมาะสำหรับ Cloud-native Applications และ AI Inference

AMD เข้าซื้อกิจการ MK1 เสริมความสามารถ Inference และ Reasoning บนชิป AI Instinct GPU

เด็กฝึกงาน TechTalkThai หมายเลข 1 November 12, 2025 AI, AMD, Cloud and Systems, GPU, Products, Server and Storage

AMD ประกาศเข้าซื้อกิจการ MK1 บริษัท Startup ที่พัฒนาซอฟต์แวร์สำหรับเพิ่มประสิทธิภาพการทำ inference และ reasoning บนชิปประมวลผล AI เพื่อเสริมความแข็งแกร่งให้กับ Instinct GPU

Qualcomm เปิดตัว AI200 และ AI250 โซลูชัน Data Center สำหรับ AI Inference ระดับ Rack-Scale

เด็กฝึกงาน TechTalkThai หมายเลข 1 October 28, 2025 AI, Cloud and Systems, GPU, Products, Qualcomm, Server and Storage

Qualcomm Technologies ประกาศเปิดตัวโซลูชัน AI Inference รุ่นใหม่สำหรับ Data Center ด้วยชิป AI200 และ AI250 ที่ออกแบบมาเพื่อรองรับการประมวลผล Generative AI แบบ Rack-Scale พร้อมหน่วยความจำขนาดใหญ่และต้นทุนการดำเนินงานที่คุ้มค่า

NVIDIA เปิดตัว Rubin CPX GPU ใหม่รองรับการประมวลผล Million-Token Context สำหรับ AI Inference

เด็กฝึกงาน TechTalkThai หมายเลข 1 September 10, 2025 AI, Cloud and Systems, GPU, NVidia, Products, Server and Storage

NVIDIA ประกาศเปิดตัว Rubin CPX ซึ่งเป็น GPU ประเภทใหม่ที่ออกแบบมาเฉพาะเพื่อรองรับการประมวลผล Massive-Context Processing สามารถจัดการงานประมวลผล AI ในการเขียนโค้ดและสร้างวิดีโอระดับ Million-Token

OpenRouter ระดมทุน 40 ล้านดอลลาร์ พัฒนา AI Inference API สำหรับองค์กร

เด็กฝึกงาน TechTalkThai หมายเลข 1 June 27, 2025 AI, Cloud and Systems

OpenRouter ผู้ให้บริการ AI Inference API ประกาศระดมทุนสำเร็จ 40 ล้านดอลลาร์ จาก Andreessen Horowitz และ Menlo Ventures เพื่อขยายบริการที่ช่วยให้นักพัฒนาเข้าถึงโมเดล AI จากกว่า 60 บริษัทผ่าน API เดียว

ธุรกิจยุค AI – ความไวคือปีศาจ Gen AI คืออาวุธลับ

techtalkthai June 12, 2025 AI, Cloud and Systems, Featured Posts, Products, Softnix

ในยุคที่เทคโนโลยีเปลี่ยนแปลงอย่างรวดเร็ว ธุรกิจต่างๆ จำเป็นต้องปรับตัวให้ทันต่อการเปลี่ยนแปลง เพื่อรักษาความสามารถในการแข่งขัน ความไวในการตอบสนองต่อความต้องการของลูกค้าและตลาดจึงเป็นสิ่งสำคัญอย่างยิ่ง องค์กรใดที่สามารถนำเทคโนโลยีมาใช้ได้อย่างรวดเร็วและมีประสิทธิภาพ จะสามารถสร้างความได้เปรียบในการแข่งขันได้อย่างยั่งยืน

AMD เปิดตัว Threadripper Pro 9000 และ Radeon AI Pro R9700

เด็กฝึกงาน TechTalkThai หมายเลข 1 May 22, 2025 AMD, CPU, GPU, Mobile Enterprise, PC & Laptop, Products, Server and Storage

AMD เปิดตัว CPU ใหม่ตระกูล Threadripper Pro 9000 พร้อม GPU Radeon AI Pro R9700 ที่มาพร้อม RDNA 4 และ vRAM 32GB สำหรับตลาด workstation

AI Inference คืออะไร?

nattakon February 3, 2025 IT Knowledge, What is

หลายคนคงเคยเห็นคำว่า AI Inference ตามประกาศหน้าข่าวเกี่ยวกับ AI โดยเฉพาะประสิทธิภาพในด้านของฮาร์ดแวร์ว่าจะช่วยกระบวนการ AI Inference ได้ดีขึ้นกี่เท่าหรือกี่ % เทียบกับรุ่นก่อนหน้าหรือผลิตภัณฑ์ของคู่แข่งแล้ว AI Inference มีความหมายอย่างไรกันแน่มาติดตามกันได้ในบทความนี้

Google Cloud Run ประกาศรองรับการทำ AI Inference ด้วย GPU Nvidia L4

เด็กฝึกงาน TechTalkThai หมายเลข 1 August 22, 2024 AI, Cloud and Systems, Google, NVidia, Products

Google Cloud ประกาศเพิ่มการรองรับ GPU Nvidia L4 สำหรับ Google Cloud Run แพลตฟอร์ม Serverless เพื่อช่วยให้นักพัฒนาสามารถรันแอปพลิเคชัน AI บน Cloud ได้ง่ายและรวดเร็วยิ่งขึ้น

Ampere จับมือ Qualcomm พัฒนาโซลูชันฮาร์ดแวร์สำหรับทำ AI Inference

เด็กฝึกงาน TechTalkThai หมายเลข 1 May 17, 2024 ARM, Products, Qualcomm

Ampere จับมือ Qualcomm พัฒนาโซลูชันฮาร์ดแวร์สำหรับทำ AI Inference แบบประหยัดพลังงาน

Intel เปิดตัว Gaudi 3 ชิปประมวลผล AI

เด็กฝึกงาน TechTalkThai หมายเลข 1 April 10, 2024 AI, Cloud and Systems, Intel, Products

Intel เปิดตัว Gaudi 3 ชิปประมวลผล AI รุ่นใหม่ ประสิทธิภาพดีขึ้น 4 เท่า

NVIDIA เปิดตัว TensorRT-LLM ช่วยเร่งความเร็วการทำ Inference สำหรับ Large Language Model

เด็กฝึกงาน TechTalkThai หมายเลข 1 September 12, 2023 AI, Cloud and Systems, GPU, NVidia, Products, Server and Storage

NVIDIA เปิดตัว TensorRT-LLM ช่วยเร่งความเร็วการทำ Inference สำหรับ Large Language Model บน NVIDIA H100 GPU

MLCommons ออกรายงานผลทดสอบ MLPerf Inference benchmark ล่าสุด

เด็กฝึกงาน TechTalkThai หมายเลข 1 September 9, 2022 AI, Cloud and Systems, IT Knowledge, IT Trends and Updates

MLCommons รายงานผลทดสอบ MLPerf Inference benchmark ฉบับล่าสุด ประกอบด้วยผลทดสอบมากกว่า 5,300 รายการ