Google พัฒนา AlphaGo ระบบ AI ที่เล่นหมากล้อมเอาชนะมนุษย์ระดับแชมป์ได้แล้ว

เป็นความสำเร็จอีกก้าวของวงการปัญญาประดิษฐ์ เมื่อ Google ได้ออกมาเปิดเผยถึงชัยชนะของซอฟต์แวร์ AlphaGo ซึ่งเป็นระบบ Machine Learning สำหรับเล่นหมากล้อมหรือโกะ ที่มีต่อผู้เล่นระดับมืออาชีพที่เคยเป็นถึงแชมป์นั่นเอง

Credit: Wikipedia
Credit: Wikipedia

หมากล้อมนั้นถือเป็นหนึ่งในเกมที่มีความซับซ้อนในระดับสูง และมีประวัติอันยาวนานมากว่า 2,500 ปี โดยปัจจุบันมีผู้เล่นทั่วโลกราวๆ 40 ล้านคน ซึ่งที่ผ่านมา การพัฒนา Artificial Intelligence (AI) หรือปัญญาประดิษฐ์ที่สามารถเล่นหมากล้อมได้นั้น ยังคงคืบหน้าไปถึงเพียงแค่การเล่นระดับมือสมัครเล่นเท่านั้น ต่างจากหมากรุกที่ IBM เคยพัฒนาให้ AI มีความสามารถในการแข่งขันกับแชมป์ระดับโลกได้มาแล้ว

ด้วยเหตุนี้ Google จึงได้เริ่มพัฒนา AI สำหรับเล่นหมากล้อมด้วยแนวคิดของการทำ Deep Neural Networks ขึ้นมาสองชุดจากการเรียนรู้ข้อมูลนับล้านข้อมูล โดยชุดแรกนี้มีชื่อว่า Policy Network สำหรับการทำนายตาถัดไปของผู้เล่นฝ่ายตรงข้าม เพื่อลดการประมวลผลให้เหลือเท่าที่จำเป็นจะต้องคิดเพื่อนำไปสู่ชัยชนะ และแนะนำตาเดินที่ดีที่สุด ในขณะที่อีกชุดนั้นมีชื่อเรียกว่า Value Network ซึ่งใช้ลดความลึกของ Search Tree ลง และประเมินความได้เปรียบเสียเปรียบในปัจจุบัน

แนวคิดนี้ช่วยให้การประมวลผลในระหว่างเล่นเกมกระดานนั้นมีปริมาณที่ลดลงจากการคิดให้ครบทุกกรณีเป็นอย่างมาก โดยจากการฝึก AI ด้วยการเดินกว่า 30 ล้านตา ก็ทำให้ AlphaGo มีความเก่งกาจขึ้นจนสามารถทำนายตาถัดไปของผู้เล่นที่เป็นมนุษย์ได้แม่นยำถึง 57% ซึ่งเหนือกว่า AI แบบอื่นๆ ที่ทำได้เพียง 44% จากนั้น Google ก็ได้พัฒนาให้ AlphaGo สามารถเรียนรู้และสร้างสรรค์ตาเดินหรือกลยุทธ์แบบใหม่ๆ ออกมาได้ด้วยตัวเองจากการแข่งขันกับตัวเองนับพันๆ ครั้ง เพื่อทดสอบตาเดินใหม่ๆ แบบ Trial-and-Error ที่เรียกว่า Reinforcement Learning

แน่นอนว่าการฝึก AI ในระดับนี้ต้องใช้พลังประมวลผลเยอะมาก และ Google Cloud Platform ก็ถูกใช้เพื่อการนี้นั่นเอง โดย CPU และ GPU จำนวนมากได้ถูกนำมาใช้ประมวลผลระบบ Open Source Deep Learning อย่าง TensorFlow

ผลลัพธ์จากการฝึก AI ครั้งนี้ถือว่าน่าประทับใจมาก โดย AlphaGo สามารถเอาชนะ AI อื่นๆ ได้ถึง 499 ครั้ง แพ้เพียง 1 ครั้ง โดยทุกครั้งที่แข่งนั้นจะมีการต่อให้ AI อื่นๆ ก่อนด้วยการวางหมากที่จุดดาวมุมกระดานก่อนถึง 4 มุมด้วยกันก่อนเริ่มเกม

ส่วนการแข่งขันกับผู้เล่นมืออาชีพนั้น AlphaGo สามารถเอาชนะ Fan Hui ผู้เช่นมืออาชีพที่เคยได้แชมป์มาแล้วถึง 3 ครั้งในยุโรปด้วยคะแนนขาดลอย 5-0 และนับเป็นครั้งแรกเลยที่ AlphaGo สามารถเอาชนะผู้เล่นหมากล้อมมืออาชีพได้ และก้าวถัดไป AlphaGo ก็พร้อมจะท้าชิงกับผู้เล่นหมากล้อมระดับโลกอย่าง Lee Sedol แล้ว

ความสำเร็จหลังจากนี้จะนำมาซึ่งยุคถัดไปของ AI ที่สามารถเรียนรู้และพัฒนาตัวเองได้ด้วยเทคนิคทางด้าน Machine Learning เพื่อก้าวเข้าสู่การแก้ไขปัญหาในโลกใบนี้ นอกเหนือจากเพียงการเล่นเกมกระดานแล้ว

สำหรับใครที่ไม่รู้จักหมากล้อม ลองอ่าน https://th.wikipedia.org/wiki/%E0%B8%AB%E0%B8%A1%E0%B8%B2%E0%B8%81%E0%B8%A5%E0%B9%89%E0%B8%AD%E0%B8%A1 ดูนะครับ หรือจะไปหาฮิคารุเซียนโกะเกมอัจฉริยะมาอ่านก็ได้นะ

ที่มา: http://googleresearch.blogspot.com/2016/01/alphago-mastering-ancient-game-of-go.html

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Stripe ยกระดับระบบชำระเงินสู่โครงสร้างพื้นฐานสำหรับ Machine-to-Machine รับยุค Agentic AI

Stripe เปิดตัวผลิตภัณฑ์ใหม่ 288 รายการ พร้อมส่งแผนพลิกโฉมระบบชำระเงินจากเดิมที่เป็นโครงสร้างพื้นฐานในการทำธุรกรรมสำหรับมนุษย์ ให้กลายเป็นโครงสร้างพื้นฐานที่สามารถตั้งโปรแกรมได้และทำงานอย่างต่อเนื่องเพื่อรองรับธุรกกรรมแบบ Machine-to-Machine ถือเป็นการปูทางเข้าสู่ระบบเศรษฐกิจแบบ Agentic AI อย่างเต็มรูปแบบ