ทีมนักวิจัยด้านวิทยากรคอมพิวเตอร์รวม 12 คน พัฒนาอัลกอริธึมทางด้าน AI ใหม่ โดยเลียนแบบการทำงานของดวงตาและมันสมองของมนุษย์ขณะดูรูปภาพ ซึ่งช่วยให้สามารถแคร็กระบบ CAPTCHA ได้แม่นยำสูงกว่า 50%
อัลกอริธึมที่พัฒนาขึ้นมานั้น ประกอบด้วยส่วนที่ใช้จดจำขอบของรูปทรงต่างๆ ส่วนที่จำแนกประเภทของรูปทรง ส่วนที่พิจารณาถึงมุมของรูปทรงที่ผู้ใช้กำลังมองอยู่ และส่วนที่ใช้จับคู่รูปทรงกับรูปแบบมาตรฐานของตัวอักษรหรือตัวเลข โดยทีมนักวิจัยตั้งชื่อกระบวนการที่พวกเขาคิดค้นขึ้นมาว่า Recursive Cortical Network (RCN) ซึ่งแตกต่างจากอัลกอริธึมที่ใช้ AI แคร็ก CAPTCHA แบบอื่นๆ ที่นิยมใช้ Convolutional Neural Network (CNN)
จากการทำสอบพบว่า นอกจากจะแคร็กระบบ CAPTCHA ทั่วไปได้แม่นยำกว่า 50% แล้ว ยังสามารถแก้ Google reCAPTCHA ได้แม่นยำถึง 66.6% ในขณะที่แคร็ก BotDetect, Yahoo และภาพ PayPal ได้แม่นยำถึง 64.4%, 57.4% และ 57.1% ตามลำดับ ซึ่งสำหรับระบบ CAPTCHA แล้ว ถ้ามีวิธีอัตโนมัติที่สามารถแคร็กได้แม่นยำสูงกว่า 1% จะถือว่าระบบนั้นมีปัญหาทันที
ถึงแม้ว่าอัลกอริธึมแบบ CNN จะมีความแม่นยำสูงถึง 89.9% ในการแคร็กภาพ reCAPTCHA แต่ทางนักวิจัยยืนยันว่าอัลกอริธึมของพวกเขาเหนือว่า กล่าวคือ ถ้ามีการเปลี่ยนแปลงเล็กน้อยบนรูปภาพ เช่น ขนาดของช่องไฟเปลี่ยนไปแม้เพียงเล็กน้อย ความแม่นยำของ CNN จะตกลงถึง 38.4% ในขณะที่อัลกอริธึมแบบ RCN ของพวกเขามีจุดเด่นตรงที่ไม่จำกัดอยู่เฉพาะในกรอบของสิ่งที่ใช้เรียนรู้ นอกจากนี้ อัลกอริธึมของพวกเขายังใช้รูปภาพสำหรับเรียนรู้เพียงไม่กี่พันรูปภาพ แต่อัลกอริธึมแบบ CNN จำเป็นต้องใช้มากถึง 2,300,000 รูป
ทีมนักวิจัยยังระบุอีกว่า ขณะนี้กำลังศึกษาถึงความเป็นไปได้ในการนำ AI Bot ที่ใช้อัลกอริธึมแบบ RCN มาแปรความหมายของรูปแบบที่เป็นวัตถุ ไม่ใช่แค่ข้อความเพียงอย่างเดียว ซึ่งถ้าทำได้จริง อัลกอริธึมนี้จะถูกยกระดับจากการแคร็ก CAPTCHA และ OCR มาสู่อาณาเขตของการทำ Object และ Facial Recognition ทันที
ผู้ที่สนใจสามารถอ่านงานวิจัยฉบับเต็มได้ที่: A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs [PDF]