นักวิจัยทำ Index สำหรับ Dark Web พบผิดกฏหมายเกินครึ่ง

ปัจจุบันนี้ มีเว็บไซต์เปิดเผยสู่สาธารณะ (สามารถค้นหาเจอโดยใช้ Search Engine) เพียง 4% เท่านั้น ที่เหลืออีก 96% เป็นเว็บไซต์ที่ซ่อนตัวอยู่ ไม่สามารถเข้าถึงได้ด้วยวิธีปกติ หรือที่เรียกว่า Deep Web เช่น เว็บไซต์ทางการศึกษา บันทึกการแพทย์ ข้อมูลรัฐบาล รายงานวิทยาศาสต์ และอื่นๆ ซึ่งส่วนหนึ่งในนั้นคือ Dark Web ที่รวมแหล่งข้อมูลผิดกฏหมาย และเว็บไซต์ที่ต้องเข้าผ่าน Tor เป็นต้น

dark_web_iceberg

สองนักวิจัยจาก King’s College London ได้พยายามค้นหาว่า Dark Web ที่ต้องเข้าถึงผ่านเครือข่าย Tor มีสิ่งที่ผิดกฏหมายอยู่มากน้อยแค่ไหน ผลลัพธ์คือ เกินครึ่ง !!

เครือข่าย TOR คืออะไร

TOR ย่อมาจาก The Onion Router เป็นเครือข่ายที่ประกอบด้วยการเข้า-ถอดรหัส และส่งต่อข้อมูลเป็นทอดๆ แต่ละ Node ที่ส่งต่อกันจะทราบเพียงแค่ว่าได้รับข้อมูลมาจาก Node ไหนและส่งต่อไปไหนเท่านั้น ทำให้เครื่องปลายทางไม่สามารถทราบแหล่งที่มาของข้อมูล ผู้คนส่วนใหญ่มักใช้ Tor เพื่อปกปิดตัวตนในการใข้งานอินเทอร์เน็ต แต่ก็มีบางเว็บไซต์ที่มีตัวตนเฉพาะบนเครือข่าย Tor เรียกว่าเป็นเซอร์วิสลับ (Hidden Service) เช่น Silk Road เว็บตลาดมืดสำหรับค้าของผิดกฏหมาย เป็นต้น

tor_how_it_works

เขียน Bot เพื่อจัดทำ Index ของ Dark Web

เป็นเรื่องยากที่จะทำการค้นหา Hidden Service ทั้งหมดในเครือข่าย TOR เนื่องจาก Service เหล่านั้นเปลี่ยนแปลง Address และ Server Location ไปเรื่อยๆ เพื่อที่จะเก็บข้อมูล Hidden Service เหล่านั้น นักวิจัยทั้งสองจึงได้เขียน Bot สคริปต์ Python เพื่อ Crawl Dark Web ผ่าน Search Engine ยอดนิยมของ TOR นั่นคือ Onion City และ Ahmia

Bot จะทำการดึงเนื้อหาของแต่ละ Page และอัพโหลดเนื้อหาเหล่านั้นขึ้นไปเพื่อทำการวิเคราะห์ เมื่อพบลิงค์ที่นำไปสู่อีก Hidden Service หนึ่ง Bot ก็จะกระโดดตามลิงค์นั้นไป แล้วดึงเนื้อหาอัพโหลดขึ้นไปเช่นกัน ทำอย่างนี้ต่อไปเรื่อยๆ ข้อมูลเนื้อหาที่ได้มาจะถูกเข้าอัลกอริธึมเพื่อทำการจัดหมวดหมู่ เช่น Drugs, Social, Pornography, Financial เป็นต้น

ทำ Index ไปกว่า 5,205 Pages พบ 57% ผิดกฏหมาย

หลังจากทำการสำรวจเว็บไซต์ไปกว่า 5,205 Pages พบว่า 2,723 Pages ถูกจัดเข้าหมวดหมู่เป็นที่เรียบร้อย ส่วน Page ที่เหลือมีเนื้อหาน้อยกว่า 50 คำหรือไม่มีเนื้อหาเลยจึงไม่ถูกจัดเข้าหมวดหมู่ใดๆ ซึ่งจากการวิเคราะห์ พบว่า 57% ของเว็บไซต์ทั้งหมดมีเนื้อหาผิดกฏหมาย เช่น ยาเสพติด และอนาจารเด็ก

dark_web_ban_message

Tor Project ระบุว่า ปัจจุบันนี้มี Hidden Service ที่พร้อมให้บริการประมาณ 35,000 Pages ถึงแม้ว่าการสำรวจของนักวิจัยทั้งสองจะไม่ครอบคลุม Service ทั้งหมด แต่ก็ถือว่านำมาใช้เป็นตัวแทนเชิงสถิติได้

ที่มา: http://www.extremetech.com/internet/222245-researchers-index-dark-web-find-most-of-it-contains-illegal-material


About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

NEXUS เชิญร่วมสัมมนาฟรี “Digitizing Intelligent Omni-Channel for your Retail Business” อาวุธลับความสำเร็จของธุรกิจค้าปลีกในรูปแบบใหม่

บริษัท เน็กซัส ซิสเท็ม รีซอร์สเซส จำกัด ผู้เชี่ยวชาญด้านการให้คำปรึกษา วางระบบซอฟต์แวร์ เพื่อเพิ่มศักยภาพธุรกิจ ร่วมกับ SAP ผู้พัฒนาซอฟต์แวร์ อันดับ 1 และ DELL EMC ผู้ให้บริการฮาร์ดแวร์ ชั้นนำของโลก ขอเรียนเชิญผู้บริหาร ทีมไอที และผู้ที่สนใจเข้าร่วมงานสัมมนา "Digitizing Intelligent Omni-Channel for your Retail Business" เพื่อเรียนรู้แนวทางการประยุกต์ใช้เทคโนโลยีต่างๆ มาเปลี่ยนให้ธุรกิจค้าปลีกของคุณก้าวสู่การเป็น Omni-Channel และ Online-to-Offline (O2O) ได้อย่างเต็มตัว ในวันที่ 30 กรกฎาคม 2019 โดยมีรายละเอียด กำหนดการ และวิธีการลงทะเบียนเข้าร่วมงานดังนี้

กรณีศึกษา: API กับการทำ Open Banking และการนำ API ไปต่อยอดธุรกิจในอุตสาหกรรมอื่นทั่วโลก

คงปฏิเสธไม่ได้ว่าทุกวันนี้ข้อมูลได้เข้ามามีบทบาททั้งในการทำงานและการใช้ชีวิตประจำวันของทุกคนเป็นอย่างมาก และ API นั้นก็ถือเป็นเบื้องหลังที่สำคัญอันหนึ่งในการทำให้การนำข้อมูลมาใช้งานนั้นเกิดขึ้นได้อย่างแพร่หลายและกว้างขวางอย่างทุกวันนี้ ในบทความนี้เราจะมาเล่าถึงกรณีศึกษาในการนำ API มาใช้ในธุรกิจต่างๆ ทั้งกรณีของการทำ Open Banking ที่กำลังเป็นแนวโน้มใหญ่ และการใช้งาน API ในธุรกิจอุตสาหกรรมอื่นๆ เพื่อเป็นแนวทางให้ทุกท่านได้นำไปประยุกต์ใช้เข้ากับธุรกิจของตนเองได้