John Matherly ผู้ก่อตั้ง Shodan ได้ออกมาเปิดเผยถึงการค้นพบว่ามี Server ที่ใช้งาน Apache Hadoop ทั่วโลกนั้น มีข้อมูลรั่วรวมกันทั้งสิ้นเกินกว่า 5 Petabyte หรือเกินกว่า 5,000 Terabyte เลยทีเดียว

ข้อมูลทั้งหมดนั้นมาจาก HDFS-based Server จำนวนกว่า 4,487 Instance ทั่วโลก ที่มี Public IP Address และไม่ได้ทำการกำหนดค่าเรื่องการยืนยันตัวตนใดๆ ก่อนการเข้าถึงข้อมูลเลย ทำให้คนทั่วไปสามารถเข้าถึงข้อมูลเหล่านั้นได้อย่างอิสระ โดยระบบส่วนใหญ่ที่ถูกค้นพบนี้อยู่ในประเทศสหรัฐอเมริกาและจีนแทบทั้งหมด
นอกจากประเด็นด้านการถูกเข้าถึงข้อมูลโดยไม่ได้รับอนุญาตแล้ว เหล่าผู้ใช้งาน Apache Hadoop ที่ไม่ระมัดระวังเหล่านี้เองก็ควรจะต้องเกรงกลัว Ransomware กันบ้างเช่นกัน เพราะเมื่อต้นปีที่ผ่านมามีเหตุการณ์ Ransomware โจมตี Hadoop ไปแล้วเกือบ 500 เครื่อง และแน่นอนว่าด้วยข้อมูลปริมาณมหาศาลภายในระบบ Big Data เหล่านั้น การถูกเข้ารหัสไปแบบนี้คงไม่สามารถกู้คืนมาได้อย่างง่ายดายนัก
ก่อนหน้านี้ก็เคยมีเหตุการณ์ใกล้เคียงกับลักษณะนี้เกิดขึ้นมาแล้ว โดย MongoDB ที่มี Public IP Address ทั่วโลกนั้นมีข้อมูลรั่วออกมา 25TB จากการตั้งค่าเอาไว้ไม่ปลอดภัย ในขณะที่ Binary Edge ก็เคยออกรายงานเมื่อปี 2015 ว่ามีข้อมูลรั่วจาก Redis, MongoDB, Memchaced และ ElasticSearch รวมกันที่ 1.1 Petabyte เท่านั้น แต่กรณีที่เกิดกับ Hadoop นี้ถือว่าข้อมูลที่รั่วออกมานั้นใหญ่กว่ามากด้วยตัวเลขเกินกว่า 5 Petabyte
ทาง Bleeping Computer ได้แนะนำลิงค์สำหรับการตั้งค่า Apache Hadoop ให้ปลอดภัยเอาไว้ที่ http://hadoop.apache.org/docs/r2.8.0/hadoop-project-dist/hadoop-common/SecureMode.html ครับ
ที่มา: https://www.bleepingcomputer.com/news/security/hadoop-servers-expose-over-5-petabytes-of-data/