MIT ออกมาขอโทษต่อกรณีการเผยแพร่ Dataset ที่มีข้อมูลเหยียดเพศและชาติพันธุ์ ระบุนำ Dataset ออกจากระบบไม่ให้คนเข้าถึงได้แล้ว

หลังจากที่มีการตรวจพบว่า Dataset รูปภาพสำหรับใช้ในการ Train AI เพื่อจำแนกบุคคลหรือวัตถุของ MIT นั้นมีการใช้ถ้อยคำที่หยาบคายและเหยียดผู้คนอยู่ ทาง MIT ก็นำข้อมูลเหล่านั้นออกไม่ให้มีการเข้าถึงได้ พร้อมกล่าวขอโทษต่อสาธารณะ และแจ้งให้นักวิจัยและนักพัฒนาซอฟต์แวร์เลิกใช้ข้อมูลชุดนั้น รวมถึงขอร้องให้ทำการลบข้อมูลออกไปด้วย

Credit: Prabhu & Birhane via TheRegister

Dataset ที่เป็นปัญหานี้มีชื่อว่า 80 Million Tiny Images ที่ได้รวมเอารูปภาพขนาดเล็กจำนวนกว่า 79,300,000 ภาพที่นำมาจาก Google Images ตั้งแต่ปี 2008 พร้อมทำการ Label ข้อมูลเหล่านั้นเอาไว้เรียบร้อยเพื่อให้สามารถนำไปใช้ในงานวิจัยด้าน Image Recognition กันได้ง่ายๆ รวมถึงยังมีกรนำข้อมูลเหล่นี้มาใช้เพื่อ Benchmark การทำ Computer Vision อีกด้วย

การค้นพบถึงปัญหาภายใน Dataset ครั้งนี้เกิดขึ้นเมื่อ Vinay Prabhu ผู้ดำรงตำแหน่ง Chief Data Scientist แห่ง UnifyID และ Abeba Birhane ที่กำลังศึกษาอยู่ ณ University College Dublin ใน Ireland ได้ออกมาเผยถึงการค้นพบว่ามีการ Label ข้อมูลอย่างไม่เหมาะสม ทั้งการใช้คำเหยียดชาติพันธุ์กับคนผิวดำหรือคนเอเชีย และการใช้คำที่หยาบคายกับภาพของผู้หญิงและอวัยวะส่วนต่างๆ

ข้อมูลเหล่านี้ถูกลบออกจากเว็บ CSAIL ของ MIT ทันทีเมื่อมีการตรวจพบปัญหานี้ และทาง MIT ก็ออกมาขอโทษอย่างเป็นทางการต่อกรณีที่เกิดขึ้นนี้ โดยภาพและข้อมูล Label ที่ได้มาเกิดจากการรวบรวมข้อมูลบน Internet โดยอัตโนมัติและไม่ได้มีทีมงานเข้าไปทำการคัดกรองเนื่องจากภาพมีขนาดเล็กเกินไปรวมถึงยังมีจำนวนมหาศาลเกือบ 80 ล้านรูป ความผิดพลาดจึงเกิดขึ้นในครั้งนี้

ที่มา: https://www.theregister.com/2020/07/01/mit_dataset_removed/


About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

[Guest Post] SBP ผนึกพันธมิตรไอทีระดับโลก Alcatel มุ่งสู่ผู้นำด้านการบริหารจัดการข้อมูลครบวงจร

บริษัท เอสบีพี ดิจิทัล เซอร์วิส จำกัด (SBP) ในเครือบริษัท บุญรอด ซัพพลายเชน จำกัดดำเนินธุรกิจให้บริการด้านเทคโนโลยีและการบริหารจัดการข้อมูล ผนึกกำลังกับอัลคาเทล-ลูเซ่น ประเทศไทย จำกัด (Alcatel) ผู้ให้บริการทางด้านอุปกรณ์การสื่อสารและระบบเครือข่ายชั้นนำจากประเทศฝรั่งเศส …

[Guest Post] Metrosystems x Banpu: ก้าวสู่อนาคตอย่างปลอดภัยด้วย Microsoft Azure และ Security Operation Center (SOC)

บริษัท บ้านปู จำกัด (มหาชน) หรือ BANPU ผู้นำด้านพลังงานครบวงจรทั้งในและต่างประเทศทั่วเอเชีย-แปซิฟิก กับการนำ Microsoft Azure, Office365 และ IT Outsource มาช่วยพัฒนากระบวนการทำงาน …