DNA Fountain: ค้นพบวิธีการบันทึกข้อมูล 214 Petabyte ลง DNA ได้อย่างสมบูรณ์

หลังจากที่ปี 2016 ที่ผ่านมา Microsoft ได้ออกมาประกาศถึงความเป็นไปได้ที่ DNA จะบันทึกข้อมูลได้ถึง 1,000 Petabyte (1,000,000,000 Terabyte) ใน DNA น้ำหนัก 1 กรัม วันนี้งานวิจัยที่ชื่อ DNA Fountain ได้ค้นพบวิธีการบันทึกข้อมูลลง DNA ที่มีประสิทธิภาพและความทนทานสูง พร้อมทดลองบันทึกข้อมูลสำเร็จที่ขนาดถึง 214 Petabyte บน DNA น้ำหนัก 1 กรัมเป็นที่เรียบร้อยแล้ว

Credit: Wikipedia

 

งานวิจัยชิ้นนี้มีชื่อว่า DNA Fountain ซึ่งเป็นงานวิจัยของ Yaniv Erlich และ Dina Zielinski แห่ง Columbia University และ New York Genome Center (NYGC) ที่ได้ตีพิมพ์ลง Jounal Science ไป โดยในข้อมูลทั้งหมดนี้ได้มีการบันทึกข้อมูลไฟล์ตัวอย่างลงไปด้วย 6 ไฟล์ด้วยกันสำหรับใช้ทดสอบเปิดอ่านขึ้นมา ได้แก่

  • ข้อมูลของระบบปฏิบัติการคอมพิวเตอร์
  • ภาพยนตร์ฝรั่งเศสปี 1895 ชื่อเรื่องว่า Arrival of a Train at La Ciotat
  • Amazon Gift Card มูลค่า 50 เหรียญ
  • ไวรัสคอมพิวเตอร์
  • ภาพ Pioneer Plaque (https://en.wikipedia.org/wiki/Pioneer_plaque)
  • งานวิจัยปี 1948 โดย Claude Shannon

โดยการทำ DNA Fountain นี้ เริ่มต้นข้อมูลทั้งหมดจะถูกนำไปบีบอัด (Compress) เสียก่อนจะได้ไฟล์ Archive กลางขึ้นมา และตัดไฟล์เหล่านั้นออกเป็นชุดสั้นๆ แล้วใช้การทำ Erasure-coding Algorithm ที่เรียกว่า Fountain Code (https://en.wikipedia.org/wiki/Fountain_code) เพื่อสร้าง Droplet ขึ้นมาจากไฟล์ที่ถูกตัดเหล่านั้น ซึ่งใน Droplet แต่ละชุดก็จะมีข้อมูล Barcode เรียงกันอยู่เป็นลำดับเพื่อให้นักวิจัยสามารถประกอบไฟล์กลับขึ้นมาได้ใหม่ในภายหลัง

จากนั้นทีมนักวิจัยก็ได้ทำการแปลงข้อมูลเลข 0 และ 1 ในแต่ละ Droplet นี้ให้อยู่ใน Nucleotide Base 4 รูปแบบใน DNA ได้แก่ A, G, C, T จนกลายเป็นรายการของ DNA Strand ความยาว 72,000 ชุดที่บรรจุข้อมูลที่ถูก Encode เอาไว้นี้

จากนั้นข้อมูลนี้ก็ถูกส่งต่อไปยังบริษัท Twist Biosciences ซึ่งเป็นบริษัทรับแปลงข้อมูลลง DNA ซึ่ง Microsoft เข้าซื้อกิจการไปแล้ว และสองสัปดาห์ผ่านมาทางทีมวิจัยก็ได้รับ DNA ซึ่งบันทึกข้อมูลเหล่านั้นเอาไว้กลับมา และสามารถเปิดอ่านได้อย่างสมบูรณ์ โดยนอกจากการทดลองกับไฟล์ชุดนี้ที่มีขนาด 2MB แล้วก็มีการทดสอบการบันทึกข้อมูลรวมกันได้มากถึงประมาณ 214-215 Petabyte มาแล้ว

เทคโนโลยีนี้ยังมีจุดอ่อนด้านค่าใช้จ่ายในการเขียนข้อมูลและการอ่านข้อมูลกลับคืนมา โดยมีค่าใช้จ่ายในการประมวลผลและนำไปบันทึกลง DNA สูงถึง 7,000 เหรียญหรือราวๆ 245,000 บาท และก็ยังมีค่าใช้จ่ายในการอ่านข้อมูลครั้งละ 2,000 เหรียญหรือราวๆ 70,000 บาทอีกด้วย

สำหรับผู้ที่สนใจ สามารถอ่านรายละเอียดฉบับเต็มของงานวิจัยนี้ได้ที่ http://science.sciencemag.org/content/355/6328/950 ทันที

ที่มา: http://thehackernews.com/2017/03/dna-data-storage.html


About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

[Guest Post] งานแสดงเทคโนโลยีธุรกิจ 5G แห่งอนาคต เริ่มอย่างเป็นทางการแล้ววันนี้!!

เปิดประสบการณ์สู่โลกของธุรกิจเทคโนโลยีไร้สายความเร็วสูง 28-29 กันยายน ณ สามย่านมิตรทาว์นฮอลล์ ชั้น 5 สามย่านมิตรทาวน์ กรุงเทพฯ

ขอเชิญเจ้าหน้าที่ภาครัฐเข้าร่วมงานสัมมนา Moving Government Forward, The Future Belongs in the Cloud [7 ต.ค. 2022 เวลา 9.00น. – 13.00น.]

กระทรวงดิจิทัลเพื่อเศรษฐกิจและสังคม, สำนักงานคณะกรรมการดิจิทัลเพื่อเศรษฐกิจและสังคม (สดช.), บริษัท โทรคมนาคมแห่งชาติ จำกัด (มหาชน) ร่วมกับ Cisco และ AIT  ขอเรียนเชิญเจ้าหน้าที่ภาครัฐทุกท่านทั่วประเทศไทยจากทุกกระทรวง ทบวง กรม เข้าร่วมงานสัมมนาฟรี …