CDIC 2023

DNA Fountain: ค้นพบวิธีการบันทึกข้อมูล 214 Petabyte ลง DNA ได้อย่างสมบูรณ์

หลังจากที่ปี 2016 ที่ผ่านมา Microsoft ได้ออกมาประกาศถึงความเป็นไปได้ที่ DNA จะบันทึกข้อมูลได้ถึง 1,000 Petabyte (1,000,000,000 Terabyte) ใน DNA น้ำหนัก 1 กรัม วันนี้งานวิจัยที่ชื่อ DNA Fountain ได้ค้นพบวิธีการบันทึกข้อมูลลง DNA ที่มีประสิทธิภาพและความทนทานสูง พร้อมทดลองบันทึกข้อมูลสำเร็จที่ขนาดถึง 214 Petabyte บน DNA น้ำหนัก 1 กรัมเป็นที่เรียบร้อยแล้ว

Credit: Wikipedia

 

งานวิจัยชิ้นนี้มีชื่อว่า DNA Fountain ซึ่งเป็นงานวิจัยของ Yaniv Erlich และ Dina Zielinski แห่ง Columbia University และ New York Genome Center (NYGC) ที่ได้ตีพิมพ์ลง Jounal Science ไป โดยในข้อมูลทั้งหมดนี้ได้มีการบันทึกข้อมูลไฟล์ตัวอย่างลงไปด้วย 6 ไฟล์ด้วยกันสำหรับใช้ทดสอบเปิดอ่านขึ้นมา ได้แก่

  • ข้อมูลของระบบปฏิบัติการคอมพิวเตอร์
  • ภาพยนตร์ฝรั่งเศสปี 1895 ชื่อเรื่องว่า Arrival of a Train at La Ciotat
  • Amazon Gift Card มูลค่า 50 เหรียญ
  • ไวรัสคอมพิวเตอร์
  • ภาพ Pioneer Plaque (https://en.wikipedia.org/wiki/Pioneer_plaque)
  • งานวิจัยปี 1948 โดย Claude Shannon

โดยการทำ DNA Fountain นี้ เริ่มต้นข้อมูลทั้งหมดจะถูกนำไปบีบอัด (Compress) เสียก่อนจะได้ไฟล์ Archive กลางขึ้นมา และตัดไฟล์เหล่านั้นออกเป็นชุดสั้นๆ แล้วใช้การทำ Erasure-coding Algorithm ที่เรียกว่า Fountain Code (https://en.wikipedia.org/wiki/Fountain_code) เพื่อสร้าง Droplet ขึ้นมาจากไฟล์ที่ถูกตัดเหล่านั้น ซึ่งใน Droplet แต่ละชุดก็จะมีข้อมูล Barcode เรียงกันอยู่เป็นลำดับเพื่อให้นักวิจัยสามารถประกอบไฟล์กลับขึ้นมาได้ใหม่ในภายหลัง

จากนั้นทีมนักวิจัยก็ได้ทำการแปลงข้อมูลเลข 0 และ 1 ในแต่ละ Droplet นี้ให้อยู่ใน Nucleotide Base 4 รูปแบบใน DNA ได้แก่ A, G, C, T จนกลายเป็นรายการของ DNA Strand ความยาว 72,000 ชุดที่บรรจุข้อมูลที่ถูก Encode เอาไว้นี้

จากนั้นข้อมูลนี้ก็ถูกส่งต่อไปยังบริษัท Twist Biosciences ซึ่งเป็นบริษัทรับแปลงข้อมูลลง DNA ซึ่ง Microsoft เข้าซื้อกิจการไปแล้ว และสองสัปดาห์ผ่านมาทางทีมวิจัยก็ได้รับ DNA ซึ่งบันทึกข้อมูลเหล่านั้นเอาไว้กลับมา และสามารถเปิดอ่านได้อย่างสมบูรณ์ โดยนอกจากการทดลองกับไฟล์ชุดนี้ที่มีขนาด 2MB แล้วก็มีการทดสอบการบันทึกข้อมูลรวมกันได้มากถึงประมาณ 214-215 Petabyte มาแล้ว

เทคโนโลยีนี้ยังมีจุดอ่อนด้านค่าใช้จ่ายในการเขียนข้อมูลและการอ่านข้อมูลกลับคืนมา โดยมีค่าใช้จ่ายในการประมวลผลและนำไปบันทึกลง DNA สูงถึง 7,000 เหรียญหรือราวๆ 245,000 บาท และก็ยังมีค่าใช้จ่ายในการอ่านข้อมูลครั้งละ 2,000 เหรียญหรือราวๆ 70,000 บาทอีกด้วย

สำหรับผู้ที่สนใจ สามารถอ่านรายละเอียดฉบับเต็มของงานวิจัยนี้ได้ที่ http://science.sciencemag.org/content/355/6328/950 ทันที

ที่มา: http://thehackernews.com/2017/03/dna-data-storage.html


About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Intel ประกาศแยกบริษัทลูก สำหรับ Programmable Chip โดยเฉพาะ

Intel ประกาศแยกบริษัทลูก สำหรับ Programmable Chip โดยเฉพาะ พักแผน IPO เอาไว้ก่อน

ยกระดับบริการขององค์กรอย่างมั่นใจด้วย HPE Aruba Networking SASE โดย ยิบอินซอย

HPE Aruba Networking นำเสนอ Unified SASE ที่รวมเอาความสามารถของเทคโนโลยี SD-WAN และ SSE เข้าไว้ด้วยกัน เพื่อความง่ายดายในการบริหารจัดการ SD-WAN, Routing, WAN Optimization ตลอดจนการบังคับใช้นโยบายความปลอดภัยได้แบบ end-to-end เพื่อให้การทำงานของแอปพลิเคชันมีประสิทธิภาพสูงขึ้น มั่นคงปลอดภัย ลดต้นทุน และพร้อมให้บริการเสมอ