Amazon AWS เปิดเผย Public Data Set ของ Genome ข้าวกว่า 3,000 สายพันธุ์ มีขนาดรวมกันกว่า 100TB

amazon_aws_logo_h50

Amazon AWS ได้ทำการเปิดเผย Public Data Set ซึ่งเป็นข้อมูลของ Genome ข้าว 3,024 สายพันธุ์ ซึ่งมีจำนวนตัวอย่างข้อมูลมากกว่า 30 ล้านชุด ที่รวบรวมมาจาก 89 ประเทศทั่วโลก เพื่อให้ Data Scientist ทั่วโลกสามารถค้นหาวิธีการและปัจจัยในการเพาะปลูกข้าวที่มีประสิทธิภาพมากกว่าเดิมได้

Credit: ShutterStock.com
Credit: ShutterStock.com

ทั้งนี้ ข้าว เป็นอาหารของประชากรทั่วโลกกว่าครึ่งโลก และเป็นแหล่งพลังงานในการบริโภคถึง 20% แต่เพื่อให้การผลิตข้าวนั้นเพียงพอต่อการเพิ่มขึ้นของประชากรโลก เราจะต้องหาวิธีการในการเพาะปลูกข้าวให้ได้ผลมากขึ้นถึง 25% ภายในปี 2030 ซึ่งเมื่อเปรียบเทียบจากสถิติที่ผ่านมานั้น หากเราไม่ทำอะไรเลย ข้าวก็จะไม่เพียงพอต่อการบริโภค ดังนั้นการค้นหาวิธีการที่ดีขึ้นด้วยกระบวนการวิทยาศาสตร์ และการวิเคราะห์ข้อมูลจึงเป็นสิ่งจำเป็น

การรวบรวมข้อมูลสายพันธุ์ข้าวครั้งนี้เกิดขึ้นโดยความร่วมมือของ Chinese Academy of Agriculture Sciences, BGI Shenzhen และ International Rice Research Institute ร่วมกับ DNAnexus ในการวิเคราะห์ข้อมูลของสายพันธุ์ข้าวที่ได้รับมาบน Compute Cores ของ AWS กว่า 37,000 Cores จนแล้วเสร็จในระยะเวลาเพียงสองวัน ซึ่งถือว่าเร็วกว่าการวิเคราะห์ข้อมูลด้วยระบบ Local Infrastructure ถึง 200 เท่าเลยทีเดียว

สำหรับผู้ที่สนใจและอยากนำข้อมูลของข้าวเหล่านี้ไปวิเคราะห์ สามารถตรวจสอบวิธีการเข้าถึง Amazon AWS Pubic Data Set ชุดนี้บน Amazon AWS S3 ได้ทันทีที่ https://aws.amazon.com/public-data-sets/3000-rice-genome/

ที่มา: https://aws.amazon.com/about-aws/whats-new/2015/09/new-aws-public-data-set-3000-rice-genome-on-aws/ 


About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

สเปกหลุด! Intel NUC 12 Enthusiast “Serpent Canyon” Core i7-12700H และ Arc A770M 16GB

หลุดมาคำโต กับสเปก Intel NUC 12 Enthusiast ในรหัส “Serpent Canyon” พีซีขนาดจิ๋วกับพลังการขับเคลื่อนด้วยสถาปัตยกรรมรุ่นล่าสุด Intel 12th Gen Core H-Series …

[Guest Post] เสริมความแกร่งให้ธุรกิจ และปกป้องข้อมูลด้วย IBM QRadar SIEM และIBM FlashSystem Safeguarded Copy

เมื่อธุรกิจยุคดิจิทัล ต้องเผชิญกับความท้าทายจากภัยไซเบอร์หลากหลายรูปแบบ ไม่ว่าจะเป็น แฮ็กเกอร์ ข้อมูลรั่วไหล และแรนซัมแวร์ที่เป็นอุปสรรคสำคัญคอยขัดขวางและสร้างความเสียหายอย่างมาก ทั้งงบประมาณในการกู้คืนระบบ เวลาและโอกาสทางธุรกิจ และที่สำคัญคือความเชื่อถือของลูกค้า ที่ไม่อาจประเมินเป็นตัวเงินได้