Amazon AWS เปิดเผย Public Data Set ของ Genome ข้าวกว่า 3,000 สายพันธุ์ มีขนาดรวมกันกว่า 100TB

amazon_aws_logo_h50

Amazon AWS ได้ทำการเปิดเผย Public Data Set ซึ่งเป็นข้อมูลของ Genome ข้าว 3,024 สายพันธุ์ ซึ่งมีจำนวนตัวอย่างข้อมูลมากกว่า 30 ล้านชุด ที่รวบรวมมาจาก 89 ประเทศทั่วโลก เพื่อให้ Data Scientist ทั่วโลกสามารถค้นหาวิธีการและปัจจัยในการเพาะปลูกข้าวที่มีประสิทธิภาพมากกว่าเดิมได้

Credit: ShutterStock.com
Credit: ShutterStock.com

ทั้งนี้ ข้าว เป็นอาหารของประชากรทั่วโลกกว่าครึ่งโลก และเป็นแหล่งพลังงานในการบริโภคถึง 20% แต่เพื่อให้การผลิตข้าวนั้นเพียงพอต่อการเพิ่มขึ้นของประชากรโลก เราจะต้องหาวิธีการในการเพาะปลูกข้าวให้ได้ผลมากขึ้นถึง 25% ภายในปี 2030 ซึ่งเมื่อเปรียบเทียบจากสถิติที่ผ่านมานั้น หากเราไม่ทำอะไรเลย ข้าวก็จะไม่เพียงพอต่อการบริโภค ดังนั้นการค้นหาวิธีการที่ดีขึ้นด้วยกระบวนการวิทยาศาสตร์ และการวิเคราะห์ข้อมูลจึงเป็นสิ่งจำเป็น

การรวบรวมข้อมูลสายพันธุ์ข้าวครั้งนี้เกิดขึ้นโดยความร่วมมือของ Chinese Academy of Agriculture Sciences, BGI Shenzhen และ International Rice Research Institute ร่วมกับ DNAnexus ในการวิเคราะห์ข้อมูลของสายพันธุ์ข้าวที่ได้รับมาบน Compute Cores ของ AWS กว่า 37,000 Cores จนแล้วเสร็จในระยะเวลาเพียงสองวัน ซึ่งถือว่าเร็วกว่าการวิเคราะห์ข้อมูลด้วยระบบ Local Infrastructure ถึง 200 เท่าเลยทีเดียว

สำหรับผู้ที่สนใจและอยากนำข้อมูลของข้าวเหล่านี้ไปวิเคราะห์ สามารถตรวจสอบวิธีการเข้าถึง Amazon AWS Pubic Data Set ชุดนี้บน Amazon AWS S3 ได้ทันทีที่ https://aws.amazon.com/public-data-sets/3000-rice-genome/

ที่มา: https://aws.amazon.com/about-aws/whats-new/2015/09/new-aws-public-data-set-3000-rice-genome-on-aws/ 

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

AWS S3 Express One Zone รองรับการใช้กุญแจเข้ารหัสของลูกค้าได้แล้ว

AWS S3 Express One Zone ได้เพิ่มความสามารถในการรองรับการเข้ารหัสข้อมูลด้วย Key ที่ลูกค้าสามารถจัดการเองได้

6 เหตุผลที่องค์กรควรเลือก IBM Power S1012 สำหรับงาน Edge Computing และ AI

หนึ่งในปัจจัยที่ทำให้ระบบ AI สามารถตอบสนองสถานการณ์ได้อย่างทันท่วงที ก็คือสถาปัตยกรรมบน Edge Computing ซึ่งงานประมวลผลด้าน AI ในระดับองค์กรนั้น มีความต้องการที่เฉพาะตัว ตั้งแต่ความน่าเชื่อถือ ประสิทธิภาพ ไปจนถึงความยืดหยุ่นที่เซิร์ฟเวอร์ต้องถูกออกแบบมาอย่างเฉพาะเจาะจง IBM ผู้นำด้านโซลูชันระดับองค์กรและโครงการ …