GitHub เปิด Open Data ของ Source Code กว่า 2.8 ล้านรายการให้ใช้ได้ฟรีบน Google BigQuery

GitHub ได้ประกาศเปิดข้อมูล Source Code จาก 2.8 ล้าน Repositories ให้ผู้ที่สนใจสามารถเข้าถึงและทำการวิเคราะห์ได้ฟรีๆ ผ่าน Google BigQuery แล้ว

Credit: ShutterStock.com
Credit: ShutterStock.com

ข้อมูลทั้งหมดนี้นับเป็นขนาด 3TB ซึ่งประกอบจาก Unique Commit 145 ล้านรายการ, 2,000 ล้าน File Path และ 163 ล้าน File จาก Revision ล่าสุด ในขณะที่บริการ Google BigQuery นั้นเปิดให้วิเคราะห์ข้อมูลได้ฟรีๆ เดือนละ 1TB

ใครที่อยากลองเข้าไปวิเคราะห์ข้อมูลเหล่านี้ดู ลองอ่าน Starter Queries เป็นแนวทางได้ที่ https://gist.github.com/arfon/49ca314a5b0a00b1ebf91167db3ff02c#most-commonly-used-go-packages และมี Blog จากนักพัฒนา Google BigQuery เขียนแนะแนวทางเอาไว้ที่ https://medium.com/@hoffa/github-on-bigquery-analyze-all-the-code-b3576fd2b150#.jub2d05p1 ด้วยครับ

ที่มา: http://venturebeat.com/2016/06/29/github-releases-data-on-2-8-million-open-source-repositories-through-google-bigquery/

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

บริษัทซอฟต์แวร์คลาวด์ ServiceTitan ประกาศ IPO หวังระดมทุนสูงสุด 502 ล้านดอลลาร์

ServiceTitan ผู้ให้บริการซอฟต์แวร์คลาวด์สำหรับธุรกิจ ประกาศเสนอขายหุ้นต่อสาธารณะครั้งแรก (IPO) โดยตั้งเป้าระดมทุนสูงสุดถึง 502 ล้านดอลลาร์สหรัฐ จากการเสนอขายหุ้นจำนวน 8.8 ล้านหุ้น ในช่วงราคาหุ้นละ 52 ถึง 57 ดอลลาร์

Tuskira เปิดตัวพร้อมทุน 28.5 ล้านดอลลาร์ ยกระดับความมั่นคงปลอดภัยไซเบอร์ด้วย AI

สตาร์ทอัพด้านการตรวจจับภัยคุกคาม Tuskira เปิดตัวพร้อมระดมทุน 28.5 ล้านดอลลาร์จากกลุ่มนักลงทุนที่นำโดย Intel Capital และ SYN Ventures มุ่งเร่งนวัตกรรม AI การผสานระบบ และยกระดับการรักษาความมั่นคงปลอดภัยไซเบอร์ขององค์กรด้วยกลยุทธ์เชิงรุกที่รวมเครื่องมือเข้าด้วยกันและลดความเสี่ยงแบบเรียลไทม์