GitHub ได้ประกาศเปิดข้อมูล Source Code จาก 2.8 ล้าน Repositories ให้ผู้ที่สนใจสามารถเข้าถึงและทำการวิเคราะห์ได้ฟรีๆ ผ่าน Google BigQuery แล้ว
ข้อมูลทั้งหมดนี้นับเป็นขนาด 3TB ซึ่งประกอบจาก Unique Commit 145 ล้านรายการ, 2,000 ล้าน File Path และ 163 ล้าน File จาก Revision ล่าสุด ในขณะที่บริการ Google BigQuery นั้นเปิดให้วิเคราะห์ข้อมูลได้ฟรีๆ เดือนละ 1TB
ใครที่อยากลองเข้าไปวิเคราะห์ข้อมูลเหล่านี้ดู ลองอ่าน Starter Queries เป็นแนวทางได้ที่ https://gist.github.com/arfon/49ca314a5b0a00b1ebf91167db3ff02c#most-commonly-used-go-packages และมี Blog จากนักพัฒนา Google BigQuery เขียนแนะแนวทางเอาไว้ที่ https://medium.com/@hoffa/github-on-bigquery-analyze-all-the-code-b3576fd2b150#.jub2d05p1 ด้วยครับ