GitHub เปิด Open Data ของ Source Code กว่า 2.8 ล้านรายการให้ใช้ได้ฟรีบน Google BigQuery

GitHub ได้ประกาศเปิดข้อมูล Source Code จาก 2.8 ล้าน Repositories ให้ผู้ที่สนใจสามารถเข้าถึงและทำการวิเคราะห์ได้ฟรีๆ ผ่าน Google BigQuery แล้ว

Credit: ShutterStock.com
Credit: ShutterStock.com

ข้อมูลทั้งหมดนี้นับเป็นขนาด 3TB ซึ่งประกอบจาก Unique Commit 145 ล้านรายการ, 2,000 ล้าน File Path และ 163 ล้าน File จาก Revision ล่าสุด ในขณะที่บริการ Google BigQuery นั้นเปิดให้วิเคราะห์ข้อมูลได้ฟรีๆ เดือนละ 1TB

ใครที่อยากลองเข้าไปวิเคราะห์ข้อมูลเหล่านี้ดู ลองอ่าน Starter Queries เป็นแนวทางได้ที่ https://gist.github.com/arfon/49ca314a5b0a00b1ebf91167db3ff02c#most-commonly-used-go-packages และมี Blog จากนักพัฒนา Google BigQuery เขียนแนะแนวทางเอาไว้ที่ https://medium.com/@hoffa/github-on-bigquery-analyze-all-the-code-b3576fd2b150#.jub2d05p1 ด้วยครับ

ที่มา: http://venturebeat.com/2016/06/29/github-releases-data-on-2-8-million-open-source-repositories-through-google-bigquery/

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Salesforce เข้าซื้อกิจการ Fin มูลค่าราว 3,600 ล้านดอลลาร์ เสริมแกร่ง AI Agent งานบริการลูกค้า

Salesforce ประกาศลงนามข้อตกลงขั้นสุดท้ายเข้าซื้อกิจการ Fin ผู้ให้บริการแพลตฟอร์ม customer agent ในมูลค่าราว 3,600 ล้านดอลลาร์สหรัฐ เพื่อนำเทคโนโลยี AI Agent สำหรับงานบริการลูกค้ามาเสริมความสามารถให้กับ Agentforce

Cisco ออกแพตช์แก้ช่องโหว่ Zero-day บน Catalyst SD-WAN Manager ที่ถูกใช้โจมตียกระดับสิทธิ์เป็น root

Cisco ปล่อยอัปเดตด้านความปลอดภัยแก้ช่องโหว่บน Catalyst SD-WAN Manager (เดิมคือ SD-WAN vManage) หลังพบว่าถูกใช้โจมตีจริงในลักษณะ Zero-day เพื่อยกระดับสิทธิ์เป็น root บนระบบที่ได้รับผลกระทบ