GitHub เปิด Open Data ของ Source Code กว่า 2.8 ล้านรายการให้ใช้ได้ฟรีบน Google BigQuery

GitHub ได้ประกาศเปิดข้อมูล Source Code จาก 2.8 ล้าน Repositories ให้ผู้ที่สนใจสามารถเข้าถึงและทำการวิเคราะห์ได้ฟรีๆ ผ่าน Google BigQuery แล้ว

Credit: ShutterStock.com
Credit: ShutterStock.com

ข้อมูลทั้งหมดนี้นับเป็นขนาด 3TB ซึ่งประกอบจาก Unique Commit 145 ล้านรายการ, 2,000 ล้าน File Path และ 163 ล้าน File จาก Revision ล่าสุด ในขณะที่บริการ Google BigQuery นั้นเปิดให้วิเคราะห์ข้อมูลได้ฟรีๆ เดือนละ 1TB

ใครที่อยากลองเข้าไปวิเคราะห์ข้อมูลเหล่านี้ดู ลองอ่าน Starter Queries เป็นแนวทางได้ที่ https://gist.github.com/arfon/49ca314a5b0a00b1ebf91167db3ff02c#most-commonly-used-go-packages และมี Blog จากนักพัฒนา Google BigQuery เขียนแนะแนวทางเอาไว้ที่ https://medium.com/@hoffa/github-on-bigquery-analyze-all-the-code-b3576fd2b150#.jub2d05p1 ด้วยครับ

ที่มา: http://venturebeat.com/2016/06/29/github-releases-data-on-2-8-million-open-source-repositories-through-google-bigquery/

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Elastic 9.4 ออกแล้ว

Elastic ได้ออกมาประกาศเปิดตัว Elastic 9.4 อย่างเป็นทางการ โดยเพิ่มความสามารถในการตรวจสอบการทำงานของ Context Engineering, Application และ Infrastructure เพิ่มเติม, เสริม AI ในการรักษาความมั่นคงปลอดภัย และเพิ่มความสามารถอื่นๆ อีกมากมาย ดังนี้

Extreme Networks เปิดตัว Wi-Fi 7 AP รุ่นใหม่ พร้อม Agentic AI สำหรับบริหารจัดการระบบเครือข่ายแบบอัตโนมัติ

Extreme Networks ได้ออกมาประกาศถึงอัปเดตครั้งใหญ่ โดยเปิดตัว Wi-Fi 7 Access Point รุ่นใหม่ล่าสุด 5 รุ่น พร้อมนวัตกรรมใหม่ในการบริหารจัดการระบบเครือข่ายด้วย AI Agent เพื่อดูแลรักษาระบบเครือข่ายขององค์กรให้ทำงานได้อย่างต่อเนื่องโดยอัตโนมัติ