GitHub เปิด Open Data ของ Source Code กว่า 2.8 ล้านรายการให้ใช้ได้ฟรีบน Google BigQuery

GitHub ได้ประกาศเปิดข้อมูล Source Code จาก 2.8 ล้าน Repositories ให้ผู้ที่สนใจสามารถเข้าถึงและทำการวิเคราะห์ได้ฟรีๆ ผ่าน Google BigQuery แล้ว

Credit: ShutterStock.com
Credit: ShutterStock.com

ข้อมูลทั้งหมดนี้นับเป็นขนาด 3TB ซึ่งประกอบจาก Unique Commit 145 ล้านรายการ, 2,000 ล้าน File Path และ 163 ล้าน File จาก Revision ล่าสุด ในขณะที่บริการ Google BigQuery นั้นเปิดให้วิเคราะห์ข้อมูลได้ฟรีๆ เดือนละ 1TB

ใครที่อยากลองเข้าไปวิเคราะห์ข้อมูลเหล่านี้ดู ลองอ่าน Starter Queries เป็นแนวทางได้ที่ https://gist.github.com/arfon/49ca314a5b0a00b1ebf91167db3ff02c#most-commonly-used-go-packages และมี Blog จากนักพัฒนา Google BigQuery เขียนแนะแนวทางเอาไว้ที่ https://medium.com/@hoffa/github-on-bigquery-analyze-all-the-code-b3576fd2b150#.jub2d05p1 ด้วยครับ

ที่มา: http://venturebeat.com/2016/06/29/github-releases-data-on-2-8-million-open-source-repositories-through-google-bigquery/

About techtalkthai

ทีมงาน TechTalkThai เป็นกลุ่มบุคคลที่ทำงานในสาย Enterprise IT ที่มีความเชี่ยวชาญทางด้าน Network, Security, Server, Storage, Operating System และ Virtualization มารวมตัวกันเพื่ออัพเดตข่าวสารทางด้าน Enterprise IT ให้แก่ชาว IT ในไทยโดยเฉพาะ

Check Also

Sonar เข้าซื้อกิจการ Gitar สตาร์ตอัป AI Code Review ยกระดับระบบตรวจสอบโค้ดด้วย Agentic Reasoning

Sonar ผู้ให้บริการแพลตฟอร์มตรวจสอบคุณภาพและความมั่นคงปลอดภัยของโค้ด ประกาศเข้าซื้อกิจการ Gitar สตาร์ตอัปผู้เชี่ยวชาญด้านระบบ AI-native Code Review การเข้าซื้อกิจการครั้งนี้มีเป้าหมายเพื่อผสานความสามารถด้านการคิดวิเคราะห์ของ Gitar เข้ากับเอนจินตรวจสอบโค้ดของ Sonar เพื่อสร้างความมั่นคงปลอดภัยที่รัดกุมยิ่งขึ้นสำหรับทีม DevOps ในยุคที่ …

Huawei เปิดตัวสถาปัตยกรรมชิปใหม่ แก้ปัญหาคว่ำบาตรและข้อจำกัด Moore’s Law

Huawei Technologies ยักษ์ใหญ่ด้านอิเล็กทรอนิกส์จากจีนได้เปิดตัวเฟรมเวิร์กการออกแบบชิปใหม่ ซึ่งบริษัทระบุว่าจะช่วยลดช่องว่างในอุตสาหกรรมเซมิคอนดักเตอร์กับผู้นำระดับโลกอย่าง TSMC และ Nvidia ได้