Octoverse คือคำที่ใช้เรียกรายงานสถิติประจำปีของ GitHub จากการสำรวจกลุ่มนักพัฒนาบน Repository ในหลายแง่มุม โดยมีสถิติประจำปี 2018 ด้าน Machine Learning พบว่า Python คือภาษายอดนิยมอันดับหนึ่งของโปรเจ็คด้าน ML

ภาษายอดนิยมอันดับหนึ่งที่ใช้พัฒนาโปรเจ็คด้าน Machine Learning คือ Python ซึ่งยังรั้งอันดับ 3 หากนับโปรเจ็คทั้งหมดบน GitHub อีกด้วย (ไม่เฉพาะแค่ ML) อย่างไรก็ตามแม้ว่าภาษาอย่าง Jalia และ R จะติดโผ 1 ใน 10 ในด้าน ML แต่ในภาพรวมก็ไม่ได้โดดเด่นนักเพราะนิยมมากแค่ในกลุ่ม Data Scientist เช่นเดียวกับภาษา Scala จะเจาะจงไปกับระบบ Big Data มากกว่า เช่น Apache Spark

สถิติของ Package ที่ถูกนำไปใช้งานต่อมากที่สุดมีดังนี้ (ชมภาพด้านบน)
-
Numpy – เป็นแพ็กเกจที่รองรับในเรื่องของการคำนวณของข้อมูลหลายมิติ (Multidimensional)
-
Scipy – ช่วยคำนวณทางวิทยาศาสตร์
-
Pandas – ช่วยจัดการเกี่ยวกับ Datasets
-
Matplotlib – ไลบรารีที่ช่วยให้มองเห็นภาพ (ช่วยพล็อตกราฟให้เห็นลักษณะข้อมูล)
-
Tensorflow – ทำงานเกี่ยวกับ Neural Networks
-
Scikit-learn – มีการสร้างอัลกอริทึมด้าน ML ไว้จำนวนมาก
-
Six – ไลบรารี่ช่วยทำให้ Python 2 และ 3 ทำงานรองรับกันได้
-
Python-dateutil และ Pytz – ทำงานเกี่ยวกับเรื่องวันที่

โปรเจ็คด้าน ML ที่มีการใช้งานเยอะที่สุดหนีไม่พ้น Tensorflow ซึ่งนอกจากจะครองอันดับหนึ่งแล้วยังมากกว่าอันดับสองอย่าง Scikit-learn ไปถึง 5 เท่าทีเดียว โดยโปรเจ็คเรื่อง NLP ที่ติดอันดับคือ spaCy และ rasa_nlu และสุดท้ายงานด้าน Image Processing มีโปรเจ็ค openpose, darkflow, face_recognition และ tesseract ติดอันดับเข้ามาในโผด้วยตามรูปด้านบน
ที่มา : https://github.blog/2019-01-24-the-state-of-the-octoverse-machine-learning
TechTalkThai ศูนย์รวมข่าว Enterprise IT ออนไลน์แห่งแรกในประเทศไทย






