ค่ายใหญ่ออกมาเปิด Open Source ให้ระบบ Machine Learning กันหมดแล้ว ไม่เว้นแม้แต่ Baidu จากจีน
Baidu ยักษ์ใหญ่ทางด้าน Search Engine จากจีน ได้ประกาศเปิด Open Source ให้กับระบบ Machine Learning Framework ที่ใช้ C++ และ Python ในการพัฒนาภายใต้ชื่อโครงการว่า PaddlePaddle โดยคำว่า Paddle นี้ย่อมาจาก PArallel Distributed Deep LEarning นั่นเอง และได้เริ่มใช้ PaddlePaddle ในการทำ Speech Transcription สำหรับภาษาจีนไปแล้วด้วยการใช้ไฟล์เสียงความยาวกว่า 20,000 ชั่วโมงในการฝึก
Core Library ของ PaddlePaddle นี้ใช้ภาษา C++ เพื่อความเร็วสูงสุด พร้อมใช้ความสามารถจาก GPU และ Intel SSE/AVX เพื่อเร่งความเร็ววในการประมวลผลด้วย โดยผู้ใช้งานสามารถเรียกใช้งานได้โดยตรงจาก C++ รวมถึงยังมี PyDataProvider2 ที่เป็น Library สำหรับให้ภาษา Python เรียกใช้งาน ซึ่งภายใน PyDataProvider2 เองนี้ก็มีการผสานเทคโนโลยี Multithreading และ Cache ลงไปในตัวเพื่อใหห้การรับส่งข้อมูลเป็นไปได้ด้วยประสิทธิภาพสูงสุด
การ Training ใดๆ นั้นก็สามารถเกิดขึ้นได้อย่างง่ายดายบนระบบ Cluster ที่มี GPU หรือไม่มี GPU ก็ได้ โดย PaddlePaddle นี้จะช่วยให้การพัฒนาโค้ดใช้เวลาเพียง 25% สำหรับการพัฒนาระบบที่มีความคล้ายคลึงกันกับเดิม
ผู้ที่สนใจสามารถศึกษารายละเอียดเพิ่มเติมได้ที่ http://www.paddlepaddle.org/ เลยนะครับ โดยก่อนหน้านี้ Baidu ยังเคยเปิด OpenSource ให้กับระบบอื่นๆ อย่าง Baidu File System, Galaxy สำหรับบริหารจัดการ Cluster และ Shuttle ระบบ Framework สำหรับใช้ใน MapReduce มาแล้ว