Black Hat Asia 2023

Baidu ตั้งเป้าสร้าง 100 ฐานข้อมูลภาษาจีนสำหรับงาน NLP ภายใน 3 ปี

Baidu ได้เปิดเผยแผนการที่ชื่อว่า ‘Qian Yan’ ไอเดียก็คือพยายามสร้างฐานข้อมูลสำหรับงานด้าน Natural Language Process ให้ได้อย่างน้อย 100 ฐานข้อมูล ภายใน 3 ปีข้างหน้าเพื่อให้กำเนิดนวัตกรรมใหม่ๆ

Credit: Baidu

ทีม Baidu NLP ได้ถือกำเนิดขึ้นมากว่า 10 ปีแล้ว ซึ่งจากประสบการณ์ทีมงานเห็นว่าการศึกษาวิจัยยังมีอุปสรรคเรื่องของปริมาณข้อมูล (Dataset) ไมค่อยจะเพียงพอ ด้วยเหตุนี้เองจึงมีการประกาศแผนการที่ชื่อ Qian Yan (แปลว่าคำนับพัน) โดยเริ่มแรกได้จับมือกับ China Compute Federation และ Chinese Information Processing Society of China เพื่อเปิดตัวโครงการนี้ พร้อมกับความหวังที่ว่าจะสร้างฐานข้อมูล NLP ภาษาจีนที่ยิ่งใหญ่ที่สุดในโลกขึ้น โดยตั้งเป้าว่าภายใน 3 ปีข้างหน้าจะสามารถสร้าง Dataset ได้มากกว่า 100 ชุด ที่สามารถตอบโจทย์ในงานต่างๆ กว่า 20 งาน (งานแต่ละแบบก็ใช้ลักษณะภาษาแตกต่างกัน)

อย่างไรก็ดีในขั้นแรก Qian Yan จะครอบคลุมในงาน 7 ด้านเช่น Open-domain Dialogue Systems, Reading Comprehension และอื่นๆ ประกอบด้วย Dataset กว่า 20 ชุดแบบโอเพ่นซอร์ส ซึ่งได้ความร่วมมือจาก 11 มหาวิทยาลัยและองค์กรต่างๆ

จริงๆ แล้ว Baidu ถือเป็นผู้เล่นในด้าน NLP ชั้นนำเช่น Knowledge Graph, Natural Language Understanding และ Downstream Application โดยมีผลงานเป็นรูปธรรมเช่น ERNIE (Semantic Understanding), PaddlePaddle, TextMind, Baidu Brain’s Intelligent Creation Platform ในวาระเดียวกันนี้มีการเปิดตัวโซลูชันที่ชื่อ ‘AI Simultaneous Interpretation Conferencing’ ที่นำเสนอการการทำ Conference Interpreter ด้วยอุปกรณ์เพียงเครื่องเดียว

ที่มา :  https://syncedreview.com/2020/08/27/introducing-qian-yan-baidus-new-plan-to-build-100-chinese-nlp-datasets-in-three-years/


About nattakon

จบการศึกษา ปริญญาตรีและโท สาขาวิศวกรรมคอมพิวเตอร์ KMITL เคยทำงานด้าน Engineer/Presale ดูแลผลิตภัณฑ์ด้าน Network Security และ Public Cloud ในประเทศ ปัจจุบันเป็นนักเขียน Full-time ที่ TechTalkThai

Check Also

พลิกมุมคิดการจัดการคลาวด์ไอทีอย่างสมาร์ตฉบับวีเอ็มแวร์ [Guest Post]

แม้คลาวด์จะกลายเป็นส่วนหนึ่งของการพาองค์กรก้าวข้ามวิกฤตไปสู่การสร้างสรรค์โมเดลธุรกิจหรือกลยุทธ์การแข่งขันใหม่ ด้วยคุณลักษณะที่คล่องตัว (Agility) ในการปรับความต้องการใช้งานโดยอัตโนมัติ (Auto-Scaling) ได้ด้วยตัวเอง (Self-Services) ทว่าหลายองค์กรซึ่งเลือกปฏิวัติระบบธุรกิจขึ้นสู่คลาวด์กลับประสบปัญหาการจัดการทรัพยากรที่ยิบย่อยบนคลาวด์ไม่ไหว แถมหัวจะปวดกับภัยคุกคามที่ยุ่งยากในการป้องกัน ด้วยเหตุนี้ ความคาดหวังต่อไอทีคลาวด์ยุคถัดไป คือ การปรับแต่งแอปพลิเคชันและแพลตฟอร์มคลาวด์ไอทีให้ทันสมัยตรงต่อความต้องการทางธุรกิจ ภายใต้ระบบการรักษาความปลอดภัยแบบองค์รวมที่แข็งแกร่ง ทั่วถึง และเป็นอัตโนมัติกว่าเดิม

Microsoft Teams, VirtualBox, Tesla ถูกเจาะ Zero-days ในงาน Pwn2Own

Microsoft Teams, VirtualBox, Tesla ถูกเจาะ Zero-days ในงาน Pwn2Own Vancouver 2023 ผู้เข้าแข่งขันกวาดเงินรางวัลสูงสุด 475,000 เหรียญ หรือประมาณ 16 …