Meta เปิดตัวซูเปอร์คอมพิวเตอร์ใหม่ เตรียมใช้ฝึกปัญญาประดิษฐ์ขนาดล้านล้านพารามิเตอร์

Share

Loading

Meta เปิดตัวซูเปอร์คอมพิวเตอร์ AI Research SuperCluster (RSC) ที่คาดว่าจะใช้งานเต็มที่กลางปี 2022 นี้ ภายในเป็นคลัสเตอร์ของเครื่อง DGX A100 ตอนนี้มีจำนวน 760 เครื่องมาเชื่อมเข้าด้วยกัน รวมชิปกราฟิก 6,080 ชุด และเมื่อคลัสเตอร์เต็มจะใช้ชิปกราฟิก 16,000 ชุด พลังประมวลผลรวมเมื่อเครื่องเสร็จจะอยู่ที่ 5 exaflops ทาง Meta เชื่อว่าน่าจะเร็วที่สุดในโลกเมื่อสร้างเสร็จ

ระบบสตอเรจของ RSC มีสามระดับ ข้อมูลทั่วไปใช้ Pure Storage Flash Array ขนาด 175PB, แคชใช้ Penguin Computing Altus ขนาด 46PB, และ NFS ของ Pure Storage FlashBlade อีก 10PB

แม้ตอนนี้จะยังสร้างไม่เสร็จดีแต่ Meta ก็พบว่าเครื่องใหม่นี้ประสิทธิภาพดีกว่าคลัสเตอร์เดิมมาก สามารถฝึกโมเดลขนาดใหญ่ได้เร็วกว่าเดิม 3 เท่าตัว คือฝึกโมเดลขนาดหมื่นล้านพารามิเตอร์ได้ในสามสัปดาห์จากเดิมเก้าสัปดาห์ เป้าหมายของ Meta คือการฝึกโมเดลขนาดล้านล้านพารามิเตอร์ ซึ่งต้องใช้ข้อมูลฝึกระดับ exabyte

แหล่งข้อมูล

https://www.blognone.com/node/126843