NVIDIA Spectrum-X болон oracle meta гэх компаниуд сонгох болсон шалтгаан
NVIDIA Spectrum-X гэдэг нь хиймэл оюун (AI) болон өндөр хүчин чадалтай тооцооллын (HPC) зориулалттай Ethernet сүлжээний тусгай платформ юм. Энэ нь уламжлалт Ethernet-ийн хязгаарлалтыг арилгаж, AI дата төвүүдийн GPU-ууд хоорондын мэдээлэл дамжуулалтыг маш өндөр хурдтай, бага сааталтай, оновчтой болгох зорилготой бүтээгдсэн.
Spectrum-X нь NVIDIA-ийн бүтээсэн AI зориулалттай Ethernet сүлжээний шийдэл бөгөөд дараах хоёр үндсэн хэсгээс бүрдэнэ:
- NVIDIA Spectrum-4 Switch
→ 51.2 Tbps (терабит/секунд) дамжуулах чадалтай өндөр хурдны коммутатор.
→ 64 хүртэлх портыг 800 Gbps-аар холбох боломжтой.
- NVIDIA BlueField-3 SuperNIC
→ GPU эсвэл сервер бүр дээр байрладаг тусгай сүлжээний интерфэйс.
→ AI-ийн өгөгдлийн урсгалыг ухаалаг хянаж, саатал болон бөглөрөл үүсэхээс сэргийлдэг.
Уламжлалт Ethernet сүлжээ нь видео дамжуулалт, вэб үйлчилгээ, файл хуваалцах зэрэг ердийн ачаалалд сайн ажилладаг.
Гэхдээ AI сургалт бол маш өөр:
- Олон мянган GPU нэгэн зэрэг ажилладаг
- Тогтмол, хоёр чиглэлтэй асар их өгөгдөл дамждаг
- Саатал (latency) болон алдагдал (packet loss) нь шууд сургалтын хугацаанд нөлөөлдөг
Spectrum-X нь үүнийг шийдэхийн тулд:
- Сүлжээний бөглөрөл үүсэхээс урьдчилан сэргийлдэг “AI-aware congestion control”
- Ухаалаг чиглүүлэлт (adaptive routing)
- Хурдны уялдаа (synchronization) сайжруулсан AI-телеметрийн систем ашигладаг.
NVIDIA-ийн туршилтаар:
- Spectrum-X ашиглахад 95% хүртэл дамжуулалтын үр ашиг (throughput efficiency) гарсан.
- Харин стандарт Ethernet-ийнх 60% орчим байдаг.
- Үүний үр дүнд AI сургалтын хугацаа 1.5–2 дахин богиносож болно.
Meta болон Oracle компаниуд NVIDIA-ийн Spectrum-X Ethernet сүлжээний шилэн коммутаторууд (switches)-ыг хиймэл оюун (AI) дата төвүүддээ ашиглахаар болсныг зарлажээ.
- Meta нь Spectrum-X-ийг FBOSS (Facebook Open Switching System) болон Minipack3N switches-тэйгээ нэгтгэн ашиглах ба, энэ нь GPU-үүдийн хоорондын хурдан, бага сааталтай мэдээлэл солилцох боломжийг нэмэгдүүлэх зорилготой байна.
- Oracle компани энэ технологийг ашиглан “gigascale” буюу маш их хэмжээний AI суперкомпьютеруудыг бүтээхдээ ашиглах гэж байгаа бөгөөд NVIDIA-гийн Vera Rubin архитектуртай холбох юм.
Юу түлхэц үзүүлж байна вэ
- Өндөр хурд, бага саатал: Spectrum-X нь олон GPU-тэй дата төвүүдийн хоорондох мэдээлэл дамжуулахад саадгүй, өндөр дамжуулалттай сүлжээний шийдэл болдог.
- Өргөтгөх чадвар: Их хэмжээний датаг нэг дор боловсруулан дамжуулах боломтой учраас AI-ийн сургалтын болон inference (тооцоо хийх) үеийн гүйцэтгэл сайжирна.
- Өөрсдийн сүлжээний удирдлага болон программ хангамжийн интеграц: Meta FBOSS шиг өөрсдийнх нь системтэй холбож ашиглах боломж нь тэдэнд уян хатан, оновчтой шийдэл авчирч байна.
Сул тал, анхаарах асуудлууд
- Зардал ихтэй: Ийм өндөр үзүүлэлттэй сүлжээний тоног төхөөрөмжийн үнэ өндөр, мөн суурилуулалт, засвар үйлчилгээ нь нарийн мэргэжлийн баг шаарддаг.
- Эцсийн хэрэглэгчийн нууцлал ба аюулгүй байдал: Их хэмжээний дата дамжихад мэдээлэл хамгаалалт, сүлжээний халдлагаас сэргийлэх технологи чухал болно.
- Өмнөх дэд бүтэцтэй нийцүүлэх асуудал: Хэрвээ өмнө нь ашиглаж байсан тоног төхөөрөмж, программ хангамж нь шинэ коммутаторуудтай таарахгүй бол дахин тохируулалт, шинэчлэлт шаардлага гарна.
Эх сурвалж https://www.artificialintelligence-news.com/news/meta-and-oracle-choose-nvidia-spectrum-x-for-ai-data-centres/
Мэдээ бэлтгэсэн: ЭША Н.Билгүүтэй
Бусад мэдээлэл