#infiniband — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #infiniband, aggregated by home.social.
-
Как мы внедряли QoS InfiniBand для приоритизации ML-обучений с точки зрения сети
В статье расскажем, как мы командой Yandex Infrastructure внедрили QoS в сетях InfiniBand при ограниченной вендорской поддержке и скудной практической документации. Обсудим мотивацию: рост смешанных нагрузок во внутреннем облаке и необходимость предсказуемых SLO для различных обучений. Отдельно рассмотрим как могут быть связаны QoS и топология сети DragonFly+.
https://habr.com/ru/companies/yandex_cloud_and_infra/articles/1015226/
-
Нейро сети для самых маленьких
Нейро сети для самых маленьких Каждый раз, когда вы говорите нейросети « Спасибо », вы запускаете конвейер, в котором перемножаются сотни матриц с миллиардами элементов, и сжигаете электричества столько же, сколько светодиодная лампа за несколько секунд. Это первая статья из небольшого цикла, посвящённого сетям для AI/ML-кластеров и HPC. В этой серии мы коснёмся принципов работы и обучения моделей, параллелизации, технологий DMA и RDMA, сетевых топологий, InfiniBand и RoCE, а ещё пофилософствуем на тему общих и специальных решений. Конкретно в этой статье мы разберёмся, что представляет из себя нейросеть, как она работает, как происходит её обучение, а самое главное, почему для неё нужны сотни дорогущих GPU-карточек и какая-то особенная сеть. Рефрен сегодняшней истории: в нейросетях нет никакой магии — это просто множество простых операций над числами, которые выполняются на компьютерах со специальными чипами. Магии нет ни в том, как они работают, ни в той инфраструктуре, на которой они запускаются. Ныряем!
https://habr.com/ru/articles/982820/
#ai #ml #roce #infiniband #трансформеры #нейросети #llm #mlp #backpropagation
-
Нейро сети для самых маленьких
Нейро сети для самых маленьких Каждый раз, когда вы говорите нейросети « Спасибо », вы запускаете конвейер, в котором перемножаются сотни матриц с миллиардами элементов, и сжигаете электричества столько же, сколько светодиодная лампа за несколько секунд. Это первая статья из небольшого цикла, посвящённого сетям для AI/ML-кластеров и HPC. В этой серии мы коснёмся принципов работы и обучения моделей, параллелизации, технологий DMA и RDMA, сетевых топологий, InfiniBand и RoCE, а ещё пофилософствуем на тему общих и специальных решений. Конкретно в этой статье мы разберёмся, что представляет из себя нейросеть, как она работает, как происходит её обучение, а самое главное, почему для неё нужны сотни дорогущих GPU-карточек и какая-то особенная сеть. Рефрен сегодняшней истории: в нейросетях нет никакой магии — это просто множество простых операций над числами, которые выполняются на компьютерах со специальными чипами. Магии нет ни в том, как они работают, ни в той инфраструктуре, на которой они запускаются. Ныряем!
https://habr.com/ru/articles/982820/
#ai #ml #roce #infiniband #трансформеры #нейросети #llm #mlp #backpropagation
-
RE: https://mastodon.social/@h4ckernews/115709034881203323
This is technically impressive. I didn't expect to see RDMA support on macOS, let alone running over Thunderbolt. They seem to provide a standard InfiniBand Verbs API but I couldn't find the sources of their driver (rdma_en5) and libraries yet. I guess they won't release the sources.
-
Five years after Intel spun off its #Omni-Path #interconnect tech into Cornelis Networks, its 400Gbps CN5000 line of switches and NICs is finally ready to do battle with its long-time rival, Nvidia's #InfiniBand www.theregister.com/2025/06/09/o... #HPC #AI via @theregister.com
Omni-Path is back to take on I... -
New blog “How AI Ate My Blog on RoCEv2”. #PeterWelcher #CCIE1773 #AI #ECN #PFC #RoCEV2 #Infiniband. URL: https://www.linkedin.com/pulse/ai-ate-my-blog-rocev2-peter-welcher-uu9ue/.
-
Apparently if you push a wookie, you can expect to get a cookie in response.
I'm not sure I'll be trying this one myself.
-
What If #OmniPath Morphs Into The Best #UltraEthernet?
Many #HPC centers in #US – importantly #Sandia and #LawrenceLivermore as well as the Texas Advanced Computing Center (#TACC) – wanted an alternative to #InfiniBand or proprietary interconnects like #HPE/#Cray’s Slingshot, and they have been funding the redevelopment of Omni-Path. And now, #CornelisNetworks is going to be intersecting its roadmap with Omni-Path switches and adapters with the #UEC roadmap.
https://www.nextplatform.com/2024/06/26/what-if-omni-path-morphs-into-the-best-ultra-ethernet/ -
What If #OmniPath Morphs Into The Best #UltraEthernet?
Many #HPC centers in #US – importantly #Sandia and #LawrenceLivermore as well as the Texas Advanced Computing Center (#TACC) – wanted an alternative to #InfiniBand or proprietary interconnects like #HPE/#Cray’s Slingshot, and they have been funding the redevelopment of Omni-Path. And now, #CornelisNetworks is going to be intersecting its roadmap with Omni-Path switches and adapters with the #UEC roadmap.
https://www.nextplatform.com/2024/06/26/what-if-omni-path-morphs-into-the-best-ultra-ethernet/ -
What If #OmniPath Morphs Into The Best #UltraEthernet?
Many #HPC centers in #US – importantly #Sandia and #LawrenceLivermore as well as the Texas Advanced Computing Center (#TACC) – wanted an alternative to #InfiniBand or proprietary interconnects like #HPE/#Cray’s Slingshot, and they have been funding the redevelopment of Omni-Path. And now, #CornelisNetworks is going to be intersecting its roadmap with Omni-Path switches and adapters with the #UEC roadmap.
https://www.nextplatform.com/2024/06/26/what-if-omni-path-morphs-into-the-best-ultra-ethernet/ -
What If #OmniPath Morphs Into The Best #UltraEthernet?
Many #HPC centers in #US – importantly #Sandia and #LawrenceLivermore as well as the Texas Advanced Computing Center (#TACC) – wanted an alternative to #InfiniBand or proprietary interconnects like #HPE/#Cray’s Slingshot, and they have been funding the redevelopment of Omni-Path. And now, #CornelisNetworks is going to be intersecting its roadmap with Omni-Path switches and adapters with the #UEC roadmap.
https://www.nextplatform.com/2024/06/26/what-if-omni-path-morphs-into-the-best-ultra-ethernet/ -
What If #OmniPath Morphs Into The Best #UltraEthernet?
Many #HPC centers in #US – importantly #Sandia and #LawrenceLivermore as well as the Texas Advanced Computing Center (#TACC) – wanted an alternative to #InfiniBand or proprietary interconnects like #HPE/#Cray’s Slingshot, and they have been funding the redevelopment of Omni-Path. And now, #CornelisNetworks is going to be intersecting its roadmap with Omni-Path switches and adapters with the #UEC roadmap.
https://www.nextplatform.com/2024/06/26/what-if-omni-path-morphs-into-the-best-ultra-ethernet/ -
Eleven years ago I volunteered to add native #Infiniband / #RDMA support to #ZeroMQ. At the time I was working on high-performance networking and I thought it was a nice challenge... but shortly afterwards I landed my job at @mozilla and never finished it.
Since then I've been contacted multiple times by people who wished to finish my work but none succeeded. Last time was yesterday. Maybe I should give it a spin again: https://zeromq-dev.zeromq.narkive.com/a3hbU2H1/contributing-native-infiniband-rdma-support-to-0mq