#ииинфраструктура — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-12 · 08:02 UTC

Celestica DS6000 series: первая ласточка 1,6-терабитных сетей или массовый продукт?

Сеть никогда не была самой гламурной частью ИИ-инфраструктуры. Все внимание всегда приковано к тысячам горячих GPU, которые с завидным упорством жгут электричество в дата-центрах, обучая очередную большую языковую модель. Но за любым масштабным ИИ-кластером невидимым фронтом стоит сетевая инфраструктура. Особенность современного ИИ-обучения в том, что это распределенная задача: сотни и тысячи ускорителей параллельно обмениваются гигабайтами данных. И как только сеть спотыкается, вся эта армия GPU простаивает в ожидании данных. И вот на эту сцену выходит Celestica с DS6000. Именно эти коммутаторы призваны стать теми самыми невидимыми героями, которые должны накормить ваши ИИ-кластеры терабитами данных.

https://habr.com/ru/companies/selectel/articles/1032992/

#Celestica_DS6000 #Celestica_DS6001 #Broadcom_Tomahawk_6 #1024_Tbps_switch #16T_Ethernet_switch #OSFP224 #ииинфраструктура #коммутаторы_для_AI #SONiC #selectel

#selectel #sonic #коммутаторы_для_ai #ииинфраструктура #osfp224 #16t_ethernet_switch

Habr @[email protected] · 2026-05-12 · 08:02 UTC

Celestica DS6000 series: первая ласточка 1,6-терабитных сетей или массовый продукт?

Сеть никогда не была самой гламурной частью ИИ-инфраструктуры. Все внимание всегда приковано к тысячам горячих GPU, которые с завидным упорством жгут электричество в дата-центрах, обучая очередную большую языковую модель. Но за любым масштабным ИИ-кластером невидимым фронтом стоит сетевая инфраструктура. Особенность современного ИИ-обучения в том, что это распределенная задача: сотни и тысячи ускорителей параллельно обмениваются гигабайтами данных. И как только сеть спотыкается, вся эта армия GPU простаивает в ожидании данных. И вот на эту сцену выходит Celestica с DS6000. Именно эти коммутаторы призваны стать теми самыми невидимыми героями, которые должны накормить ваши ИИ-кластеры терабитами данных.

https://habr.com/ru/companies/selectel/articles/1032992/

#Celestica_DS6000 #Celestica_DS6001 #Broadcom_Tomahawk_6 #1024_Tbps_switch #16T_Ethernet_switch #OSFP224 #ииинфраструктура #коммутаторы_для_AI #SONiC #selectel

#selectel #sonic #коммутаторы_для_ai #ииинфраструктура #osfp224 #16t_ethernet_switch

Habr @[email protected] · 2026-05-12 · 08:02 UTC

Celestica DS6000 series: первая ласточка 1,6-терабитных сетей или массовый продукт?

Сеть никогда не была самой гламурной частью ИИ-инфраструктуры. Все внимание всегда приковано к тысячам горячих GPU, которые с завидным упорством жгут электричество в дата-центрах, обучая очередную большую языковую модель. Но за любым масштабным ИИ-кластером невидимым фронтом стоит сетевая инфраструктура. Особенность современного ИИ-обучения в том, что это распределенная задача: сотни и тысячи ускорителей параллельно обмениваются гигабайтами данных. И как только сеть спотыкается, вся эта армия GPU простаивает в ожидании данных. И вот на эту сцену выходит Celestica с DS6000. Именно эти коммутаторы призваны стать теми самыми невидимыми героями, которые должны накормить ваши ИИ-кластеры терабитами данных.

https://habr.com/ru/companies/selectel/articles/1032992/

#Celestica_DS6000 #Celestica_DS6001 #Broadcom_Tomahawk_6 #1024_Tbps_switch #16T_Ethernet_switch #OSFP224 #ииинфраструктура #коммутаторы_для_AI #SONiC #selectel

#selectel #sonic #коммутаторы_для_ai #ииинфраструктура #osfp224 #16t_ethernet_switch

Habr @[email protected] · 2026-05-12 · 08:02 UTC

Celestica DS6000 series: первая ласточка 1,6-терабитных сетей или массовый продукт?

Сеть никогда не была самой гламурной частью ИИ-инфраструктуры. Все внимание всегда приковано к тысячам горячих GPU, которые с завидным упорством жгут электричество в дата-центрах, обучая очередную большую языковую модель. Но за любым масштабным ИИ-кластером невидимым фронтом стоит сетевая инфраструктура. Особенность современного ИИ-обучения в том, что это распределенная задача: сотни и тысячи ускорителей параллельно обмениваются гигабайтами данных. И как только сеть спотыкается, вся эта армия GPU простаивает в ожидании данных. И вот на эту сцену выходит Celestica с DS6000. Именно эти коммутаторы призваны стать теми самыми невидимыми героями, которые должны накормить ваши ИИ-кластеры терабитами данных.

https://habr.com/ru/companies/selectel/articles/1032992/

#Celestica_DS6000 #Celestica_DS6001 #Broadcom_Tomahawk_6 #1024_Tbps_switch #16T_Ethernet_switch #OSFP224 #ииинфраструктура #коммутаторы_для_AI #SONiC #selectel

#celestica_ds6000 #celestica_ds6001 #broadcom_tomahawk_6 #1024_tbps_switch #16t_ethernet_switch #osfp224

Habr @[email protected] · 2026-05-10 · 07:12 UTC

Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint гетерогенного инференса: prefill — на GPU, decode — на SambaNova SN50 RDU, агентские действия — на Intel Xeon 6. Готовое решение обещают во второй половине 2026-го, и оно встает в обычную стойку 30 кВт с воздушным охлаждением, без капитальных переделок машинного зала. Идея такая: как только случился массовый приход агентов, decode перестал быть побочной фазой и становится доминирующей нагрузкой, а монолитная архитектура «GPU на всё» начала просаживаться по экономике. Коротко разберем, как это работает и почему это может стать востребованным.

https://habr.com/ru/companies/ru_mts/articles/1033082/

#Intel #SambaNova #Nvidia #Xeon_6 #RDU #SN50 #GPU #LLM #инференс #ИИинфраструктура

#ииинфраструктура #инференс #llm #gpu #sn50 #rdu

Habr @[email protected] · 2026-05-10 · 07:12 UTC

Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint гетерогенного инференса: prefill — на GPU, decode — на SambaNova SN50 RDU, агентские действия — на Intel Xeon 6. Готовое решение обещают во второй половине 2026-го, и оно встает в обычную стойку 30 кВт с воздушным охлаждением, без капитальных переделок машинного зала. Идея такая: как только случился массовый приход агентов, decode перестал быть побочной фазой и становится доминирующей нагрузкой, а монолитная архитектура «GPU на всё» начала просаживаться по экономике. Коротко разберем, как это работает и почему это может стать востребованным.

https://habr.com/ru/companies/ru_mts/articles/1033082/

#Intel #SambaNova #Nvidia #Xeon_6 #RDU #SN50 #GPU #LLM #инференс #ИИинфраструктура

#ииинфраструктура #инференс #llm #gpu #sn50 #rdu

Habr @[email protected] · 2026-05-10 · 07:12 UTC

Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint гетерогенного инференса: prefill — на GPU, decode — на SambaNova SN50 RDU, агентские действия — на Intel Xeon 6. Готовое решение обещают во второй половине 2026-го, и оно встает в обычную стойку 30 кВт с воздушным охлаждением, без капитальных переделок машинного зала. Идея такая: как только случился массовый приход агентов, decode перестал быть побочной фазой и становится доминирующей нагрузкой, а монолитная архитектура «GPU на всё» начала просаживаться по экономике. Коротко разберем, как это работает и почему это может стать востребованным.

https://habr.com/ru/companies/ru_mts/articles/1033082/

#Intel #SambaNova #Nvidia #Xeon_6 #RDU #SN50 #GPU #LLM #инференс #ИИинфраструктура

#ииинфраструктура #инференс #llm #gpu #sn50 #rdu

Habr @[email protected] · 2026-05-10 · 07:12 UTC

Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint гетерогенного инференса: prefill — на GPU, decode — на SambaNova SN50 RDU, агентские действия — на Intel Xeon 6. Готовое решение обещают во второй половине 2026-го, и оно встает в обычную стойку 30 кВт с воздушным охлаждением, без капитальных переделок машинного зала. Идея такая: как только случился массовый приход агентов, decode перестал быть побочной фазой и становится доминирующей нагрузкой, а монолитная архитектура «GPU на всё» начала просаживаться по экономике. Коротко разберем, как это работает и почему это может стать востребованным.

https://habr.com/ru/companies/ru_mts/articles/1033082/

#Intel #SambaNova #Nvidia #Xeon_6 #RDU #SN50 #GPU #LLM #инференс #ИИинфраструктура

#intel #sambanova #nvidia #xeon_6 #rdu #sn50

Habr @[email protected] · 2026-04-29 · 12:12 UTC

Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего. Всем привет! Меня зовут Дмитрий Фырнин , я управляющий партнёр и технический директор в SENSE , и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения. В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления». А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

https://habr.com/ru/companies/it_sense/articles/1029606/

#llm #llmмодели #языковые_модели #ииинфраструктура #машинное_обучение #экономика_токенов #большие_языковые_модели #llmархитектура #ии #ии_и_машинное_обучение

#ии_и_машинное_обучение #ии #llmархитектура #большие_языковые_модели #экономика_токенов #машинное_обучение

Habr @[email protected] · 2026-04-29 · 12:12 UTC

Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего. Всем привет! Меня зовут Дмитрий Фырнин , я управляющий партнёр и технический директор в SENSE , и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения. В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления». А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

https://habr.com/ru/companies/it_sense/articles/1029606/

#llm #llmмодели #языковые_модели #ииинфраструктура #машинное_обучение #экономика_токенов #большие_языковые_модели #llmархитектура #ии #ии_и_машинное_обучение

#ии_и_машинное_обучение #ии #llmархитектура #большие_языковые_модели #экономика_токенов #машинное_обучение

Habr @[email protected] · 2026-04-29 · 12:12 UTC

Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего. Всем привет! Меня зовут Дмитрий Фырнин , я управляющий партнёр и технический директор в SENSE , и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения. В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления». А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

https://habr.com/ru/companies/it_sense/articles/1029606/

#llm #llmмодели #языковые_модели #ииинфраструктура #машинное_обучение #экономика_токенов #большие_языковые_модели #llmархитектура #ии #ии_и_машинное_обучение

#ии_и_машинное_обучение #ии #llmархитектура #большие_языковые_модели #экономика_токенов #машинное_обучение

Habr @[email protected] · 2026-04-29 · 12:12 UTC

Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего. Всем привет! Меня зовут Дмитрий Фырнин , я управляющий партнёр и технический директор в SENSE , и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения. В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления». А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

https://habr.com/ru/companies/it_sense/articles/1029606/

#llm #llmмодели #языковые_модели #ииинфраструктура #машинное_обучение #экономика_токенов #большие_языковые_модели #llmархитектура #ии #ии_и_машинное_обучение

#llm #llmмодели #языковые_модели #ииинфраструктура #машинное_обучение #экономика_токенов

Habr @[email protected] · 2026-03-18 · 09:02 UTC

RAG без седых волос (или с?)

Привет! Мы разработчики платформы AlfaGen — команда Умного поиска AdvancedRAG. Это внутренняя GenAI‑инфраструктура банка и продукты на её базе. В статье расскажем, как мы сделали Advanced RAG, чем он отличается от обычного Умного поиска — RAG. А ещё зачем вообще компаниям и пользователям такие продукты, и как вы можете сделать такой проект с меньшим числом седых волос.

https://habr.com/ru/companies/alfa/articles/1009016/

#advanced_rag #ролевая_модель #разграничение_прав_доступа #умный_поиск #ииинфраструктура #шардирование #чанкинг #hyde #промпты #реранкинг

#реранкинг #промпты #hyde #чанкинг #шардирование #ииинфраструктура

Habr @[email protected] · 2026-03-18 · 09:02 UTC

RAG без седых волос (или с?)

Привет! Мы разработчики платформы AlfaGen — команда Умного поиска AdvancedRAG. Это внутренняя GenAI‑инфраструктура банка и продукты на её базе. В статье расскажем, как мы сделали Advanced RAG, чем он отличается от обычного Умного поиска — RAG. А ещё зачем вообще компаниям и пользователям такие продукты, и как вы можете сделать такой проект с меньшим числом седых волос.

https://habr.com/ru/companies/alfa/articles/1009016/

#advanced_rag #ролевая_модель #разграничение_прав_доступа #умный_поиск #ииинфраструктура #шардирование #чанкинг #hyde #промпты #реранкинг

#реранкинг #промпты #hyde #чанкинг #шардирование #ииинфраструктура

Habr @[email protected] · 2026-03-18 · 09:02 UTC

RAG без седых волос (или с?)

Привет! Мы разработчики платформы AlfaGen — команда Умного поиска AdvancedRAG. Это внутренняя GenAI‑инфраструктура банка и продукты на её базе. В статье расскажем, как мы сделали Advanced RAG, чем он отличается от обычного Умного поиска — RAG. А ещё зачем вообще компаниям и пользователям такие продукты, и как вы можете сделать такой проект с меньшим числом седых волос.

https://habr.com/ru/companies/alfa/articles/1009016/

#advanced_rag #ролевая_модель #разграничение_прав_доступа #умный_поиск #ииинфраструктура #шардирование #чанкинг #hyde #промпты #реранкинг

#реранкинг #промпты #hyde #чанкинг #шардирование #ииинфраструктура

Habr @[email protected] · 2026-03-18 · 09:02 UTC

RAG без седых волос (или с?)

Привет! Мы разработчики платформы AlfaGen — команда Умного поиска AdvancedRAG. Это внутренняя GenAI‑инфраструктура банка и продукты на её базе. В статье расскажем, как мы сделали Advanced RAG, чем он отличается от обычного Умного поиска — RAG. А ещё зачем вообще компаниям и пользователям такие продукты, и как вы можете сделать такой проект с меньшим числом седых волос.

https://habr.com/ru/companies/alfa/articles/1009016/

#advanced_rag #ролевая_модель #разграничение_прав_доступа #умный_поиск #ииинфраструктура #шардирование #чанкинг #hyde #промпты #реранкинг

#advanced_rag #ролевая_модель #разграничение_прав_доступа #умный_поиск #ииинфраструктура #шардирование

deepseek @[email protected] · 2026-01-14 · 09:11 UTC

DeepSeek се научи да обучава езикови ИИ-модели, без значение от ограниченията на скоростта на паметта Както беш...

#IT #Новини #Изкуствен #интелект #DeepSeek #ИИ-инфраструктура #ИИ-модели

Origin | Interest | Match

#it #новини #изкуствен #интелект #deepseek #ииинфраструктура