home.social

#ииинфраструктура — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #ииинфраструктура, aggregated by home.social.

  1. Celestica DS6000 series: первая ласточка 1,6-терабитных сетей или массовый продукт?

    Сеть никогда не была самой гламурной частью ИИ-инфраструктуры. Все внимание всегда приковано к тысячам горячих GPU, которые с завидным упорством жгут электричество в дата-центрах, обучая очередную большую языковую модель. Но за любым масштабным ИИ-кластером невидимым фронтом стоит сетевая инфраструктура. Особенность современного ИИ-обучения в том, что это распределенная задача: сотни и тысячи ускорителей параллельно обмениваются гигабайтами данных. И как только сеть спотыкается, вся эта армия GPU простаивает в ожидании данных. И вот на эту сцену выходит Celestica с DS6000. Именно эти коммутаторы призваны стать теми самыми невидимыми героями, которые должны накормить ваши ИИ-кластеры терабитами данных.

    habr.com/ru/companies/selectel

    #Celestica_DS6000 #Celestica_DS6001 #Broadcom_Tomahawk_6 #1024_Tbps_switch #16T_Ethernet_switch #OSFP224 #ииинфраструктура #коммутаторы_для_AI #SONiC #selectel

  2. Celestica DS6000 series: первая ласточка 1,6-терабитных сетей или массовый продукт?

    Сеть никогда не была самой гламурной частью ИИ-инфраструктуры. Все внимание всегда приковано к тысячам горячих GPU, которые с завидным упорством жгут электричество в дата-центрах, обучая очередную большую языковую модель. Но за любым масштабным ИИ-кластером невидимым фронтом стоит сетевая инфраструктура. Особенность современного ИИ-обучения в том, что это распределенная задача: сотни и тысячи ускорителей параллельно обмениваются гигабайтами данных. И как только сеть спотыкается, вся эта армия GPU простаивает в ожидании данных. И вот на эту сцену выходит Celestica с DS6000. Именно эти коммутаторы призваны стать теми самыми невидимыми героями, которые должны накормить ваши ИИ-кластеры терабитами данных.

    habr.com/ru/companies/selectel

    #Celestica_DS6000 #Celestica_DS6001 #Broadcom_Tomahawk_6 #1024_Tbps_switch #16T_Ethernet_switch #OSFP224 #ииинфраструктура #коммутаторы_для_AI #SONiC #selectel

  3. Celestica DS6000 series: первая ласточка 1,6-терабитных сетей или массовый продукт?

    Сеть никогда не была самой гламурной частью ИИ-инфраструктуры. Все внимание всегда приковано к тысячам горячих GPU, которые с завидным упорством жгут электричество в дата-центрах, обучая очередную большую языковую модель. Но за любым масштабным ИИ-кластером невидимым фронтом стоит сетевая инфраструктура. Особенность современного ИИ-обучения в том, что это распределенная задача: сотни и тысячи ускорителей параллельно обмениваются гигабайтами данных. И как только сеть спотыкается, вся эта армия GPU простаивает в ожидании данных. И вот на эту сцену выходит Celestica с DS6000. Именно эти коммутаторы призваны стать теми самыми невидимыми героями, которые должны накормить ваши ИИ-кластеры терабитами данных.

    habr.com/ru/companies/selectel

    #Celestica_DS6000 #Celestica_DS6001 #Broadcom_Tomahawk_6 #1024_Tbps_switch #16T_Ethernet_switch #OSFP224 #ииинфраструктура #коммутаторы_для_AI #SONiC #selectel

  4. Celestica DS6000 series: первая ласточка 1,6-терабитных сетей или массовый продукт?

    Сеть никогда не была самой гламурной частью ИИ-инфраструктуры. Все внимание всегда приковано к тысячам горячих GPU, которые с завидным упорством жгут электричество в дата-центрах, обучая очередную большую языковую модель. Но за любым масштабным ИИ-кластером невидимым фронтом стоит сетевая инфраструктура. Особенность современного ИИ-обучения в том, что это распределенная задача: сотни и тысячи ускорителей параллельно обмениваются гигабайтами данных. И как только сеть спотыкается, вся эта армия GPU простаивает в ожидании данных. И вот на эту сцену выходит Celestica с DS6000. Именно эти коммутаторы призваны стать теми самыми невидимыми героями, которые должны накормить ваши ИИ-кластеры терабитами данных.

    habr.com/ru/companies/selectel

    #Celestica_DS6000 #Celestica_DS6001 #Broadcom_Tomahawk_6 #1024_Tbps_switch #16T_Ethernet_switch #OSFP224 #ииинфраструктура #коммутаторы_для_AI #SONiC #selectel

  5. Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

    В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint гетерогенного инференса: prefill — на GPU, decode — на SambaNova SN50 RDU, агентские действия — на Intel Xeon 6. Готовое решение обещают во второй половине 2026-го, и оно встает в обычную стойку 30 кВт с воздушным охлаждением, без капитальных переделок машинного зала. Идея такая: как только случился массовый приход агентов, decode перестал быть побочной фазой и становится доминирующей нагрузкой, а монолитная архитектура «GPU на всё» начала просаживаться по экономике. Коротко разберем, как это работает и почему это может стать востребованным.

    habr.com/ru/companies/ru_mts/a

    #Intel #SambaNova #Nvidia #Xeon_6 #RDU #SN50 #GPU #LLM #инференс #ИИинфраструктура

  6. Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

    В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint гетерогенного инференса: prefill — на GPU, decode — на SambaNova SN50 RDU, агентские действия — на Intel Xeon 6. Готовое решение обещают во второй половине 2026-го, и оно встает в обычную стойку 30 кВт с воздушным охлаждением, без капитальных переделок машинного зала. Идея такая: как только случился массовый приход агентов, decode перестал быть побочной фазой и становится доминирующей нагрузкой, а монолитная архитектура «GPU на всё» начала просаживаться по экономике. Коротко разберем, как это работает и почему это может стать востребованным.

    habr.com/ru/companies/ru_mts/a

    #Intel #SambaNova #Nvidia #Xeon_6 #RDU #SN50 #GPU #LLM #инференс #ИИинфраструктура

  7. Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

    В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint гетерогенного инференса: prefill — на GPU, decode — на SambaNova SN50 RDU, агентские действия — на Intel Xeon 6. Готовое решение обещают во второй половине 2026-го, и оно встает в обычную стойку 30 кВт с воздушным охлаждением, без капитальных переделок машинного зала. Идея такая: как только случился массовый приход агентов, decode перестал быть побочной фазой и становится доминирующей нагрузкой, а монолитная архитектура «GPU на всё» начала просаживаться по экономике. Коротко разберем, как это работает и почему это может стать востребованным.

    habr.com/ru/companies/ru_mts/a

    #Intel #SambaNova #Nvidia #Xeon_6 #RDU #SN50 #GPU #LLM #инференс #ИИинфраструктура

  8. Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU

    В апреле 2026-го Intel и ИИ-платформа SambaNova опубликовали совместный blueprint гетерогенного инференса: prefill — на GPU, decode — на SambaNova SN50 RDU, агентские действия — на Intel Xeon 6. Готовое решение обещают во второй половине 2026-го, и оно встает в обычную стойку 30 кВт с воздушным охлаждением, без капитальных переделок машинного зала. Идея такая: как только случился массовый приход агентов, decode перестал быть побочной фазой и становится доминирующей нагрузкой, а монолитная архитектура «GPU на всё» начала просаживаться по экономике. Коротко разберем, как это работает и почему это может стать востребованным.

    habr.com/ru/companies/ru_mts/a

    #Intel #SambaNova #Nvidia #Xeon_6 #RDU #SN50 #GPU #LLM #инференс #ИИинфраструктура

  9. Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

    Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего. Всем привет! Меня зовут Дмитрий Фырнин , я управляющий партнёр и технический директор в SENSE , и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения. В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления». А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

    habr.com/ru/companies/it_sense

    #llm #llmмодели #языковые_модели #ииинфраструктура #машинное_обучение #экономика_токенов #большие_языковые_модели #llmархитектура #ии #ии_и_машинное_обучение

  10. Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

    Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего. Всем привет! Меня зовут Дмитрий Фырнин , я управляющий партнёр и технический директор в SENSE , и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения. В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления». А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

    habr.com/ru/companies/it_sense

    #llm #llmмодели #языковые_модели #ииинфраструктура #машинное_обучение #экономика_токенов #большие_языковые_модели #llmархитектура #ии #ии_и_машинное_обучение

  11. Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

    Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего. Всем привет! Меня зовут Дмитрий Фырнин , я управляющий партнёр и технический директор в SENSE , и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения. В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления». А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

    habr.com/ru/companies/it_sense

    #llm #llmмодели #языковые_модели #ииинфраструктура #машинное_обучение #экономика_токенов #большие_языковые_модели #llmархитектура #ии #ии_и_машинное_обучение

  12. Жизнь сквозь призму LLM. Часть 1 — почему мы будем платить не за сервис, а за доступ к мышлению

    Разговор про большие языковые модели до сих пор слишком часто ведётся по одной из двух схем. Либо восторг: «смотрите, нейросеть уже пишет код и тексты», либо скепсис: «она всё равно галлюцинирует». Ни то, ни другое уже не отражает масштаб происходящего. Всем привет! Меня зовут Дмитрий Фырнин , я управляющий партнёр и технический директор в SENSE , и собрал серию материалов-рассуждений о том, как LLM меняют нашу жизнь — а где-то уже изменили — на уровне среды, в которой мы работаем и принимаем решения. В первой части разберём, как массовый спрос меняет природу LLM: почему они выходят из категории сервиса и начинают вести себя как инфраструктура или коммунальная услуга — со своей экономикой, токенами как единицей доступа и давлением рынка на стоимость «машинного мышления». А во второй части посмотрим на последствия: что происходит, когда между людьми появляется новая прослойка мышления, и как это начинает менять поведение, конфликты и сам способ принимать решения.

    habr.com/ru/companies/it_sense

    #llm #llmмодели #языковые_модели #ииинфраструктура #машинное_обучение #экономика_токенов #большие_языковые_модели #llmархитектура #ии #ии_и_машинное_обучение

  13. RAG без седых волос (или с?)

    Привет! Мы разработчики платформы AlfaGen — команда Умного поиска AdvancedRAG. Это внутренняя GenAI‑инфраструктура банка и продукты на её базе. В статье расскажем, как мы сделали Advanced RAG, чем он отличается от обычного Умного поиска — RAG. А ещё зачем вообще компаниям и пользователям такие продукты, и как вы можете сделать такой проект с меньшим числом седых волос.

    habr.com/ru/companies/alfa/art

    #advanced_rag #ролевая_модель #разграничение_прав_доступа #умный_поиск #ииинфраструктура #шардирование #чанкинг #hyde #промпты #реранкинг

  14. RAG без седых волос (или с?)

    Привет! Мы разработчики платформы AlfaGen — команда Умного поиска AdvancedRAG. Это внутренняя GenAI‑инфраструктура банка и продукты на её базе. В статье расскажем, как мы сделали Advanced RAG, чем он отличается от обычного Умного поиска — RAG. А ещё зачем вообще компаниям и пользователям такие продукты, и как вы можете сделать такой проект с меньшим числом седых волос.

    habr.com/ru/companies/alfa/art

    #advanced_rag #ролевая_модель #разграничение_прав_доступа #умный_поиск #ииинфраструктура #шардирование #чанкинг #hyde #промпты #реранкинг

  15. RAG без седых волос (или с?)

    Привет! Мы разработчики платформы AlfaGen — команда Умного поиска AdvancedRAG. Это внутренняя GenAI‑инфраструктура банка и продукты на её базе. В статье расскажем, как мы сделали Advanced RAG, чем он отличается от обычного Умного поиска — RAG. А ещё зачем вообще компаниям и пользователям такие продукты, и как вы можете сделать такой проект с меньшим числом седых волос.

    habr.com/ru/companies/alfa/art

    #advanced_rag #ролевая_модель #разграничение_прав_доступа #умный_поиск #ииинфраструктура #шардирование #чанкинг #hyde #промпты #реранкинг

  16. RAG без седых волос (или с?)

    Привет! Мы разработчики платформы AlfaGen — команда Умного поиска AdvancedRAG. Это внутренняя GenAI‑инфраструктура банка и продукты на её базе. В статье расскажем, как мы сделали Advanced RAG, чем он отличается от обычного Умного поиска — RAG. А ещё зачем вообще компаниям и пользователям такие продукты, и как вы можете сделать такой проект с меньшим числом седых волос.

    habr.com/ru/companies/alfa/art

    #advanced_rag #ролевая_модель #разграничение_прав_доступа #умный_поиск #ииинфраструктура #шардирование #чанкинг #hyde #промпты #реранкинг

  17. DeepSeek се научи да обучава езикови ИИ-модели, без значение от ограниченията на скоростта на паметта Както беш...

    #IT #Новини #Изкуствен #интелект #DeepSeek #ИИ-инфраструктура #ИИ-модели

    Origin | Interest | Match