home.social

#h100_pcie — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #h100_pcie, aggregated by home.social.

  1. GPT-OSS-20B / 120B: Сухие цифры после реальных тестов

    GPT-OSS - тесты на реальном железе: производительность моделей 20B и 120B на RTX 4090, RTX 5090 и H100. Реальные метрики TPS, сравнение скорости генерации и практические выводы о том, какую модель выбрать для локального использования.

    habr.com/ru/articles/938960/

    #GPTOSS20B #GPTOSS120B #TPS_токены_в_секунду #RTX_4090_vs_RTX_5090 #Ollama #H100_PCIe #llm #локальная_LLM #VRAM_использование #vllm

  2. GPT-OSS-20B / 120B: Сухие цифры после реальных тестов

    GPT-OSS - тесты на реальном железе: производительность моделей 20B и 120B на RTX 4090, RTX 5090 и H100. Реальные метрики TPS, сравнение скорости генерации и практические выводы о том, какую модель выбрать для локального использования.

    habr.com/ru/articles/938960/

    #GPTOSS20B #GPTOSS120B #TPS_токены_в_секунду #RTX_4090_vs_RTX_5090 #Ollama #H100_PCIe #llm #локальная_LLM #VRAM_использование #vllm

  3. GPT-OSS-20B / 120B: Сухие цифры после реальных тестов

    GPT-OSS - тесты на реальном железе: производительность моделей 20B и 120B на RTX 4090, RTX 5090 и H100. Реальные метрики TPS, сравнение скорости генерации и практические выводы о том, какую модель выбрать для локального использования.

    habr.com/ru/articles/938960/

    #GPTOSS20B #GPTOSS120B #TPS_токены_в_секунду #RTX_4090_vs_RTX_5090 #Ollama #H100_PCIe #llm #локальная_LLM #VRAM_использование #vllm

  4. GPT-OSS-20B / 120B: Сухие цифры после реальных тестов

    GPT-OSS - тесты на реальном железе: производительность моделей 20B и 120B на RTX 4090, RTX 5090 и H100. Реальные метрики TPS, сравнение скорости генерации и практические выводы о том, какую модель выбрать для локального использования.

    habr.com/ru/articles/938960/

    #GPTOSS20B #GPTOSS120B #TPS_токены_в_секунду #RTX_4090_vs_RTX_5090 #Ollama #H100_PCIe #llm #локальная_LLM #VRAM_использование #vllm