home.social

#deepseek_r1 — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #deepseek_r1, aggregated by home.social.

  1. Локальная LLM: гадкий утенок в мире прекрасных лебедей

    Всем привет! Я — Иван, инженер по разработке AI-систем CodeInside. Мы разрабатываем и внедряем кастомные AI-решения — от интеллектуальных поисковых систем на основе RAG до специализированных AI-агентов и ассистентов для автоматизации процессов в бизнесе и промышленности. В этой статье я расскажу о результатах тестирования локальных и облачных LLM в RAG-сценариях. Мы сравнили их точность, полноту, достоверность и скорость работы, чтобы понять, насколько локальные модели готовы к реальным задачам и в каких случаях они могут быть не хуже — а иногда и лучше — облачных аналогов.

    habr.com/ru/articles/937228/

    #llm #llama_33_70b #gpt41_mini #gemini_25_flash #deepseek_r1 #Mistral_Small_3224B #Qwen3Coder30BA3B #onpremise #облачные_llm #локальные_llm

  2. Виртуальные ассистенты: обзор самых «умных» нейросетей для ответов на вопросы

    Ни для кого не секрет, что спрос на AI-ассистентов только растёт с каждым днём, причём растёт он практически во всех сферах жизни человека. Нейросети используют в копирайтинге, в бизнесе, ими пользуются программисты, у них ищут спасения студенты и школьники, когда материал непонятен или когда огромный текст нужен срочно, — словом, эти виртуальные помощники плотно вошли в нашу повседневную жизнь. Ну а в современной повседневной жизни новые вопросы возникают порой быстрее, чем мы успеваем найти верный и полный ответ на предыдущие, и было бы прекрасно знать, какие же нейросети наиболее умные, чтобы использовать их для ответов на вопросы, согласитесь. И сегодня мы с вами сравним 7 нейросетей и выделим из них топ-3.

    habr.com/ru/companies/bothub/a

    #нейросети #промты #deepseek_r1 #сравнение #gpt_o1 #grok_3 #llama_4 #claude_opus_4 #perplexity_ai #gigachat_20

  3. Ускорение DeepSeek-R1 с подвохом: Когда токены в секунду врут о реальной скорости

    Токены летят быстрее, а результат — медленнее: парадокс квантизации DeepSeek-R1. Замеры 4 версий модели доказали: уменьшение размера ускоряет генерацию отдельных токенов, но что происходит с общим временем ответа?

    habr.com/ru/articles/919452/

    #deepseek #deepseek_r1 #deepseek_r10528 #ai #llm #llmмодели #gguf #кодогенерация #local_ai #llamacpp

  4. Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта

    Локальный DeepSeek-R1-0528 на скромном железе? Реально. Со скоростью улитки? Первоначально – да. Но итог моего эксперимента: эту 'улитку' можно заставить работать вдвое быстрее.

    habr.com/ru/articles/916966/

    #deepseek #ai #llm #local_ai #epyc #deepseek_r1 #deepseek_v3 #llamacpp #huggingface #gguf

  5. Claude 3.7 Sonnet: Пора сдвинуть ChatGPT и Deepseek с лидирующих позиций

    Последние месяцы рынок генеративного AI буквально кипит — одна за другой выходят мощные новинки. ChatGPT-4.5 от OpenAI , GROK-3 от X , свежие релизы от Google Gemini — и Anthropic не осталась в стороне, представив свою разработку: Claude 3.7 Sonnet. Как заявляют разработчики , новый AI не просто стал быстрее и умнее своих предшественников, он первым внедрил «гибридную модель рассуждений». В этой статье я хочу оценить способности новой модели и, разумеется, выяснить на практике, действительно ли Claude 3.7 Sonnet соответствует всему, что наобещали разработчики. Приятного прочтения)

    habr.com/ru/companies/bothub/a

    #ai #искусственный_интеллект #claude_37_sonnet #claude_35 #deepseek_r1 #gpt

  6. Битва титанов: DeepSeek VS ChatGPT

    Привет, Хабр! Ну что ж, пожалуй, вы уже все знаете и о том, что такое DeepSeek, и о его бешеной популярности. Предлагаю разобраться, почему он вызвал такой большой интерес среди пользователей и разработчиков.

    habr.com/ru/companies/reksoft/

    #deepseek #deepseek_r1 #chatgpt #moe #openai #codeforces

  7. Так ли хороша DeepSeek-R1, как о ней говорят

    Во всем AI-мире сейчас говорят о новой китайской языковой модели DeepSeek и, конечно, наша команда развития AI не могла пройти мимо этой темы. Мы сравнили ответы новой модели на реальные запросы к нашей технической поддержке с ответами других популярных моделей. Что из этого получилось и какие выводы мы сделали расскажу я — Максим Михайлов, продуктовый менеджер Узнать подробности

    habr.com/ru/companies/cloud_ru

    #llmмодели #deepseek #qwen25max #o3mini #o1mini #openai #gpt4 #deepseek_r1 #сравнение

  8. i'm taking #deepseek_r1 offline for about 400SGD, it's creepy looking at it's thought processes, but after "thinking" it still fucked up despite it's ability to reason and no more "server busy"

    gave me a 376 word speech, despite it being able to reason that the speech length was 5-7 minutes...

    #kopitiam #singlish

    the skill now is not using AI, but rather, cleaning the AI output so that "our work" passes AI detection tools like #turnitin

    it's ok to "build on the work of AI" 🤣

  9. Запускаем DeepSeek-R1 на обычном сервере с 768Гб ОЗУ в LM-Studio

    Если у вас нет парка видеокарт, но есть сервер с ОЗУ то не отчаивайтесь, вы тоже можете запустить DeepSeek R1 :-) Покажу на практике как легко и просто без использования командной строки запустить полноразмерную модель DeepSeek R1 на сервере с 768 гигами ОЗУ и что из этого получилось. Статья подойдет и для тех кто хочет и на домашнем компе запустить нейросети, но не знает с чего начать.

    habr.com/ru/articles/880328/

    #deepseek_r1 #нейросеть_локально #LM_Studio #ИИ #гайд

  10. [Перевод] Аномалии DeepSeek-v3 и DeepSeek-r1: глюкнутые токены и чат, теряющий идентичность

    «Аномальные», «глючные» и «непроизносимые» токены в больших языковых моделях (LLM) — это те, которые вызывают странное поведение или не функционируют как обычный текст. Это явление было впервые открыто и задокументировано в случае GPT-2 и GPT-3 , но до сих пор таких аномалий не находили в DeepSeek‑V3 . Поэтому я решил сделать это сам. Поскольку V3 является опенсорсной SOTA‑моделью, обладающей весьма необычными свойствами, она показалась мне идеальным кандидатом. Перед вами обзор глючных токенов, которые я обнаружил в DeepSeek после ряда экспериментов, а также некоторые предварительные наблюдения об их поведении.

    habr.com/ru/companies/bothub/a

    #ии #ai #deepseek #deepseek_v3 #deepseek_r1 #токенизация #галлюцинации_ии