#deepseek_r1 — Public Fediverse posts on home.social

Habr @[email protected] · 2025-08-14 · 17:12 UTC

Локальная LLM: гадкий утенок в мире прекрасных лебедей

Всем привет! Я — Иван, инженер по разработке AI-систем CodeInside. Мы разрабатываем и внедряем кастомные AI-решения — от интеллектуальных поисковых систем на основе RAG до специализированных AI-агентов и ассистентов для автоматизации процессов в бизнесе и промышленности. В этой статье я расскажу о результатах тестирования локальных и облачных LLM в RAG-сценариях. Мы сравнили их точность, полноту, достоверность и скорость работы, чтобы понять, насколько локальные модели готовы к реальным задачам и в каких случаях они могут быть не хуже — а иногда и лучше — облачных аналогов.

https://habr.com/ru/articles/937228/

#llm #llama_33_70b #gpt41_mini #gemini_25_flash #deepseek_r1 #Mistral_Small_3224B #Qwen3Coder30BA3B #onpremise #облачные_llm #локальные_llm

#локальные_llm #облачные_llm #onpremise #qwen3coder30ba3b #mistral_small_3224b #deepseek_r1

Habr @[email protected] · 2025-06-27 · 17:02 UTC

Виртуальные ассистенты: обзор самых «умных» нейросетей для ответов на вопросы

Ни для кого не секрет, что спрос на AI-ассистентов только растёт с каждым днём, причём растёт он практически во всех сферах жизни человека. Нейросети используют в копирайтинге, в бизнесе, ими пользуются программисты, у них ищут спасения студенты и школьники, когда материал непонятен или когда огромный текст нужен срочно, — словом, эти виртуальные помощники плотно вошли в нашу повседневную жизнь. Ну а в современной повседневной жизни новые вопросы возникают порой быстрее, чем мы успеваем найти верный и полный ответ на предыдущие, и было бы прекрасно знать, какие же нейросети наиболее умные, чтобы использовать их для ответов на вопросы, согласитесь. И сегодня мы с вами сравним 7 нейросетей и выделим из них топ-3.

https://habr.com/ru/companies/bothub/articles/922658/

#нейросети #промты #deepseek_r1 #сравнение #gpt_o1 #grok_3 #llama_4 #claude_opus_4 #perplexity_ai #gigachat_20

#нейросети #промты #deepseek_r1 #сравнение #gpt_o1 #grok_3

Habr @[email protected] · 2025-06-18 · 08:22 UTC

Ускорение DeepSeek-R1 с подвохом: Когда токены в секунду врут о реальной скорости

Токены летят быстрее, а результат — медленнее: парадокс квантизации DeepSeek-R1. Замеры 4 версий модели доказали: уменьшение размера ускоряет генерацию отдельных токенов, но что происходит с общим временем ответа?

https://habr.com/ru/articles/919452/

#deepseek #deepseek_r1 #deepseek_r10528 #ai #llm #llmмодели #gguf #кодогенерация #local_ai #llamacpp

#deepseek #deepseek_r1 #deepseek_r10528 #ai #llm #llmмодели

Habr @[email protected] · 2025-06-09 · 16:12 UTC

Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта

Локальный DeepSeek-R1-0528 на скромном железе? Реально. Со скоростью улитки? Первоначально – да. Но итог моего эксперимента: эту 'улитку' можно заставить работать вдвое быстрее.

https://habr.com/ru/articles/916966/

#deepseek #ai #llm #local_ai #epyc #deepseek_r1 #deepseek_v3 #llamacpp #huggingface #gguf

#gguf #huggingface #llamacpp #deepseek_v3 #deepseek_r1 #epyc

:rss: Hacker News @[email protected] · 2025-04-22 · 12:35 UTC

Does RL Incentivize Reasoning in LLMs Beyond the Base Model?
https://limit-of-rlvr.github.io/
#ycombinator #Qwen #Deepseek_R1 #PPO #GRPO #AIME #RLVR #Tsinghua_University

#ycombinator #qwen #deepseek_r1 #ppo #grpo #aime

Habr @[email protected] · 2025-03-25 · 17:52 UTC

Claude 3.7 Sonnet: Пора сдвинуть ChatGPT и Deepseek с лидирующих позиций

Последние месяцы рынок генеративного AI буквально кипит — одна за другой выходят мощные новинки. ChatGPT-4.5 от OpenAI , GROK-3 от X , свежие релизы от Google Gemini — и Anthropic не осталась в стороне, представив свою разработку: Claude 3.7 Sonnet. Как заявляют разработчики , новый AI не просто стал быстрее и умнее своих предшественников, он первым внедрил «гибридную модель рассуждений». В этой статье я хочу оценить способности новой модели и, разумеется, выяснить на практике, действительно ли Claude 3.7 Sonnet соответствует всему, что наобещали разработчики. Приятного прочтения)

https://habr.com/ru/companies/bothub/articles/894146/

#ai #искусственный_интеллект #claude_37_sonnet #claude_35 #deepseek_r1 #gpt

#gpt #deepseek_r1 #claude_35 #claude_37_sonnet #искусственный_интеллект #ai

Habr @[email protected] · 2025-02-18 · 11:42 UTC

Битва титанов: DeepSeek VS ChatGPT

Привет, Хабр! Ну что ж, пожалуй, вы уже все знаете и о том, что такое DeepSeek, и о его бешеной популярности. Предлагаю разобраться, почему он вызвал такой большой интерес среди пользователей и разработчиков.

https://habr.com/ru/companies/reksoft/articles/883530/

#deepseek #deepseek_r1 #chatgpt #moe #openai #codeforces

#codeforces #openai #moe #chatgpt #deepseek_r1 #deepseek

Habr @[email protected] · 2025-02-17 · 11:02 UTC

Так ли хороша DeepSeek-R1, как о ней говорят

Во всем AI-мире сейчас говорят о новой китайской языковой модели DeepSeek и, конечно, наша команда развития AI не могла пройти мимо этой темы. Мы сравнили ответы новой модели на реальные запросы к нашей технической поддержке с ответами других популярных моделей. Что из этого получилось и какие выводы мы сделали расскажу я — Максим Михайлов, продуктовый менеджер Узнать подробности

https://habr.com/ru/companies/cloud_ru/articles/882630/

#llmмодели #deepseek #qwen25max #o3mini #o1mini #openai #gpt4 #deepseek_r1 #сравнение

#сравнение #deepseek_r1 #gpt4 #openai #o1mini #o3mini

✅💃Màdiq🙈🙉🙊Iźichi💃✅ @[email protected] · 2025-02-11 · 00:54 UTC

i'm taking #deepseek_r1 offline for about 400SGD, it's creepy looking at it's thought processes, but after "thinking" it still fucked up despite it's ability to reason and no more "server busy"

gave me a 376 word speech, despite it being able to reason that the speech length was 5-7 minutes...

#kopitiam #singlish

the skill now is not using AI, but rather, cleaning the AI output so that "our work" passes AI detection tools like #turnitin

it's ok to "build on the work of AI" 🤣

#deepseek_r1 #kopitiam #singlish #turnitin

Habr @[email protected] · 2025-02-07 · 08:32 UTC

Запускаем DeepSeek-R1 на обычном сервере с 768Гб ОЗУ в LM-Studio

Если у вас нет парка видеокарт, но есть сервер с ОЗУ то не отчаивайтесь, вы тоже можете запустить DeepSeek R1 :-) Покажу на практике как легко и просто без использования командной строки запустить полноразмерную модель DeepSeek R1 на сервере с 768 гигами ОЗУ и что из этого получилось. Статья подойдет и для тех кто хочет и на домашнем компе запустить нейросети, но не знает с чего начать.

https://habr.com/ru/articles/880328/

#deepseek_r1 #нейросеть_локально #LM_Studio #ИИ #гайд

#гайд #ии #lm_studio #нейросеть_локально #deepseek_r1

Habr @[email protected] · 2025-01-28 · 15:32 UTC

[Перевод] Аномалии DeepSeek-v3 и DeepSeek-r1: глюкнутые токены и чат, теряющий идентичность

«Аномальные», «глючные» и «непроизносимые» токены в больших языковых моделях (LLM) — это те, которые вызывают странное поведение или не функционируют как обычный текст. Это явление было впервые открыто и задокументировано в случае GPT-2 и GPT-3 , но до сих пор таких аномалий не находили в DeepSeek‑V3 . Поэтому я решил сделать это сам. Поскольку V3 является опенсорсной SOTA‑моделью, обладающей весьма необычными свойствами, она показалась мне идеальным кандидатом. Перед вами обзор глючных токенов, которые я обнаружил в DeepSeek после ряда экспериментов, а также некоторые предварительные наблюдения об их поведении.

https://habr.com/ru/companies/bothub/articles/877326/

#ии #ai #deepseek #deepseek_v3 #deepseek_r1 #токенизация #галлюцинации_ии

#галлюцинации_ии #токенизация #deepseek_r1 #deepseek_v3 #deepseek #ai