home.social

#дипсик — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #дипсик, aggregated by home.social.

  1. [Перевод] Итоги LLM в 2025 году: прогресс, проблемы и прогнозы

    Один из лучших обозревателей в мире LLM выпустил масштабный разбор всего самого важного, что случилось с языковыми моделями в 2025 году. Я перевел, чтобы как можно больше людей прочитало этот фундаментальный труд. Здесь про архитектуры, GRPO и про то, почему бенчмарки больше ничего не значат. Дальше — слово автору.

    habr.com/ru/articles/982496/

    #LLM #ллм #большие_языковые_модели #архитектуры_ai #ai #ии #искусственный_интеллект #deepseek #дипсик #grpo

  2. [Перевод] Технический обзор моделей DeepSeek от V3 до V3.2

    Три самые постоянные вещи в мире — оливье с мандаринами на Новый год, желание начать новую жизнь с понедельника и то, что если выходит статья Себастьяна Рашки, то я делаю ее качественный перевод на русский. Эта перевод крутой технически глубокая статьи известного исследователя LLM о том, как эволюционировали флагманские модели с открытыми весами от DeepSeek и обзор DeepSeek V3.2.

    habr.com/ru/articles/973954/

    #deepseek #дипсик #архитектуры_ai #llm #ллм #архитектура_llmприложений #большие_языковые_модели

  3. [Перевод] Технический обзор моделей DeepSeek от V3 до V3.2 Три самые постоянные вещи в мире — оливье с мандаринами ...

    #deepseek #дипсик #архитектуры #ai #llm #ллм #архитектура #llm-приложений #большие #языковые #модели

    Origin | Interest | Match
  4. [Перевод] Технический обзор моделей DeepSeek от V3 до V3.2 Три самые постоянные вещи в мире — оливье с мандаринами ...

    #deepseek #дипсик #архитектуры #ai #llm #ллм #архитектура #llm-приложений #большие #языковые #модели

    Origin | Interest | Match
  5. Исчезнувший агент

    Недавно прошла конференция Яндекса по ИИ и облачным технологиям. Впечатлила работа с AI Studio, демонстрирующая возможность создавать агентов "на лету", даже не используя программирования. Естественно, любую вещь надо попробовать, и я принялся за дело. Захожу в студию, выбираю модель - Qwen 3 выбрал, пишу промпт. Агент будет выполнять роль сотрудника отдела аренды, рассказывать о наличие помещений, их стоимости, площади, условиях использования и оплаты. Чтобы не усложнять, прямо в промпте в формате Json информацию и начинаю тестировать, задавая вопросы. Список вопросов прямо из записей облачной АТС, чтобы было всё по-взрослому. В целом ответы агента устраивают, вполне живой разговор получается. Внезапно вспоминаю, что въезд на территорию платный и пишу уточнение в промпте - "въезд платный, можно однократно платить, или купить абонемент" А дальше начинается треш:) - Подскажи, въезд на территорию платный? - Нет, въезд бесплатный для всех арендаторов! Что за фигня, думаю. Ладно, уточняю в промпте - "строгое уточнение -въезд на территорию платный!" Агент не сдается - Въезд на территорию бесплатный для всех арендаторов. Да что за... Переписываю промпт, ставлю упоминание о платном въезде в самом начале, - результат не меняется, агент держится за свою позицию о бесплатном въезде. Еще после пары итераций сдаюсь, редактирую целиком агента, заменяя модель Qwen на модель Яндекс Pro. И чего вы думаете - опять "Въезд бесплатный для всех арендаторов" Добавляю Правила въезда: - Въезд на территорию платный для всех - Никаких исключений для арендаторов - Нет пропусков или свободного доступа - Оплата: разово или абонементом

    habr.com/ru/articles/955426/

    #искусственный_интеллект #агенты #модели #яндекс #юмор #дипсик

  6. Дипсик не работает: Обходим ошибку Deepseek service is busy хитрым способом

    DeepSeek всё чаще оказывается недоступен из-за перегруженности серверов. В этой статье решим проблему оригинальным способом – установим Дипсик локально, чтобы он работал вообще без подключения к Интернету.

    habr.com/ru/articles/878498/

    #deepseek_r1 #deepseek_v3 #deepseek_ai #deepseek #дипсик #нейросети #ии_помощник #ииассистент #ии_чатбот

  7. [Перевод] Сможет ли DeepSeek R-1 ответить на эти 5 сложных для ИИ вопросов?

    Каждый раз, когда появляется новая языковая модель, у меня всегда возникает желание проверить ее с помощью нескольких обманчиво простых, но каверзных вопросов. Это моя личная привычка - своего рода стресс-тест, чтобы проверить, насколько хорошо эти модели справляются с логикой и рассуждениями. Несколько дней назад вышел DeepSeek R-1, и он сразу же стал мировой сенсацией благодаря тому, что это умная ИИ-модель с открытым исходным кодом, и тому, как хорошо она работает с логикой. Бенчмарки показывают, что она сопоставима, а иногда даже лучше, чем модели с закрытым исходным кодом, такие как o1 от OpenAI и Claude 3.5 Sonnet от Anthropic. Учитывая всю шумиху вокруг возможностей DeepSeek R-1 в области рассуждений, давайте посмотрим, насколько хорошо она ответит на эти пять каверзных вопросов:

    habr.com/ru/articles/879334/

    #deepseek #deepseek_r1 #дипсик #chatgpt #chatgpt4

  8. Deepseek v3: Как скачать китайскую нейросеть Дипсик AI, все способы

    Рассказываю про способы, как можно установить китайскую модель локально и использовать без интернета. Причем так, чтобы работать не через консоль, а через удобный интерфейс чат-бота.

    habr.com/ru/articles/877772/

    #deepseek #deepseek_v3 #deepseek_r1 #дипсик #нейросеть #нейросети #llm #llmмодели #ии #ииассистент