#large_language_model — Public Fediverse posts on home.social

Habr @[email protected] · 2026-04-02 · 19:22 UTC

Память для LLM-чата на Python. Часть 3: добавляем историю сообщений и контекст

Во второй части мы сделали консольный чат с циклом и system prompt. Но у него был пробел: каждый запрос шёл к модели независимо, без контекста предыдущих реплик. В третьей части добавляем историю сообщений — и чат наконец начинает помнить разговор.

https://habr.com/ru/articles/1018688/

#python #ollama #litellm #llm #локальные_модели #искуственный_интеллект #npl #чатбот #ai #large_language_model

#large_language_model #ai #чатбот #npl #искуственный_интеллект #локальные_модели

Habr @[email protected] · 2026-03-10 · 10:32 UTC

Как мы строили своего AI-агента для генерации тестовой документации — опыт QA-команды мобильных секретарей

Привет, Хабр! На связи QA-команда мобильных секретарей — Настя и Ксюша. Как и многие в QA, мы постоянно работаем с документацией. Ее много, она лежит в Confluence, постоянно меняется, что-то прилетает от партнеров, что-то дописывают аналитики и разработчики. В итоге на то, чтобы собрать все воедино, проанализировать и написать качественные чек-листы или тест-кейсы, уходит много времени. В какой-то момент мы подумали: «А что, если создать AI-агента, заточенного под наши процессы, который будет делать это за нас?». Так и родился наш проект. Рассказываем, как это было.

https://habr.com/ru/companies/just_ai/articles/1006832/

#lowcode_платформа #нейросети_для_разработчиков #llm #нейросети #ai_agents #ai_agent_tutorial #agentkit #ииагенты #large_language_model #ai

#ai #large_language_model #ииагенты #agentkit #ai_agent_tutorial #ai_agents

Habr @[email protected] · 2025-12-03 · 13:02 UTC

Cryfish: Как научить большую языковую модель слышать и понимать звуки?

В мире искусственного интеллекта господствуют большие языковые модели (LLM, large language models). GPT и ее аналоги прекрасно справляются с написанием текстов, кода и генерацией картинок. Но что насчёт звука? Умение слушать и понимать аудио — это следующий логический шаг на пути к многомодальным системам. В этой статье мы расскажем вам о Cryfish — модели на основе LLM, которая не только читает, но и слышит. Мы разберём, как заставить LLM понимать речь, музыку, эмоции и бытовые шумы, и расскажем о сложностях, с которыми столкнулись при обучении.

https://habr.com/ru/articles/972898/

#machine_learning #large_language_model #neural_networks #speech_recognition #speaker_verification

#speaker_verification #speech_recognition #neural_networks #large_language_model #machine_learning

Habr @[email protected] · 2025-12-03 · 13:02 UTC

Cryfish: Как научить большую языковую модель слышать и понимать звуки?

В мире искусственного интеллекта господствуют большие языковые модели (LLM, large language models). GPT и ее аналоги прекрасно справляются с написанием текстов, кода и генерацией картинок. Но что насчёт звука? Умение слушать и понимать аудио — это следующий логический шаг на пути к многомодальным системам. В этой статье мы расскажем вам о Cryfish — модели на основе LLM, которая не только читает, но и слышит. Мы разберём, как заставить LLM понимать речь, музыку, эмоции и бытовые шумы, и расскажем о сложностях, с которыми столкнулись при обучении.

https://habr.com/ru/articles/972898/

#machine_learning #large_language_model #neural_networks #speech_recognition #speaker_verification

#speaker_verification #speech_recognition #neural_networks #large_language_model #machine_learning

Habr @[email protected] · 2025-12-03 · 13:02 UTC

Cryfish: Как научить большую языковую модель слышать и понимать звуки?

В мире искусственного интеллекта господствуют большие языковые модели (LLM, large language models). GPT и ее аналоги прекрасно справляются с написанием текстов, кода и генерацией картинок. Но что насчёт звука? Умение слушать и понимать аудио — это следующий логический шаг на пути к многомодальным системам. В этой статье мы расскажем вам о Cryfish — модели на основе LLM, которая не только читает, но и слышит. Мы разберём, как заставить LLM понимать речь, музыку, эмоции и бытовые шумы, и расскажем о сложностях, с которыми столкнулись при обучении.

https://habr.com/ru/articles/972898/

#machine_learning #large_language_model #neural_networks #speech_recognition #speaker_verification

#speaker_verification #speech_recognition #neural_networks #large_language_model #machine_learning

Habr @[email protected] · 2025-12-03 · 13:02 UTC

Cryfish: Как научить большую языковую модель слышать и понимать звуки?

В мире искусственного интеллекта господствуют большие языковые модели (LLM, large language models). GPT и ее аналоги прекрасно справляются с написанием текстов, кода и генерацией картинок. Но что насчёт звука? Умение слушать и понимать аудио — это следующий логический шаг на пути к многомодальным системам. В этой статье мы расскажем вам о Cryfish — модели на основе LLM, которая не только читает, но и слышит. Мы разберём, как заставить LLM понимать речь, музыку, эмоции и бытовые шумы, и расскажем о сложностях, с которыми столкнулись при обучении.

https://habr.com/ru/articles/972898/

#machine_learning #large_language_model #neural_networks #speech_recognition #speaker_verification

Habr @[email protected] · 2025-11-24 · 12:42 UTC

OpenAI AgentKit vs Just AI Agent Platform: где ограничения, а где возможности?

Привет, Хабр! Меня зовут Даниил Сухан, я занимаюсь разработкой AI-приложений в Just AI.Недавно вышедший AgentKit от OpenAI быстро стал одним из самых обсуждаемых инструментов в сообществе разработчиков. Мы протестировали платформу для создания ИИ-агентов от OpenAI и сравнили её с нашей Agent Platform. В этой статье разбираем, как создаются агенты на обеих платформах, и в чём заключаются их принципиальные отличия.

https://habr.com/ru/companies/just_ai/articles/967338/

#ai_agent #agentkit #ai #llm #ииагенты #нейросети #lowcode #large_language_model #ииприложение #openai

#ai_agent #agentkit #ai #llm #ииагенты #нейросети

Habr @[email protected] · 2025-10-13 · 12:42 UTC

[Перевод] Какой табличный формат LLM понимают лучше всего? (Результаты по 11 форматам)

Команда AI for Devs подготовила перевод статьи о том, в каком формате лучше всего передавать таблицы LLM. Исследование охватило 11 популярных форматов — от CSV и JSON до YAML и Markdown. Результаты неожиданны: разница в точности достигает 16 процентных пунктов, а выбор формата напрямую влияет на стоимость инференса и стабильность RAG-пайплайнов.

https://habr.com/ru/articles/955778/

#llms #large_language_model #ai #markdown #gpt4 #openai #csv #json #yaml #xml

#xml #yaml #json #csv #openai #gpt4

galaxyproject @[email protected] · 2025-10-13 · 12:03 UTC

Access powerful Large Language Models in Galaxy easily
https://galaxyproject.org/news/2025-10-10-llm-hub/

@galaxyfreiburg
#UseGalaxy #GalaxyProject #EOSC #ai #machine_learning #llm #large_language_model #open_ai #deepseek #mistral #meta #image_models #multimodal_models #gpt

#usegalaxy #galaxyproject #eosc #ai #machine_learning #llm

Galaxy-Team der Uni Freiburg @galaxyfreiburg@bawü.social · 2025-10-13 · 12:03 UTC

Access powerful Large Language Models in Galaxy easily
https://galaxyproject.org/news/2025-10-10-llm-hub/

@galaxyproject
#UseGalaxy #GalaxyProject #EOSC #UniFreiburg #ai #machine_learning #llm #large_language_model #open_ai #deepseek #mistral #meta #image_models #multimodal_models #gpt

#usegalaxy #galaxyproject #eosc #unifreiburg #ai #machine_learning

Habr @[email protected] · 2025-08-28 · 19:22 UTC

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

Привет! Меня зовут Бромбин Андрей, и сегодня я разберу на практике, что такое RAG-системы и как они помогают улучшать поиск. Покажу, как использовать Spring AI, векторные базы данных и LLM. Ты получишь теорию и пример реализации на Java и Spring Boot – от идеи до работающего сервиса. Без сложных формул – только чёткие объяснения и код. Обновить резюме

https://habr.com/ru/companies/ruvds/articles/924100/

#spring_ai #исскуственный_интеллект #qdrant #semantic_search #retrieval_augmented_generation #vector_database #large_language_model #java #ruvds_статьи #космотекст

#spring_ai #исскуственный_интеллект #qdrant #semantic_search #retrieval_augmented_generation #vector_database

Habr @[email protected] · 2024-07-23 · 09:02 UTC

[Перевод] Как с помощью supervised fine-tuning кастомизировать LLM

В быстро развивающейся сфере Natural Language Processing (NLP) fine-tuning стал мощным и эффективным инструментом адаптации предварительно обученных больших языковых моделей (Large Language Model, LLM) под конкретные задачи. Предварительно обученные LLM (например, семейство GPT) продемонстрировали существенный прогресс в понимании и генерации языка. Однако эти предварительно обученные модели обычно учатся на огромных объёмах текстовых данных при помощи обучения без учителя и могут быть не оптимизированы под узкую задачу. Fine-tuning позволяет закрыть этот пробел, воспользовавшись преимуществами общего понимания языка, полученными во время предварительного обучения, и адаптировав их к целевой задаче при помощи обучения с учителем. Благодаря fine-tuning предварительно обученной модели на специфичном для задачи датасете разработчики NLP могут достигать впечатляющих результатов с гораздо меньшим объёмом данных обучения и вычислительных ресурсов, чем при обучении модели с нуля. В частности, для LLM fine-tuning крайне важен, так как повторное обучение на всём объёме данных вычислительно слишком затратно. Сравнение предварительного обучения LLM и fine-tuning Успех fine-tuning привёл ко множеству передовых результатов в широком спектре задач NLP и сделал его стандартной практикой в разработке высокоточных языковых моделей. Исследователи и практики продолжают исследовать варианты и оптимизации методик fine-tuning, чтобы ещё больше расширить возможности NLP. В этой статье мы глубже изучим процесс fine-tuning LLM на основе инструкций при помощи библиотеки transformers двумя разными способами: просто с библиотекой transformers и с модулем trl .

https://habr.com/ru/articles/829324/

#Машинное_обучение #LLM #Finetuning #SFT #Supervised_finetuning #NLP #Large_Language_Model #датасет #размета_данных #dataset #данные #data #разметка

#разметка #data #данные #dataset #размета_данных #датасет

WetHat💦 @WetHat · 2024-03-22 · 07:59 UTC

Universal and Transferable Attacks on Aligned Language Models

The article demonstrates that it is possible to automatically construct adversarial attacks on LLMs by appending specifically chosen character sequences to the user query.

https://llm-attacks.org/

#llm #artificialintelligence #ai #machinelearning #cybersecurity #jailbreak #large_language_model #compsci #ChatGPT #GoogleBard #Claude

#llm #artificialintelligence #machinelearning #cybersecurity #jailbreak #large_language_model