home.social

#токены — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #токены, aggregated by home.social.

  1. [Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать

    FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.

    habr.com/ru/companies/otus/art

    #MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов

  2. [Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать

    FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.

    habr.com/ru/companies/otus/art

    #MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов

  3. [Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать

    FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.

    habr.com/ru/companies/otus/art

    #MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов

  4. [Перевод] Создание MCP‑серверов на FastMCP: 7 ошибок, которых стоит избегать

    FastMCP позволяет быстро собрать MCP‑сервер, но скорость легко оборачивается ошибками: лишние токены, слабые схемы, сырые API‑примитивы, плохая обработка ошибок и риски безопасности. В статье разбираем 7 проблем, из‑за которых LLM‑агент начинает путаться, ломать сценарии и требовать лишних подтверждений, — и показываем, как их исправить.

    habr.com/ru/companies/otus/art

    #MCP #FastMCP #ИИагенты #LLM #Python #API #безопасность #обработка_ошибок #токены #проектирование_инструментов

  5. Короткий промпт ≠ дешёвый промпт: как оптимизация ломает prefix cache в LLM-агентах

    32 tools в промпте - дешевле, чем 7. Да, да - если вы строите агентов, это не опечатка. Это следствие того, как работает prefix cache в агентском цикле, и почему локальная оптимизация одного запроса ломает кэш на всей траектории. Третья статья серии про prefix caching - теперь про этих ваших агентов.

    habr.com/ru/companies/bitrix/a

    #llmагент #prefix_caching #токены #aiагенты #ai #prompt_caching #promptengineering #contextengineering

  6. Короткий промпт ≠ дешёвый промпт: как оптимизация ломает prefix cache в LLM-агентах

    32 tools в промпте - дешевле, чем 7. Да, да - если вы строите агентов, это не опечатка. Это следствие того, как работает prefix cache в агентском цикле, и почему локальная оптимизация одного запроса ломает кэш на всей траектории. Третья статья серии про prefix caching - теперь про этих ваших агентов.

    habr.com/ru/companies/bitrix/a

    #llmагент #prefix_caching #токены #aiагенты #ai #prompt_caching #promptengineering #contextengineering

  7. Короткий промпт ≠ дешёвый промпт: как оптимизация ломает prefix cache в LLM-агентах

    32 tools в промпте - дешевле, чем 7. Да, да - если вы строите агентов, это не опечатка. Это следствие того, как работает prefix cache в агентском цикле, и почему локальная оптимизация одного запроса ломает кэш на всей траектории. Третья статья серии про prefix caching - теперь про этих ваших агентов.

    habr.com/ru/companies/bitrix/a

    #llmагент #prefix_caching #токены #aiагенты #ai #prompt_caching #promptengineering #contextengineering

  8. Короткий промпт ≠ дешёвый промпт: как оптимизация ломает prefix cache в LLM-агентах

    32 tools в промпте - дешевле, чем 7. Да, да - если вы строите агентов, это не опечатка. Это следствие того, как работает prefix cache в агентском цикле, и почему локальная оптимизация одного запроса ломает кэш на всей траектории. Третья статья серии про prefix caching - теперь про этих ваших агентов.

    habr.com/ru/companies/bitrix/a

    #llmагент #prefix_caching #токены #aiагенты #ai #prompt_caching #promptengineering #contextengineering

  9. TokenToad: как я сделал Chrome-расширение, чтобы перестать удивляться счетам за AI

    Расходы на AI API копятся незаметно: сессия Claude Code тут, batch к GPT-5 там — и к концу месяца биллинг удивляет. Собрал бесплатное Chrome-расширение, которое показывает траты Anthropic, OpenAI и Gemini в реальном времени прямо в badge браузера.

    habr.com/ru/articles/1031890/

    #chrome_extension #ai_api #openai #anthropic #claude #расходы_api #токены #биллинг #preact #vite

  10. Токенная разработка: почему я плачу $200 в месяц, а не $800 за устаревшее железо

    $800 на видеокарту которая устареет через год или $200/мес с доступом к frontier-моделям? Вот мои цифры

    habr.com/ru/articles/1030678/

    #LLM #API #токены #GPU #локальные_модели #Ollama #tokenomics #AI_разработка #стоимость_разработки

  11. Claude Mythos, Java 26 и пещерный человек с 16 000 звёзд на GitHub

    Девятый выпуск еженедельных IT-новостей от OpenIDE. Милла Йовович выложила свой проект в open-source, Claude Code нашел баг в Linux, которому 23 года, Anthropic показали Claude Mythos и сразу закрыли доступ. А Skill Caveman внезапно оказался самым простым и самым эффективным инструментом недели.

    habr.com/ru/companies/haulmont

    #Claude_Mythos #Claude_Code #Java_26 #opensource #ИИагенты #токены #CaveMan #GPT2 #бенчмарки #vibecoding

  12. Claude Mythos, Java 26 и пещерный человек с 16 000 звёзд на GitHub

    Девятый выпуск еженедельных IT-новостей от OpenIDE. Милла Йовович выложила свой проект в open-source, Claude Code нашел баг в Linux, которому 23 года, Anthropic показали Claude Mythos и сразу закрыли доступ. А Skill Caveman внезапно оказался самым простым и самым эффективным инструментом недели.

    habr.com/ru/companies/haulmont

    #Claude_Mythos #Claude_Code #Java_26 #opensource #ИИагенты #токены #CaveMan #GPT2 #бенчмарки #vibecoding

  13. Claude Mythos, Java 26 и пещерный человек с 16 000 звёзд на GitHub

    Девятый выпуск еженедельных IT-новостей от OpenIDE. Милла Йовович выложила свой проект в open-source, Claude Code нашел баг в Linux, которому 23 года, Anthropic показали Claude Mythos и сразу закрыли доступ. А Skill Caveman внезапно оказался самым простым и самым эффективным инструментом недели.

    habr.com/ru/companies/haulmont

    #Claude_Mythos #Claude_Code #Java_26 #opensource #ИИагенты #токены #CaveMan #GPT2 #бенчмарки #vibecoding

  14. Claude Mythos, Java 26 и пещерный человек с 16 000 звёзд на GitHub

    Девятый выпуск еженедельных IT-новостей от OpenIDE. Милла Йовович выложила свой проект в open-source, Claude Code нашел баг в Linux, которому 23 года, Anthropic показали Claude Mythos и сразу закрыли доступ. А Skill Caveman внезапно оказался самым простым и самым эффективным инструментом недели.

    habr.com/ru/companies/haulmont

    #Claude_Mythos #Claude_Code #Java_26 #opensource #ИИагенты #токены #CaveMan #GPT2 #бенчмарки #vibecoding

  15. JWT авторизация в FastAPI: от теории к практике

    Представьте себе, что вы разработчик, и перед вами стоит задача: сделать так, чтобы после входа пользователь мог получать свои личные данные, не вводя пароль при каждом клике. Звучит как классическая задача аутентификации, правда? Традиционный подход — сессии. Вы логинитесь, сервер создаёт сессию, запоминает ваш ID у себя в базе данных, а вам выдаёт куку с ID этой сессии. Всё работает, пока вы на одном сервере. А если у вас их два? Или десять? Куда девать сессии? Начинаются проблемы с синхронизацией, Redis, общими хранилищами… Альтернатива — JWT (JSON Web Token). В этой статье мы с вами:

    habr.com/ru/articles/1017246/

    #FastAPI #JWT #авторизация #аутентификация #Python #токены #API #бэкенд #JSON_Web_Token #OAuth2

  16. JWT авторизация в FastAPI: от теории к практике

    Представьте себе, что вы разработчик, и перед вами стоит задача: сделать так, чтобы после входа пользователь мог получать свои личные данные, не вводя пароль при каждом клике. Звучит как классическая задача аутентификации, правда? Традиционный подход — сессии. Вы логинитесь, сервер создаёт сессию, запоминает ваш ID у себя в базе данных, а вам выдаёт куку с ID этой сессии. Всё работает, пока вы на одном сервере. А если у вас их два? Или десять? Куда девать сессии? Начинаются проблемы с синхронизацией, Redis, общими хранилищами… Альтернатива — JWT (JSON Web Token). В этой статье мы с вами:

    habr.com/ru/articles/1017246/

    #FastAPI #JWT #авторизация #аутентификация #Python #токены #API #бэкенд #JSON_Web_Token #OAuth2

  17. JWT авторизация в FastAPI: от теории к практике

    Представьте себе, что вы разработчик, и перед вами стоит задача: сделать так, чтобы после входа пользователь мог получать свои личные данные, не вводя пароль при каждом клике. Звучит как классическая задача аутентификации, правда? Традиционный подход — сессии. Вы логинитесь, сервер создаёт сессию, запоминает ваш ID у себя в базе данных, а вам выдаёт куку с ID этой сессии. Всё работает, пока вы на одном сервере. А если у вас их два? Или десять? Куда девать сессии? Начинаются проблемы с синхронизацией, Redis, общими хранилищами… Альтернатива — JWT (JSON Web Token). В этой статье мы с вами:

    habr.com/ru/articles/1017246/

    #FastAPI #JWT #авторизация #аутентификация #Python #токены #API #бэкенд #JSON_Web_Token #OAuth2

  18. JWT авторизация в FastAPI: от теории к практике

    Представьте себе, что вы разработчик, и перед вами стоит задача: сделать так, чтобы после входа пользователь мог получать свои личные данные, не вводя пароль при каждом клике. Звучит как классическая задача аутентификации, правда? Традиционный подход — сессии. Вы логинитесь, сервер создаёт сессию, запоминает ваш ID у себя в базе данных, а вам выдаёт куку с ID этой сессии. Всё работает, пока вы на одном сервере. А если у вас их два? Или десять? Куда девать сессии? Начинаются проблемы с синхронизацией, Redis, общими хранилищами… Альтернатива — JWT (JSON Web Token). В этой статье мы с вами:

    habr.com/ru/articles/1017246/

    #FastAPI #JWT #авторизация #аутентификация #Python #токены #API #бэкенд #JSON_Web_Token #OAuth2

  19. JWT авторизация в FastAPI: от теории до работающего кода

    При разработке современных веб-приложений и API вопрос безопасности и аутентификации пользователей встаёт одним из первых. Как сделать так, чтобы пользователь мог войти один раз и получать доступ к защищённым ресурсам без постоянного ввода пароля? Как организовать систему, которая легко масштабируется и не требует хранения состояния сессии на сервере? В этой статье я разберу подход, основанный на JWT (JSON Web Tokens), и покажу, как реализовать полноценную авторизацию в FastAPI — одном из самых быстрых и современных фреймворков для Python. Мы пройдём путь от архитектуры приложения до готового кода, который можно использовать в реальных проектах.

    habr.com/ru/articles/1015148/

    #FastAPI #авторизация #аутентификация #Python #токены #API #бэкенд #разработка #JSON_Web_Token #access_token

  20. Как я писал сервис авторизации на Rust…

    Работая над одним своим проектом я задумался о необходимости авторизации для его публичного запуска. В самом проекте я всем этим заниматься не стал, а решил разработать отдельный сервис авторизации на Rust, который в дальнейшем можно будет «прикручивать» к разным проектам с небольшими доработками. Для удобства доработок мне в дальнейшем пришла идея создания абстракций для подходящих под них модулей. С первого взгляда звучит легко, но на деле не всё так однозначно.

    habr.com/ru/articles/1013338/

    #разработка #программирование #rust #авторизация #аутентификация #токены #информационная_безопасность #информационные_технологии #криптография #производительность

  21. Дизайн-токены: полный гайд по архитектуре и неймингу c примерами и задачками

    Дизайн-токены — это язык, понятный как дизайнерам, так и разработчикам. Без него продукт получается разрозненным и неповоротливым. Токены и правильный нейминг помогают создавать новые разделы быстрее, а дизайнерам больше думать о сценариях и создавать визуал в рамках продукта, а не заниматься рутиной. Если в вашем коде и макетах до сих пор живут значения типа #0055FF — вы копите технический долг, ведь если понадобится изменить этот цвет на другой, придется менять и все компоненты, где используется это значение. А про разные темы вообще можете забыть... В конце статьи будут ссылки на доп. материалы из реальных дизайн-систем, откуда я брал информацию. Изучить тему

    habr.com/ru/articles/1012980/

    #дизайнсистема #дизайн #figma #tokens #токены #дизайнтокены #variables #design_system

  22. Куда и почему уходят бабки на нейросети

    Малоизвестный среди обычных людей факт: у нейросетей нет никаких "разговоров". Ты смотришь в веб-интерфейсе на "диалог" - но это обман, красивый фокус. Каждый раз, когда ты пишешь новое сообщение, все старые сообщения обрабатываются заново. У нейросетей по-настоящему многоразовых задач не существует. Если результат немного поменялся — тебе просто не покажут в веб-интерфейсе изменившиеся сообщения. Иначе пользователь чувствовал бы себя как в дурке, ИИ его бы постоянно как бы газлайтил, изменяя старые ответы без предупреждения. По факту, история переписки в ИИ-чатах фиксирована, тем или иным способом. И стоило бы это вагон. Интересно. Читать далее

    habr.com/ru/companies/bar/arti

    #LLM #transformer #attention #KVcache #inference #GPU #CUDA #ChatGPT #Claude #токены

  23. Куда и почему уходят бабки на нейросети

    Малоизвестный среди обычных людей факт: у нейросетей нет никаких "разговоров". Ты смотришь в веб-интерфейсе на "диалог" - но это обман, красивый фокус. Каждый раз, когда ты пишешь новое сообщение, все старые сообщения обрабатываются заново. У нейросетей по-настоящему многоразовых задач не существует. Если результат немного поменялся — тебе просто не покажут в веб-интерфейсе изменившиеся сообщения. Иначе пользователь чувствовал бы себя как в дурке, ИИ его бы постоянно как бы газлайтил, изменяя старые ответы без предупреждения. По факту, история переписки в ИИ-чатах фиксирована, тем или иным способом. И стоило бы это вагон. Интересно. Читать далее

    habr.com/ru/companies/bar/arti

    #LLM #transformer #attention #KVcache #inference #GPU #CUDA #ChatGPT #Claude #токены

  24. RLM-Toolkit: Полное руководство по обработке 10M+ токенов

    Почему LangChain не справляется с 10M+ токенов? Разбираемся в RLM — новой парадигме обработки контекста с InfiniRetri (100% accuracy на Needle-in-Haystack), CIRCLE-безопасностью и поддержкой 75+ провайдеров. Полный туториал с кодом.

    habr.com/ru/articles/986280/

    #RLM #LLM #RAG #InfiniRetri #LangChain #AI_Security #Python #контекст #токены #embeddings

  25. Интеграция BotHub с Kaas: пошаговая настройка эндпойнтов и API‑ключей

    Мой путь с Kaas начался с сообщения Max tokens must be >= 16 . Я уставился на поле ввода, где стояла «1», и не сразу понял — это шутка или крик о помощи. Kaas уже в релизе, но по стабильности напоминает бета‑версию, выложенную в пятницу вечером перед долгими выходными. За минималистичным фасадом скрывается лабиринт настроек и поведение, которое больше похоже на игру в русскую рулетку с токенами. Дальше — обзор Kaas, список настоящих багов и пошаговая инструкция, как прокачать терпение (и заставить программу наконец отвечать) .

    habr.com/ru/companies/bothub/a

    #kaas #агрегатор_нейросетей #bothub #доступ_к_иимоделям #нейросети #токены #баги #deepseek

  26. Интеграция BotHub с Kaas: пошаговая настройка эндпойнтов и API‑ключей Мой путь с  Kaas начался с сообщения Max tokens mu...

    #kaas #агрегатор #нейросетей #bothub #доступ #ии-моделям #нейросети #токены #баги #deepseek

    Origin | Interest | Match
  27. Prompt Caching в Claude: Как мы снизили затраты на AI в 2 раза

    Кейс по оптимизации затрат на Claude API в проекте по автоматизации поиска работы. AI анализировал вакансии и генерировал сопроводительные письма. При 100 пользователях затраты достигали $180/месяц. Решение: Prompt Caching от Anthropic. Экономия 52% ($0.51 → $0.245 за batch из 50 вакансий). Теперь можно делать в 2 раза больше AI-вызовов с тем же бюджетом. Кому полезно: всем, кто работает с LLM API и хочет оптимизировать затраты.

    habr.com/ru/articles/965098/

    #ai #claude #anthropic #promt #llm #fastapi #машинное+обучение #токены

  28. [Перевод] BERT — это всего лишь одноэтапная диффузия текста

    Некоторое время назад компания Google DeepMind представила Gemini Diffusion — экспериментальную языковую модель, генерирующую текст методом диффузии. В отличие от традиционных моделей, написанных в стиле GPT и генерирующих слово за словом, Gemini создаёт текст целыми блоками, пошагово уточняя случайный шум. Я прочитал статью « Large Language Diffusion Models » — и с удивлением узнал, что дискретная диффузия языка представляет собой просто обобщение метода генерации пропущенного токена (MLM), практикуемого уже с 2018 года. Я сразу подумал: «А можно ли тонко настроить BERT-подобную модель так, чтобы приспособить её к генерации текста?» Из чистого любопытства решил наскоро набросать проверку концепции. Примечание: уже после того, как написал эту статью, я наткнулся на исследование DiffusionBERT , где сделано практически то же самое, что и у меня, но проект гораздо тщательнее протестирован. Посмотрите этот пост, если тема вас заинтересовала.

    habr.com/ru/articles/959814/

    #LLM #GPT #BERT #обработка_естественного_языка #токены #оптимизация

  29. Токены в нейросетях. Что это и откуда берётся?

    А вы задумывались, как текстовые нейросети видит текст, который мы им отправляем, если она сама мыслит цифрами? В данной статье мы разберём как нейросеть видит текст , который мы ей отправили, познакомимся очень близко с термином ТОКЕНЫ , и даже сами создадим те самые токены на Python . Узнать о ТОКЕНАХ

    habr.com/ru/articles/938798/

    #токен #токены #нейросети #нейросети_python #нейросеть #нейросеть_локально #обучение_нейросетей #обучение_нейросети #обучение_нейросетевых_моделей

  30. **Подборка топовых и новых идей для блога с хэштегами.**
    ---
    ### **10 лучших тем**
    (на основе актуальности, трендов и универсальности):
    1. **Стейкинг в 2024: что значит Ethereum 2.0?**
    - Хэштеги: #Ethereum #Стейкинг #Web3 #Блокчейн
    2. **Mastodon vs Threads: кто выигрывает?**
    - Хэштеги: #Федиверс #Mastodon #Threads #СоциальныеСети
    3. **Rust для начинающих: почему стоит попробовать?**
    - Хэштеги: #Rust #Разработка #Программирование #OpenSource
    4. **Токенизация активов: реальные примеры**
    - Хэштеги: #Токенизация #Блокчейн #Финансы #Децентрализация
    5. **Создание Telegram-бота за час**
    - Хэштеги: #Telegram #Боты #Программирование #Автоматизация
    6. **ActivityPub за пределами социальных сетей**
    - Хэштеги: #ActivityPub #Децентрализация #Федиверс #Приватность
    7. **Экосистема DAO: руководство для новичков**
    - Хэштеги: #DAO #Web3 #Блокчейн #Управление
    8. **Docker: лучшие практики для проектов**
    - Хэштеги: #Docker #DevOps #Разработка #Технологии
    9. **Matrix + Fediverse: дорожная карта**
    - Хэштеги: #Matrix #Федиверс #СоциальныеСети #Безопасность
    10. **Автоматизация трейдинга: инструменты**
    - Хэштеги: #Криптовалюта #Трейдинг #Алгоритмы #Технологии
    ---
    ### **23 варианта тем для блога с хэштегами**
    #### 1. **Криптовалюты и блокчейн**
    1. Влияние Web3 на децентрализованную экономику
    - Хэштеги: #Web3 #Блокчейн #Экономика #Децентрализация
    2. Монеты конфиденциальности: Monero, Zcash и другие
    - Хэштеги: #Конфиденциальность #Monero #Zcash #Криптовалюта
    3. Lightning Network: будущее BTC-платежей
    - Хэштеги: #Bitcoin #LightningNetwork #Криптовалюта #Технологии
    4. BRC-20 токены: инновация или мода?
    - Хэштеги: #BRC20 #Web3 #Токены #Финансы
    5. Топ криптоафёр: разбираем схемы
    - Хэштеги: #Крипто #Безопасность #Мошенничество #Обучение
    #### 2. **Федивёрс**
    6. Как запустить свой сервер Mastodon?
    - Хэштеги: #Mastodon #Федиверс #Сервера #Инструкция
    7. PeerTube в 2024: децентрализованный видеохостинг
    - Хэштеги: #PeerTube #Видео #Федиверс #OpenSource
    8. Частные группы в Fediverse: новые возможности
    - Хэштеги: #Сообщества #Децентрализация #Федиверс #Приватность
    9. Интеграция Mastodon с RSS: инструкция
    - Хэштеги: #RSS #Mastodon #Инструменты #СоциальныеСети
    10. Fediverse для бизнеса: советы
    - Хэштеги: #Бизнес #Федиверс #Технологии #Соцсети
    #### 3. **Разработка**
    11. Основы больших языковых моделей (LLM)
    - Хэштеги: #AI #LLM #Разработка #Технологии
    12. WebAssembly: что это и зачем?
    - Хэштеги: #WebAssembly #Веб #Технологии #Разработка
    13. Масштабирование с Kubernetes
    - Хэштеги: #Kubernetes #DevOps #Сервера #Программирование
    14. Защита от SQL-инъекций
    - Хэштеги: #Безопасность #SQL #БазыДанных #Программирование
    15. Веб-компоненты: современные стандарты
    - Хэштеги: #Веб #HTML #CSS #Технологии
    16. Серверлесс архитектура: введение
    - Хэштеги: #Serverless #Cloud #Программирование #DevOps
    17. Оптимизация устаревшего кода
    - Хэштеги: #Refactoring #Код #Разработка #Практики
    18. Инструменты для тестирования производительности
    - Хэштеги: #Тестирование #Производительность #Инструменты #Программирование
    #### 4. **Пересечения технологий**
    19. AI и блокчейн: точки пересечения
    - Хэштеги: #AI #Блокчейн #Технологии #Инновации
    20. Децентрализация как ответ на цензуру
    - Хэштеги: #Цензура #Децентрализация #Федиверс #Приватность
    21. Корпоративные блокчейны: Hyperledger и Corda
    - Хэштеги: #Hyperledger #Corda #Блокчейн #Бизнес
    22. ActivityPub за пределами социальных сетей
    - Хэштеги: #ActivityPub #Протокол #Федиверс #Технологии
    23. NFT в бизнесе: успешные кейсы
    - Хэштеги: #NFT #Блокчейн #Бизнес #Кейсы
    ---
    Выберите интересующую тему или уточните запрос, чтобы я мог помочь ещё точнее. 💡

    bastyon.com/pureaceton?s=e2784