home.social

#artificial_intelligence — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #artificial_intelligence, aggregated by home.social.

  1. [Перевод] Как устроен продуктовый менеджмент в Anthropic

    Большинство российских коллег и компаний до сих пор планируют роудмепы и фичи на 6-12 месяцев вперёд. В Anthropic за это время успевают выпустить продукт, переделать его, выбросить половину и выпустить снова. Релизы продуктов и критических фичей выходят - е-ж-е-д-н-е-в-н-о. Кэт Ву, глава продукта Claude Code, проводит сотни собеседований и говорит, что почти все кандидаты имеют устаревший подход и мышление. Не потому что они плохие специалисты, а потому, что просто рефлексируют опыт в профессии, которой больше нет.

    habr.com/ru/articles/1037394/

    #product #product_management #product_owner #product_manager #product_development #ai #aiагенты #artificial_intelligence

  2. [Перевод] Как устроен продуктовый менеджмент в Anthropic

    Большинство российских коллег и компаний до сих пор планируют роудмепы и фичи на 6-12 месяцев вперёд. В Anthropic за это время успевают выпустить продукт, переделать его, выбросить половину и выпустить снова. Релизы продуктов и критических фичей выходят - е-ж-е-д-н-е-в-н-о. Кэт Ву, глава продукта Claude Code, проводит сотни собеседований и говорит, что почти все кандидаты имеют устаревший подход и мышление. Не потому что они плохие специалисты, а потому, что просто рефлексируют опыт в профессии, которой больше нет.

    habr.com/ru/articles/1037394/

    #product #product_management #product_owner #product_manager #product_development #ai #aiагенты #artificial_intelligence

  3. [Перевод] Как устроен продуктовый менеджмент в Anthropic

    Большинство российских коллег и компаний до сих пор планируют роудмепы и фичи на 6-12 месяцев вперёд. В Anthropic за это время успевают выпустить продукт, переделать его, выбросить половину и выпустить снова. Релизы продуктов и критических фичей выходят - е-ж-е-д-н-е-в-н-о. Кэт Ву, глава продукта Claude Code, проводит сотни собеседований и говорит, что почти все кандидаты имеют устаревший подход и мышление. Не потому что они плохие специалисты, а потому, что просто рефлексируют опыт в профессии, которой больше нет.

    habr.com/ru/articles/1037394/

    #product #product_management #product_owner #product_manager #product_development #ai #aiагенты #artificial_intelligence

  4. [Перевод] Как устроен продуктовый менеджмент в Anthropic

    Большинство российских коллег и компаний до сих пор планируют роудмепы и фичи на 6-12 месяцев вперёд. В Anthropic за это время успевают выпустить продукт, переделать его, выбросить половину и выпустить снова. Релизы продуктов и критических фичей выходят - е-ж-е-д-н-е-в-н-о. Кэт Ву, глава продукта Claude Code, проводит сотни собеседований и говорит, что почти все кандидаты имеют устаревший подход и мышление. Не потому что они плохие специалисты, а потому, что просто рефлексируют опыт в профессии, которой больше нет.

    habr.com/ru/articles/1037394/

    #product #product_management #product_owner #product_manager #product_development #ai #aiагенты #artificial_intelligence

  5. Графы знаний в юридическом домене: эксперимент с LightRAG

    Юридический домен требует понимания многочисленных связей между сущностями, рассеянными по множеству документов. Поэтому кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний: связи между нормами, прецедентами и понятиями, рассеянными по тысячам документов, наконец-то перестают теряться. Современные фреймворки обещают построить такой граф автоматически, в пару команд. Но между "запуском из коробки" и рабочей аналитической системой на практике лежит немалая дистанция. Это первая часть практического эксперимента с LightRAG, одним из самых известных графовых фреймворков. На небольшом корпусе из Гражданского кодекса РФ и судебной практики разбираем, как фреймворк устроен, как его быстро развернуть, и почему граф из "коробки", без оптимизации и тонкой настройки, при всей внешней убедительности, еще не готов к полноценной работе в юридическом домене.

    habr.com/ru/articles/1036652/

    #RAG #retrievalaugmented_generation #ai #artificial_intelligence #llm #large_language_models #vector_database #graph_database #knowledge_graphs #lightrag

  6. Как устроен AI-агент изнутри

    Представьте сцену. Вы пишете в терминал: «разберись, почему на main падает вот этот тест, и попробуй починить». Жмёте Enter. Спиннер крутится, подписи меняются — сначала “Pondering…”, потом зачем-то “Julienning…”, потом “Recombobulating…”. Через минуту агент прочитал логи CI, нашёл зафейлившийся тест, заглянул в связанный модуль, заметил, что кто-то криво подкрутил регекс, предложил правку, дождался вашего «да» — и коммитит. Пока вы наливаете чай, PR уже уехал на ревью. Выглядит как магия. На деле внутри — удивительно стройная инженерная конструкция: главный цикл на пару сотен строк, обросший целой экосистемой обслуживающих подсистем. Я несколько вечеров подряд ковырялся в исходниках одного такого CLI-агента для разработки: де-обфусцированный дистрибутив примерно на 300 модулей, файл-вход почти на 800 тысяч строк после разсборки бандла. И за «магией» обнаружились вещи, про которые отдельно хочется написать: собственный React-реконсилятор для терминала, двухуровневая загрузка описаний инструментов, классификатор опасных bash-команд, трёхрежимное сжатие контекста, fork-join для саб-агентов, защита от невидимых Unicode-инъекций в промпте. Эта статья — мои заметки по итогам погружения. Не реклама конкретного продукта (реальных имён функций и классов я намеренно избегаю), а разговор про архитектурные решения, которые стоят за современным CLI-агентом. Главный цикл и его устройство, инструменты, контекст и его сжатие, разрешения и хуки, MCP, память между сессиями.

    habr.com/ru/articles/1026682/

    #llm #aiagent #ai #artificial_intelligence #искусственный_интеллект #агент #claude

  7. Как устроен AI-агент изнутри

    Представьте сцену. Вы пишете в терминал: «разберись, почему на main падает вот этот тест, и попробуй починить». Жмёте Enter. Спиннер крутится, подписи меняются — сначала “Pondering…”, потом зачем-то “Julienning…”, потом “Recombobulating…”. Через минуту агент прочитал логи CI, нашёл зафейлившийся тест, заглянул в связанный модуль, заметил, что кто-то криво подкрутил регекс, предложил правку, дождался вашего «да» — и коммитит. Пока вы наливаете чай, PR уже уехал на ревью. Выглядит как магия. На деле внутри — удивительно стройная инженерная конструкция: главный цикл на пару сотен строк, обросший целой экосистемой обслуживающих подсистем. Я несколько вечеров подряд ковырялся в исходниках одного такого CLI-агента для разработки: де-обфусцированный дистрибутив примерно на 300 модулей, файл-вход почти на 800 тысяч строк после разсборки бандла. И за «магией» обнаружились вещи, про которые отдельно хочется написать: собственный React-реконсилятор для терминала, двухуровневая загрузка описаний инструментов, классификатор опасных bash-команд, трёхрежимное сжатие контекста, fork-join для саб-агентов, защита от невидимых Unicode-инъекций в промпте. Эта статья — мои заметки по итогам погружения. Не реклама конкретного продукта (реальных имён функций и классов я намеренно избегаю), а разговор про архитектурные решения, которые стоят за современным CLI-агентом. Главный цикл и его устройство, инструменты, контекст и его сжатие, разрешения и хуки, MCP, память между сессиями.

    habr.com/ru/articles/1026682/

    #llm #aiagent #ai #artificial_intelligence #искусственный_интеллект #агент #claude

  8. Как устроен AI-агент изнутри

    Представьте сцену. Вы пишете в терминал: «разберись, почему на main падает вот этот тест, и попробуй починить». Жмёте Enter. Спиннер крутится, подписи меняются — сначала “Pondering…”, потом зачем-то “Julienning…”, потом “Recombobulating…”. Через минуту агент прочитал логи CI, нашёл зафейлившийся тест, заглянул в связанный модуль, заметил, что кто-то криво подкрутил регекс, предложил правку, дождался вашего «да» — и коммитит. Пока вы наливаете чай, PR уже уехал на ревью. Выглядит как магия. На деле внутри — удивительно стройная инженерная конструкция: главный цикл на пару сотен строк, обросший целой экосистемой обслуживающих подсистем. Я несколько вечеров подряд ковырялся в исходниках одного такого CLI-агента для разработки: де-обфусцированный дистрибутив примерно на 300 модулей, файл-вход почти на 800 тысяч строк после разсборки бандла. И за «магией» обнаружились вещи, про которые отдельно хочется написать: собственный React-реконсилятор для терминала, двухуровневая загрузка описаний инструментов, классификатор опасных bash-команд, трёхрежимное сжатие контекста, fork-join для саб-агентов, защита от невидимых Unicode-инъекций в промпте. Эта статья — мои заметки по итогам погружения. Не реклама конкретного продукта (реальных имён функций и классов я намеренно избегаю), а разговор про архитектурные решения, которые стоят за современным CLI-агентом. Главный цикл и его устройство, инструменты, контекст и его сжатие, разрешения и хуки, MCP, память между сессиями.

    habr.com/ru/articles/1026682/

    #llm #aiagent #ai #artificial_intelligence #искусственный_интеллект #агент #claude

  9. Как устроен AI-агент изнутри

    Представьте сцену. Вы пишете в терминал: «разберись, почему на main падает вот этот тест, и попробуй починить». Жмёте Enter. Спиннер крутится, подписи меняются — сначала “Pondering…”, потом зачем-то “Julienning…”, потом “Recombobulating…”. Через минуту агент прочитал логи CI, нашёл зафейлившийся тест, заглянул в связанный модуль, заметил, что кто-то криво подкрутил регекс, предложил правку, дождался вашего «да» — и коммитит. Пока вы наливаете чай, PR уже уехал на ревью. Выглядит как магия. На деле внутри — удивительно стройная инженерная конструкция: главный цикл на пару сотен строк, обросший целой экосистемой обслуживающих подсистем. Я несколько вечеров подряд ковырялся в исходниках одного такого CLI-агента для разработки: де-обфусцированный дистрибутив примерно на 300 модулей, файл-вход почти на 800 тысяч строк после разсборки бандла. И за «магией» обнаружились вещи, про которые отдельно хочется написать: собственный React-реконсилятор для терминала, двухуровневая загрузка описаний инструментов, классификатор опасных bash-команд, трёхрежимное сжатие контекста, fork-join для саб-агентов, защита от невидимых Unicode-инъекций в промпте. Эта статья — мои заметки по итогам погружения. Не реклама конкретного продукта (реальных имён функций и классов я намеренно избегаю), а разговор про архитектурные решения, которые стоят за современным CLI-агентом. Главный цикл и его устройство, инструменты, контекст и его сжатие, разрешения и хуки, MCP, память между сессиями.

    habr.com/ru/articles/1026682/

    #llm #aiagent #ai #artificial_intelligence #искусственный_интеллект #агент #claude

  10. Говорящая лисичка, Айвенго и немного оптического потока

    — Расскажи нам, папа, сказочку... — Ой, да когда мне вам рассказывать, у меня работы невпроворот. Послушайте лучше аудиокнижку. — Аудиокнижки скучные. Вот если бы нам их лисичка почитала... или там Айвенго, или Мэри Поппинс. А так — сиди и слушай... Вот с этого примерно и началось. Задача казалась простой: взять картинку персонажа, взять аудио — и получить видео, где персонаж говорит. Технология-то должна существовать, мы живём в эпоху искусственного интеллекта, ChatGPT рисует котиков и пишет диссертации. Технология существовала. Но работала в десять раз медленнее реального времени. На игровой видеокарте.

    habr.com/ru/articles/1022110/

    #animation #graphics #artificial_intelligence #algorithms

  11. Говорящая лисичка, Айвенго и немного оптического потока

    — Расскажи нам, папа, сказочку... — Ой, да когда мне вам рассказывать, у меня работы невпроворот. Послушайте лучше аудиокнижку. — Аудиокнижки скучные. Вот если бы нам их лисичка почитала... или там Айвенго, или Мэри Поппинс. А так — сиди и слушай... Вот с этого примерно и началось. Задача казалась простой: взять картинку персонажа, взять аудио — и получить видео, где персонаж говорит. Технология-то должна существовать, мы живём в эпоху искусственного интеллекта, ChatGPT рисует котиков и пишет диссертации. Технология существовала. Но работала в десять раз медленнее реального времени. На игровой видеокарте.

    habr.com/ru/articles/1022110/

    #animation #graphics #artificial_intelligence #algorithms

  12. Говорящая лисичка, Айвенго и немного оптического потока

    — Расскажи нам, папа, сказочку... — Ой, да когда мне вам рассказывать, у меня работы невпроворот. Послушайте лучше аудиокнижку. — Аудиокнижки скучные. Вот если бы нам их лисичка почитала... или там Айвенго, или Мэри Поппинс. А так — сиди и слушай... Вот с этого примерно и началось. Задача казалась простой: взять картинку персонажа, взять аудио — и получить видео, где персонаж говорит. Технология-то должна существовать, мы живём в эпоху искусственного интеллекта, ChatGPT рисует котиков и пишет диссертации. Технология существовала. Но работала в десять раз медленнее реального времени. На игровой видеокарте.

    habr.com/ru/articles/1022110/

    #animation #graphics #artificial_intelligence #algorithms

  13. Говорящая лисичка, Айвенго и немного оптического потока

    — Расскажи нам, папа, сказочку... — Ой, да когда мне вам рассказывать, у меня работы невпроворот. Послушайте лучше аудиокнижку. — Аудиокнижки скучные. Вот если бы нам их лисичка почитала... или там Айвенго, или Мэри Поппинс. А так — сиди и слушай... Вот с этого примерно и началось. Задача казалась простой: взять картинку персонажа, взять аудио — и получить видео, где персонаж говорит. Технология-то должна существовать, мы живём в эпоху искусственного интеллекта, ChatGPT рисует котиков и пишет диссертации. Технология существовала. Но работала в десять раз медленнее реального времени. На игровой видеокарте.

    habr.com/ru/articles/1022110/

    #animation #graphics #artificial_intelligence #algorithms

  14. Искусственный интеллект и «стены памяти»: начало Software-Defined Memory?

    С 1947 года, когда появилась первая память с произвольным доступом — трубка Уильямса, — базовый принцип хранения данных в оперативной памяти фундаментально почти не изменился. За это время процессоры стали на порядки быстрее, но по-прежнему значительную часть времени они тратят на ожидание данных. Этот разрыв известен как «стена памяти» (Memory Wall), и именно он всё сильнее влияет на экономику современной инфраструктуры. Достаточно посмотреть, какую долю в стоимости сервера сегодня занимает RAM. Мы покупаем терабайты памяти, но существенная её часть нередко остаётся «холодной»: ресурсы зарезервированы, потребляют энергию и стоят дорого, но используются далеко не полностью. В эпоху дефицита памяти, in-memory-приложений, искусственного интеллекта и других высоконагруженных систем такая неэффективность обходится слишком дорого. А что, если эффективный объём доступной памяти можно заметно увеличить за считаные минуты — без замены оборудования? В этой статье я коротко пройду по истории RAM, объясню, почему проблема Memory Wall стала особенно острой именно сейчас, и покажу, к какой новой вехе может привести подход, который условно можно назвать Software-Defined Memory. Разберем, как технологии MEXT используют AI для оптимизации инфраструктуры под AI- и data-intensive-нагрузки. Спойлер: иногда, чтобы «увеличить» память, не нужно покупать новую — достаточно радикально лучше использовать ту, что уже установлена.

    habr.com/ru/articles/1014104/

    #Стена_памяти_Memory_Wall #Software_defined_memory #MEXT #зомбипамять #оперативная_память #linux #виртуализация_памяти #высоконагруженные_системы #оптимизация_памяти #artificial_intelligence

  15. Искусственный интеллект и «стены памяти»: начало Software-Defined Memory?

    С 1947 года, когда появилась первая память с произвольным доступом — трубка Уильямса, — базовый принцип хранения данных в оперативной памяти фундаментально почти не изменился. За это время процессоры стали на порядки быстрее, но по-прежнему значительную часть времени они тратят на ожидание данных. Этот разрыв известен как «стена памяти» (Memory Wall), и именно он всё сильнее влияет на экономику современной инфраструктуры. Достаточно посмотреть, какую долю в стоимости сервера сегодня занимает RAM. Мы покупаем терабайты памяти, но существенная её часть нередко остаётся «холодной»: ресурсы зарезервированы, потребляют энергию и стоят дорого, но используются далеко не полностью. В эпоху дефицита памяти, in-memory-приложений, искусственного интеллекта и других высоконагруженных систем такая неэффективность обходится слишком дорого. А что, если эффективный объём доступной памяти можно заметно увеличить за считаные минуты — без замены оборудования? В этой статье я коротко пройду по истории RAM, объясню, почему проблема Memory Wall стала особенно острой именно сейчас, и покажу, к какой новой вехе может привести подход, который условно можно назвать Software-Defined Memory. Разберем, как технологии MEXT используют AI для оптимизации инфраструктуры под AI- и data-intensive-нагрузки. Спойлер: иногда, чтобы «увеличить» память, не нужно покупать новую — достаточно радикально лучше использовать ту, что уже установлена.

    habr.com/ru/articles/1014104/

    #Стена_памяти_Memory_Wall #Software_defined_memory #MEXT #зомбипамять #оперативная_память #linux #виртуализация_памяти #высоконагруженные_системы #оптимизация_памяти #artificial_intelligence

  16. Искусственный интеллект и «стены памяти»: начало Software-Defined Memory?

    С 1947 года, когда появилась первая память с произвольным доступом — трубка Уильямса, — базовый принцип хранения данных в оперативной памяти фундаментально почти не изменился. За это время процессоры стали на порядки быстрее, но по-прежнему значительную часть времени они тратят на ожидание данных. Этот разрыв известен как «стена памяти» (Memory Wall), и именно он всё сильнее влияет на экономику современной инфраструктуры. Достаточно посмотреть, какую долю в стоимости сервера сегодня занимает RAM. Мы покупаем терабайты памяти, но существенная её часть нередко остаётся «холодной»: ресурсы зарезервированы, потребляют энергию и стоят дорого, но используются далеко не полностью. В эпоху дефицита памяти, in-memory-приложений, искусственного интеллекта и других высоконагруженных систем такая неэффективность обходится слишком дорого. А что, если эффективный объём доступной памяти можно заметно увеличить за считаные минуты — без замены оборудования? В этой статье я коротко пройду по истории RAM, объясню, почему проблема Memory Wall стала особенно острой именно сейчас, и покажу, к какой новой вехе может привести подход, который условно можно назвать Software-Defined Memory. Разберем, как технологии MEXT используют AI для оптимизации инфраструктуры под AI- и data-intensive-нагрузки. Спойлер: иногда, чтобы «увеличить» память, не нужно покупать новую — достаточно радикально лучше использовать ту, что уже установлена.

    habr.com/ru/articles/1014104/

    #Стена_памяти_Memory_Wall #Software_defined_memory #MEXT #зомбипамять #оперативная_память #linux #виртуализация_памяти #высоконагруженные_системы #оптимизация_памяти #artificial_intelligence

  17. Искусственный интеллект и «стены памяти»: начало Software-Defined Memory?

    С 1947 года, когда появилась первая память с произвольным доступом — трубка Уильямса, — базовый принцип хранения данных в оперативной памяти фундаментально почти не изменился. За это время процессоры стали на порядки быстрее, но по-прежнему значительную часть времени они тратят на ожидание данных. Этот разрыв известен как «стена памяти» (Memory Wall), и именно он всё сильнее влияет на экономику современной инфраструктуры. Достаточно посмотреть, какую долю в стоимости сервера сегодня занимает RAM. Мы покупаем терабайты памяти, но существенная её часть нередко остаётся «холодной»: ресурсы зарезервированы, потребляют энергию и стоят дорого, но используются далеко не полностью. В эпоху дефицита памяти, in-memory-приложений, искусственного интеллекта и других высоконагруженных систем такая неэффективность обходится слишком дорого. А что, если эффективный объём доступной памяти можно заметно увеличить за считаные минуты — без замены оборудования? В этой статье я коротко пройду по истории RAM, объясню, почему проблема Memory Wall стала особенно острой именно сейчас, и покажу, к какой новой вехе может привести подход, который условно можно назвать Software-Defined Memory. Разберем, как технологии MEXT используют AI для оптимизации инфраструктуры под AI- и data-intensive-нагрузки. Спойлер: иногда, чтобы «увеличить» память, не нужно покупать новую — достаточно радикально лучше использовать ту, что уже установлена.

    habr.com/ru/articles/1014104/

    #Стена_памяти_Memory_Wall #Software_defined_memory #MEXT #зомбипамять #оперативная_память #linux #виртуализация_памяти #высоконагруженные_системы #оптимизация_памяти #artificial_intelligence

  18. [Перевод] Долг понимания — скрытая цена кода, сгенерированного искусственным интеллектом

    “Долг понимания” (comprehension debt) — это скрытая цена, которую человеческий интеллект и память платят в результате чрезмерной зависимости от ИИ и автоматизации. Для инженеров это особенно актуально в сфере разработки агентных систем. Когда команды активно используют инструменты для генерации кода с помощью ИИ, возникают определенные издержки, которые не отражаются в показателях производительности. Особенно это касается случаев, когда проверка всего кода, генерируемого ИИ, становится утомительной. Эти издержки накапливаются постепенно, и в конечном итоге их приходится оплачивать — с процентами. Это называется “долг понимания” или “когнитивный долг” .

    habr.com/ru/articles/1016680/

    #code_quality #ai #artificial_intelligence #technical_debt #сomprehension_debt #качество_кода #ии #искусственный_интеллект #технический_долг #долг_понимания

  19. [Перевод] Долг понимания — скрытая цена кода, сгенерированного искусственным интеллектом

    “Долг понимания” (comprehension debt) — это скрытая цена, которую человеческий интеллект и память платят в результате чрезмерной зависимости от ИИ и автоматизации. Для инженеров это особенно актуально в сфере разработки агентных систем. Когда команды активно используют инструменты для генерации кода с помощью ИИ, возникают определенные издержки, которые не отражаются в показателях производительности. Особенно это касается случаев, когда проверка всего кода, генерируемого ИИ, становится утомительной. Эти издержки накапливаются постепенно, и в конечном итоге их приходится оплачивать — с процентами. Это называется “долг понимания” или “когнитивный долг” .

    habr.com/ru/articles/1016680/

    #code_quality #ai #artificial_intelligence #technical_debt #сomprehension_debt #качество_кода #ии #искусственный_интеллект #технический_долг #долг_понимания

  20. [Перевод] Долг понимания — скрытая цена кода, сгенерированного искусственным интеллектом

    “Долг понимания” (comprehension debt) — это скрытая цена, которую человеческий интеллект и память платят в результате чрезмерной зависимости от ИИ и автоматизации. Для инженеров это особенно актуально в сфере разработки агентных систем. Когда команды активно используют инструменты для генерации кода с помощью ИИ, возникают определенные издержки, которые не отражаются в показателях производительности. Особенно это касается случаев, когда проверка всего кода, генерируемого ИИ, становится утомительной. Эти издержки накапливаются постепенно, и в конечном итоге их приходится оплачивать — с процентами. Это называется “долг понимания” или “когнитивный долг” .

    habr.com/ru/articles/1016680/

    #code_quality #ai #artificial_intelligence #technical_debt #сomprehension_debt #качество_кода #ии #искусственный_интеллект #технический_долг #долг_понимания

  21. [Перевод] Долг понимания — скрытая цена кода, сгенерированного искусственным интеллектом

    “Долг понимания” (comprehension debt) — это скрытая цена, которую человеческий интеллект и память платят в результате чрезмерной зависимости от ИИ и автоматизации. Для инженеров это особенно актуально в сфере разработки агентных систем. Когда команды активно используют инструменты для генерации кода с помощью ИИ, возникают определенные издержки, которые не отражаются в показателях производительности. Особенно это касается случаев, когда проверка всего кода, генерируемого ИИ, становится утомительной. Эти издержки накапливаются постепенно, и в конечном итоге их приходится оплачивать — с процентами. Это называется “долг понимания” или “когнитивный долг” .

    habr.com/ru/articles/1016680/

    #code_quality #ai #artificial_intelligence #technical_debt #сomprehension_debt #качество_кода #ии #искусственный_интеллект #технический_долг #долг_понимания

  22. Испанский в кармане: Архитектура Telegram-бота с локальным Whisper.cpp, AI-диалогами и оценкой произношения

    Привет, Хабр! Меня зовут Vlad, я начинающий Python‑разработчик и энтузиаст изучения языков. Недавно я столкнулся с классической проблемой полиглота‑самоучки: учебники дают теорию, аудиокурсы — пассивное восприятие, но нет главного — обратной связи по произношению. Репетиторы дороги, а разговорные клубы требуют уровня, которого у меня еще не было. Я решил закрыть эту боль кодом. Моя цель была амбициозной: создать Telegram‑бота, который: 1. Слушает голосовые сообщения и распознает речь без дорогих облачных API. 2. Оценивает точность произношения в процентах, сравнивая с эталоном. 3. Поддерживает живой диалог через LLM, исправляя ошибки на лету. 4. Работает быстро и экономно на слабом VPS. В этой статье я подробно разберу архитектуру проекта, покажу, как интегрировать бинарный whisper.cpp в асинхронный aiogram 3.x, реализую алгоритм оценки речи и расскажу про управление состояниями (FSM). Под капотом — Python, нейросети и немного магии.

    habr.com/ru/articles/1014888/

    #Python #Telegram_Bot #Aiogram #Whisper #Speech_Recognition #Machine_Learning #NLP #Artificial_Intelligence #Асинхронность #Испанский_язык

  23. Испанский в кармане: Архитектура Telegram-бота с локальным Whisper.cpp, AI-диалогами и оценкой произношения

    Привет, Хабр! Меня зовут Vlad, я начинающий Python‑разработчик и энтузиаст изучения языков. Недавно я столкнулся с классической проблемой полиглота‑самоучки: учебники дают теорию, аудиокурсы — пассивное восприятие, но нет главного — обратной связи по произношению. Репетиторы дороги, а разговорные клубы требуют уровня, которого у меня еще не было. Я решил закрыть эту боль кодом. Моя цель была амбициозной: создать Telegram‑бота, который: 1. Слушает голосовые сообщения и распознает речь без дорогих облачных API. 2. Оценивает точность произношения в процентах, сравнивая с эталоном. 3. Поддерживает живой диалог через LLM, исправляя ошибки на лету. 4. Работает быстро и экономно на слабом VPS. В этой статье я подробно разберу архитектуру проекта, покажу, как интегрировать бинарный whisper.cpp в асинхронный aiogram 3.x, реализую алгоритм оценки речи и расскажу про управление состояниями (FSM). Под капотом — Python, нейросети и немного магии.

    habr.com/ru/articles/1014888/

    #Python #Telegram_Bot #Aiogram #Whisper #Speech_Recognition #Machine_Learning #NLP #Artificial_Intelligence #Асинхронность #Испанский_язык

  24. Испанский в кармане: Архитектура Telegram-бота с локальным Whisper.cpp, AI-диалогами и оценкой произношения

    Привет, Хабр! Меня зовут Vlad, я начинающий Python‑разработчик и энтузиаст изучения языков. Недавно я столкнулся с классической проблемой полиглота‑самоучки: учебники дают теорию, аудиокурсы — пассивное восприятие, но нет главного — обратной связи по произношению. Репетиторы дороги, а разговорные клубы требуют уровня, которого у меня еще не было. Я решил закрыть эту боль кодом. Моя цель была амбициозной: создать Telegram‑бота, который: 1. Слушает голосовые сообщения и распознает речь без дорогих облачных API. 2. Оценивает точность произношения в процентах, сравнивая с эталоном. 3. Поддерживает живой диалог через LLM, исправляя ошибки на лету. 4. Работает быстро и экономно на слабом VPS. В этой статье я подробно разберу архитектуру проекта, покажу, как интегрировать бинарный whisper.cpp в асинхронный aiogram 3.x, реализую алгоритм оценки речи и расскажу про управление состояниями (FSM). Под капотом — Python, нейросети и немного магии.

    habr.com/ru/articles/1014888/

    #Python #Telegram_Bot #Aiogram #Whisper #Speech_Recognition #Machine_Learning #NLP #Artificial_Intelligence #Асинхронность #Испанский_язык

  25. Испанский в кармане: Архитектура Telegram-бота с локальным Whisper.cpp, AI-диалогами и оценкой произношения

    Привет, Хабр! Меня зовут Vlad, я начинающий Python‑разработчик и энтузиаст изучения языков. Недавно я столкнулся с классической проблемой полиглота‑самоучки: учебники дают теорию, аудиокурсы — пассивное восприятие, но нет главного — обратной связи по произношению. Репетиторы дороги, а разговорные клубы требуют уровня, которого у меня еще не было. Я решил закрыть эту боль кодом. Моя цель была амбициозной: создать Telegram‑бота, который: 1. Слушает голосовые сообщения и распознает речь без дорогих облачных API. 2. Оценивает точность произношения в процентах, сравнивая с эталоном. 3. Поддерживает живой диалог через LLM, исправляя ошибки на лету. 4. Работает быстро и экономно на слабом VPS. В этой статье я подробно разберу архитектуру проекта, покажу, как интегрировать бинарный whisper.cpp в асинхронный aiogram 3.x, реализую алгоритм оценки речи и расскажу про управление состояниями (FSM). Под капотом — Python, нейросети и немного магии.

    habr.com/ru/articles/1014888/

    #Python #Telegram_Bot #Aiogram #Whisper #Speech_Recognition #Machine_Learning #NLP #Artificial_Intelligence #Асинхронность #Испанский_язык

  26. Stable Diffusion XL: так ли сложно использовать локальную модель?

    Когда звучит фраза «нарисовать картинку нейросетью», под этим обычно подразумевается отправка запроса в какой-нибудь условно-бесплатный сервис вроде Nano Banana или ChatGPT. Еще можно заплатить за подписку на Midjourney и смириться с тем, что твои промпты видит вся дискорд-галерея. Есть, конечно, и еще один путь — поднять открытую модель вроде Stable Diffusion на собственном компьютере, однако для большинства пользователей он всё ещё ощущается как «очень сложно» или «очень дорого». Книга, о которой мы хотим сегодня рассказать, решает как минимум первую проблему. И как же именно?

    habr.com/ru/companies/bhv_publ

    #ИИ #AI #ml #artificial_intelligence #stablediffusion #stable_diffusion #stable_diffusion_нейросеть #нейронные_сети #нейросети #генерация_изображений

  27. Stable Diffusion XL: так ли сложно использовать локальную модель?

    Когда звучит фраза «нарисовать картинку нейросетью», под этим обычно подразумевается отправка запроса в какой-нибудь условно-бесплатный сервис вроде Nano Banana или ChatGPT. Еще можно заплатить за подписку на Midjourney и смириться с тем, что твои промпты видит вся дискорд-галерея. Есть, конечно, и еще один путь — поднять открытую модель вроде Stable Diffusion на собственном компьютере, однако для большинства пользователей он всё ещё ощущается как «очень сложно» или «очень дорого». Книга, о которой мы хотим сегодня рассказать, решает как минимум первую проблему. И как же именно?

    habr.com/ru/companies/bhv_publ

    #ИИ #AI #ml #artificial_intelligence #stablediffusion #stable_diffusion #stable_diffusion_нейросеть #нейронные_сети #нейросети #генерация_изображений

  28. Stable Diffusion XL: так ли сложно использовать локальную модель?

    Когда звучит фраза «нарисовать картинку нейросетью», под этим обычно подразумевается отправка запроса в какой-нибудь условно-бесплатный сервис вроде Nano Banana или ChatGPT. Еще можно заплатить за подписку на Midjourney и смириться с тем, что твои промпты видит вся дискорд-галерея. Есть, конечно, и еще один путь — поднять открытую модель вроде Stable Diffusion на собственном компьютере, однако для большинства пользователей он всё ещё ощущается как «очень сложно» или «очень дорого». Книга, о которой мы хотим сегодня рассказать, решает как минимум первую проблему. И как же именно?

    habr.com/ru/companies/bhv_publ

    #ИИ #AI #ml #artificial_intelligence #stablediffusion #stable_diffusion #stable_diffusion_нейросеть #нейронные_сети #нейросети #генерация_изображений

  29. Stable Diffusion XL: так ли сложно использовать локальную модель?

    Когда звучит фраза «нарисовать картинку нейросетью», под этим обычно подразумевается отправка запроса в какой-нибудь условно-бесплатный сервис вроде Nano Banana или ChatGPT. Еще можно заплатить за подписку на Midjourney и смириться с тем, что твои промпты видит вся дискорд-галерея. Есть, конечно, и еще один путь — поднять открытую модель вроде Stable Diffusion на собственном компьютере, однако для большинства пользователей он всё ещё ощущается как «очень сложно» или «очень дорого». Книга, о которой мы хотим сегодня рассказать, решает как минимум первую проблему. И как же именно?

    habr.com/ru/companies/bhv_publ

    #ИИ #AI #ml #artificial_intelligence #stablediffusion #stable_diffusion #stable_diffusion_нейросеть #нейронные_сети #нейросети #генерация_изображений

  30. Графы знаний в юридическом домене: как не потерять сложность при построении RAG-системы

    Ни одна современная AI-система в юридическом домене не обходится без RAG: юридические данные слишком специфичны, слишком изменчивы и никогда слишком редко составляли значимую часть обучающей выборки LLM, чтобы доверять ей без внешней базы знаний. Обычно при построении RAG-системы используют модуль поиска, основанный на векторных БД. Однако в таких сложно организованных областях знаний, как юридическая, архитектура, основанная на поиске в хранилище "плоских" эмбеддингов, может не справиться. Векторный поиск позволяет находить семантически близкие (схожие) фрагменты текстов, тогда как юридический домен также требует понимания многочисленных связей между сущностями , рассеянными по множеству документов . Кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний, особенно после появления современных инструментов, позволяющих автоматически строить такие графы на тысячах документов и использовать их в качестве хранилища знаний для RAG-систем. Однако все имеет свою цену: неполнота или неточность построенного графа может свести на нет все вложенные ресурсы и оставить вас с системой, которая хуже "наивного" векторного поиска. Какие преимущества поиска по графу знаний по сравнению с классическим векторным поиском, а также каковы критерии, когда использование графового поиска действительно необходимо для построения RAG-системы в юридическом домене?

    habr.com/ru/articles/1012556/

    #RAG #retrievalaugmented_generation #ai #artificial_intelligence #llm #large_language_models #vector_database #graph_database #knowledge_graphs #graphrag

  31. Графы знаний в юридическом домене: как не потерять сложность при построении RAG-системы

    Ни одна современная AI-система в юридическом домене не обходится без RAG: юридические данные слишком специфичны, слишком изменчивы и никогда слишком редко составляли значимую часть обучающей выборки LLM, чтобы доверять ей без внешней базы знаний. Обычно при построении RAG-системы используют модуль поиска, основанный на векторных БД. Однако в таких сложно организованных областях знаний, как юридическая, архитектура, основанная на поиске в хранилище "плоских" эмбеддингов, может не справиться. Векторный поиск позволяет находить семантически близкие (схожие) фрагменты текстов, тогда как юридический домен также требует понимания многочисленных связей между сущностями , рассеянными по множеству документов . Кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний, особенно после появления современных инструментов, позволяющих автоматически строить такие графы на тысячах документов и использовать их в качестве хранилища знаний для RAG-систем. Однако все имеет свою цену: неполнота или неточность построенного графа может свести на нет все вложенные ресурсы и оставить вас с системой, которая хуже "наивного" векторного поиска. Какие преимущества поиска по графу знаний по сравнению с классическим векторным поиском, а также каковы критерии, когда использование графового поиска действительно необходимо для построения RAG-системы в юридическом домене?

    habr.com/ru/articles/1012556/

    #RAG #retrievalaugmented_generation #ai #artificial_intelligence #llm #large_language_models #vector_database #graph_database #knowledge_graphs #graphrag

  32. Графы знаний в юридическом домене: как не потерять сложность при построении RAG-системы

    Ни одна современная AI-система в юридическом домене не обходится без RAG: юридические данные слишком специфичны, слишком изменчивы и никогда слишком редко составляли значимую часть обучающей выборки LLM, чтобы доверять ей без внешней базы знаний. Обычно при построении RAG-системы используют модуль поиска, основанный на векторных БД. Однако в таких сложно организованных областях знаний, как юридическая, архитектура, основанная на поиске в хранилище "плоских" эмбеддингов, может не справиться. Векторный поиск позволяет находить семантически близкие (схожие) фрагменты текстов, тогда как юридический домен также требует понимания многочисленных связей между сущностями , рассеянными по множеству документов . Кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний, особенно после появления современных инструментов, позволяющих автоматически строить такие графы на тысячах документов и использовать их в качестве хранилища знаний для RAG-систем. Однако все имеет свою цену: неполнота или неточность построенного графа может свести на нет все вложенные ресурсы и оставить вас с системой, которая хуже "наивного" векторного поиска. Какие преимущества поиска по графу знаний по сравнению с классическим векторным поиском, а также каковы критерии, когда использование графового поиска действительно необходимо для построения RAG-системы в юридическом домене?

    habr.com/ru/articles/1012556/

    #RAG #retrievalaugmented_generation #ai #artificial_intelligence #llm #large_language_models #vector_database #graph_database #knowledge_graphs #graphrag

  33. Графы знаний в юридическом домене: как не потерять сложность при построении RAG-системы

    Ни одна современная AI-система в юридическом домене не обходится без RAG: юридические данные слишком специфичны, слишком изменчивы и никогда слишком редко составляли значимую часть обучающей выборки LLM, чтобы доверять ей без внешней базы знаний. Обычно при построении RAG-системы используют модуль поиска, основанный на векторных БД. Однако в таких сложно организованных областях знаний, как юридическая, архитектура, основанная на поиске в хранилище "плоских" эмбеддингов, может не справиться. Векторный поиск позволяет находить семантически близкие (схожие) фрагменты текстов, тогда как юридический домен также требует понимания многочисленных связей между сущностями , рассеянными по множеству документов . Кажется, что область знаний, организованная таким образом, идеально может быть представлена в виде графа знаний, особенно после появления современных инструментов, позволяющих автоматически строить такие графы на тысячах документов и использовать их в качестве хранилища знаний для RAG-систем. Однако все имеет свою цену: неполнота или неточность построенного графа может свести на нет все вложенные ресурсы и оставить вас с системой, которая хуже "наивного" векторного поиска. Какие преимущества поиска по графу знаний по сравнению с классическим векторным поиском, а также каковы критерии, когда использование графового поиска действительно необходимо для построения RAG-системы в юридическом домене?

    habr.com/ru/articles/1012556/

    #RAG #retrievalaugmented_generation #ai #artificial_intelligence #llm #large_language_models #vector_database #graph_database #knowledge_graphs #graphrag