home.social

#encoder — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #encoder, aggregated by home.social.

  1. Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

    Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT - быстрее, дешевле, без vendor lock-in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

    habr.com/ru/companies/raft/art

    #gliner #ai #ml #llm #nlp #gliner2 #zeroshot #encoder

  2. Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

    Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT - быстрее, дешевле, без vendor lock-in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

    habr.com/ru/companies/raft/art

    #gliner #ai #ml #llm #nlp #gliner2 #zeroshot #encoder

  3. Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

    Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT - быстрее, дешевле, без vendor lock-in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

    habr.com/ru/companies/raft/art

    #gliner #ai #ml #llm #nlp #gliner2 #zeroshot #encoder

  4. Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

    Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT - быстрее, дешевле, без vendor lock-in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

    habr.com/ru/companies/raft/art

    #gliner #ai #ml #llm #nlp #gliner2 #zeroshot #encoder

  5. Современные LLM – это больше, чем просто предсказание слов

    « Эта модель лучше шутит, а та лучше пишет код » — отличный критерий выбора, если вы просто переписываетесь с чатиком. Но как только LLM оказывается внутри продукта, нас перестаёт интересовать юмор и начинает волновать архитектура: encoder‑decoder против decoder‑only, мультимодальные энкодеры, test‑time reasoning, скрытые цепочки рассуждений. В этом посте попробуем перестать выбирать между логотипами и посмотреть на языковые модели как на инженерные конструкции с понятными trade‑off’ами.

    habr.com/ru/articles/1008006/

    #llm #encoder #decoder #ml

  6. Современные LLM – это больше, чем просто предсказание слов

    « Эта модель лучше шутит, а та лучше пишет код » — отличный критерий выбора, если вы просто переписываетесь с чатиком. Но как только LLM оказывается внутри продукта, нас перестаёт интересовать юмор и начинает волновать архитектура: encoder‑decoder против decoder‑only, мультимодальные энкодеры, test‑time reasoning, скрытые цепочки рассуждений. В этом посте попробуем перестать выбирать между логотипами и посмотреть на языковые модели как на инженерные конструкции с понятными trade‑off’ами.

    habr.com/ru/articles/1008006/

    #llm #encoder #decoder #ml

  7. Современные LLM – это больше, чем просто предсказание слов

    « Эта модель лучше шутит, а та лучше пишет код » — отличный критерий выбора, если вы просто переписываетесь с чатиком. Но как только LLM оказывается внутри продукта, нас перестаёт интересовать юмор и начинает волновать архитектура: encoder‑decoder против decoder‑only, мультимодальные энкодеры, test‑time reasoning, скрытые цепочки рассуждений. В этом посте попробуем перестать выбирать между логотипами и посмотреть на языковые модели как на инженерные конструкции с понятными trade‑off’ами.

    habr.com/ru/articles/1008006/

    #llm #encoder #decoder #ml

  8. Современные LLM – это больше, чем просто предсказание слов

    « Эта модель лучше шутит, а та лучше пишет код » — отличный критерий выбора, если вы просто переписываетесь с чатиком. Но как только LLM оказывается внутри продукта, нас перестаёт интересовать юмор и начинает волновать архитектура: encoder‑decoder против decoder‑only, мультимодальные энкодеры, test‑time reasoning, скрытые цепочки рассуждений. В этом посте попробуем перестать выбирать между логотипами и посмотреть на языковые модели как на инженерные конструкции с понятными trade‑off’ами.

    habr.com/ru/articles/1008006/

    #llm #encoder #decoder #ml

  9. Трансформер своими руками: с нуля до Numpy реализации и обучения

    В этой статье пойдет речь об одной из самых сложных и интересных архитектур — трансформере, лежащей в основе современных моделей от OpenAI и Google DeepMind. И это не научпоп для обывателя с наивным уровнем объяснения, а полноценный учебный материал, который поможет вам понять работу трансформера на фундаментальном уровне без черных ящиков типа TensorFlow и Pytorch. А для того чтобы лучше вникнуть, давайте напишем настоящий мини-трансформер на процедурном Python и обучим его! Данный материал можно изучать в разных режимах: * Как объяснение архитектуры для общего представления; * Как полноценный гайд с чтением кода и самостоятельной практикой; * Как основу для собственных экспериментов. Вы сами можете выбрать тот режим, который нужен для ваших целей на данный момент. Наш трансформер будет довольно простым: со статическим графом и одноблочными энкодером и декодером. Сам код написан в парадигме процедурного программирования (за исключением некоторых модулей) и может быть прочитан на любом уровне и без знания ООП. И все же это будет полноценный обучаемый трансформер с мультиголовым вниманием, батчами данных, параллельным вычислением и множеством параметров. Для закрепления материала, выполните Домашнее задание, которое ждет вас в конце статьи. Напишем трансформер!

    habr.com/ru/articles/982268/

    #transformer #encoder #decoder #numpy #с_нуля #deeplearning #attention #backpropagation #нейросети #pytorch

  10. Трансформер своими руками: с нуля до Numpy реализации и обучения

    В этой статье пойдет речь об одной из самых сложных и интересных архитектур — трансформере, лежащей в основе современных моделей от OpenAI и Google DeepMind. И это не научпоп для обывателя с наивным уровнем объяснения, а полноценный учебный материал, который поможет вам понять работу трансформера на фундаментальном уровне без черных ящиков типа TensorFlow и Pytorch. А для того чтобы лучше вникнуть, давайте напишем настоящий мини-трансформер на процедурном Python и обучим его! Данный материал можно изучать в разных режимах: * Как объяснение архитектуры для общего представления; * Как полноценный гайд с чтением кода и самостоятельной практикой; * Как основу для собственных экспериментов. Вы сами можете выбрать тот режим, который нужен для ваших целей на данный момент. Наш трансформер будет довольно простым: со статическим графом и одноблочными энкодером и декодером. Сам код написан в парадигме процедурного программирования (за исключением некоторых модулей) и может быть прочитан на любом уровне и без знания ООП. И все же это будет полноценный обучаемый трансформер с мультиголовым вниманием, батчами данных, параллельным вычислением и множеством параметров. Для закрепления материала, выполните Домашнее задание, которое ждет вас в конце статьи. Напишем трансформер!

    habr.com/ru/articles/982268/

    #transformer #encoder #decoder #numpy #с_нуля #deeplearning #attention #backpropagation #нейросети #pytorch

  11. Трансформер своими руками: с нуля до Numpy реализации и обучения

    В этой статье пойдет речь об одной из самых сложных и интересных архитектур — трансформере, лежащей в основе современных моделей от OpenAI и Google DeepMind. И это не научпоп для обывателя с наивным уровнем объяснения, а полноценный учебный материал, который поможет вам понять работу трансформера на фундаментальном уровне без черных ящиков типа TensorFlow и Pytorch. А для того чтобы лучше вникнуть, давайте напишем настоящий мини-трансформер на процедурном Python и обучим его! Данный материал можно изучать в разных режимах: * Как объяснение архитектуры для общего представления; * Как полноценный гайд с чтением кода и самостоятельной практикой; * Как основу для собственных экспериментов. Вы сами можете выбрать тот режим, который нужен для ваших целей на данный момент. Наш трансформер будет довольно простым: со статическим графом и одноблочными энкодером и декодером. Сам код написан в парадигме процедурного программирования (за исключением некоторых модулей) и может быть прочитан на любом уровне и без знания ООП. И все же это будет полноценный обучаемый трансформер с мультиголовым вниманием, батчами данных, параллельным вычислением и множеством параметров. Для закрепления материала, выполните Домашнее задание, которое ждет вас в конце статьи. Напишем трансформер!

    habr.com/ru/articles/982268/

    #transformer #encoder #decoder #numpy #с_нуля #deeplearning #attention #backpropagation #нейросети #pytorch

  12. Трансформер своими руками: с нуля до Numpy реализации и обучения

    В этой статье пойдет речь об одной из самых сложных и интересных архитектур — трансформере, лежащей в основе современных моделей от OpenAI и Google DeepMind. И это не научпоп для обывателя с наивным уровнем объяснения, а полноценный учебный материал, который поможет вам понять работу трансформера на фундаментальном уровне без черных ящиков типа TensorFlow и Pytorch. А для того чтобы лучше вникнуть, давайте напишем настоящий мини-трансформер на процедурном Python и обучим его! Данный материал можно изучать в разных режимах: * Как объяснение архитектуры для общего представления; * Как полноценный гайд с чтением кода и самостоятельной практикой; * Как основу для собственных экспериментов. Вы сами можете выбрать тот режим, который нужен для ваших целей на данный момент. Наш трансформер будет довольно простым: со статическим графом и одноблочными энкодером и декодером. Сам код написан в парадигме процедурного программирования (за исключением некоторых модулей) и может быть прочитан на любом уровне и без знания ООП. И все же это будет полноценный обучаемый трансформер с мультиголовым вниманием, батчами данных, параллельным вычислением и множеством параметров. Для закрепления материала, выполните Домашнее задание, которое ждет вас в конце статьи. Напишем трансформер!

    habr.com/ru/articles/982268/

    #transformer #encoder #decoder #numpy #с_нуля #deeplearning #attention #backpropagation #нейросети #pytorch

  13. 🚀🤖 Behold, the T5Gemma 2: a groundbreaking #innovation in... something, presumably. But don't worry, it's just another #buzzword salad from the world's favorite ad company, masquerading as groundbreaking #tech, because nothing spells excitement like "encoder-decoder" to the masses. 🥱✨
    blog.google/technology/develop #T5Gemma2 #encoder-decoder #marketing #HackerNews #ngated

  14. 🚀🤖 Behold, the T5Gemma 2: a groundbreaking #innovation in... something, presumably. But don't worry, it's just another #buzzword salad from the world's favorite ad company, masquerading as groundbreaking #tech, because nothing spells excitement like "encoder-decoder" to the masses. 🥱✨
    blog.google/technology/develop #T5Gemma2 #encoder-decoder #marketing #HackerNews #ngated

  15. 🚀🤖 Behold, the T5Gemma 2: a groundbreaking #innovation in... something, presumably. But don't worry, it's just another #buzzword salad from the world's favorite ad company, masquerading as groundbreaking #tech, because nothing spells excitement like "encoder-decoder" to the masses. 🥱✨
    blog.google/technology/develop #T5Gemma2 #encoder-decoder #marketing #HackerNews #ngated

  16. 🚀🤖 Behold, the T5Gemma 2: a groundbreaking #innovation in... something, presumably. But don't worry, it's just another #buzzword salad from the world's favorite ad company, masquerading as groundbreaking #tech, because nothing spells excitement like "encoder-decoder" to the masses. 🥱✨
    blog.google/technology/develop #T5Gemma2 #encoder-decoder #marketing #HackerNews #ngated

  17. Пример реализации агентного RAG'а

    Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и вызвать внешние инструменты. И все это для выполнения поставленной задачи. В этой статье на практическом примере разберем как с помощью marker'а, Qwen3-14B, MCP-сервера, энкодера FRIDA и библиотеки Agno создать несложный агентный RAG. --------------- Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

    habr.com/ru/articles/966966/

    #agent #llm #ai #tools #rag #data_science #encoder #mcp #mcpserver

  18. Пример реализации агентного RAG'а

    Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и вызвать внешние инструменты. И все это для выполнения поставленной задачи. В этой статье на практическом примере разберем как с помощью marker'а, Qwen3-14B, MCP-сервера, энкодера FRIDA и библиотеки Agno создать несложный агентный RAG. --------------- Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

    habr.com/ru/articles/966966/

    #agent #llm #ai #tools #rag #data_science #encoder #mcp #mcpserver

  19. Пример реализации агентного RAG'а

    Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и вызвать внешние инструменты. И все это для выполнения поставленной задачи. В этой статье на практическом примере разберем как с помощью marker'а, Qwen3-14B, MCP-сервера, энкодера FRIDA и библиотеки Agno создать несложный агентный RAG. --------------- Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

    habr.com/ru/articles/966966/

    #agent #llm #ai #tools #rag #data_science #encoder #mcp #mcpserver

  20. Пример реализации агентного RAG'а

    Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и вызвать внешние инструменты. И все это для выполнения поставленной задачи. В этой статье на практическом примере разберем как с помощью marker'а, Qwen3-14B, MCP-сервера, энкодера FRIDA и библиотеки Agno создать несложный агентный RAG. --------------- Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

    habr.com/ru/articles/966966/

    #agent #llm #ai #tools #rag #data_science #encoder #mcp #mcpserver

  21. 🚀 Oh, the riveting #saga continues! Witness as #Ada, the language nobody asked for, takes on yet another #unnecessary feat: building a #BZip2 #encoder that absolutely nobody needed – in #record time! 🤯 Part 2, because once wasn't enough! 🤡
    gautiersblog.blogspot.com/2025 #Feat #Time #Part2 #HackerNews #ngated

  22. 🚀 Oh, the riveting #saga continues! Witness as #Ada, the language nobody asked for, takes on yet another #unnecessary feat: building a #BZip2 #encoder that absolutely nobody needed – in #record time! 🤯 Part 2, because once wasn't enough! 🤡
    gautiersblog.blogspot.com/2025 #Feat #Time #Part2 #HackerNews #ngated

  23. 🚀 Oh, the riveting #saga continues! Witness as #Ada, the language nobody asked for, takes on yet another #unnecessary feat: building a #BZip2 #encoder that absolutely nobody needed – in #record time! 🤯 Part 2, because once wasn't enough! 🤡
    gautiersblog.blogspot.com/2025 #Feat #Time #Part2 #HackerNews #ngated

  24. 🚀 Oh, the riveting #saga continues! Witness as #Ada, the language nobody asked for, takes on yet another #unnecessary feat: building a #BZip2 #encoder that absolutely nobody needed – in #record time! 🤯 Part 2, because once wasn't enough! 🤡
    gautiersblog.blogspot.com/2025 #Feat #Time #Part2 #HackerNews #ngated