#encoder — Public Fediverse posts on home.social

Habr @[email protected] · 2026-03-13 · 18:32 UTC

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT - быстрее, дешевле, без vendor lock-in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

https://habr.com/ru/companies/raft/articles/1010028/

#gliner #ai #ml #llm #nlp #gliner2 #zeroshot #encoder

#gliner #ai #ml #llm #nlp #gliner2

Habr @[email protected] · 2026-03-13 · 18:32 UTC

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT - быстрее, дешевле, без vendor lock-in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

https://habr.com/ru/companies/raft/articles/1010028/

#gliner #ai #ml #llm #nlp #gliner2 #zeroshot #encoder

#gliner #ai #ml #llm #nlp #gliner2

Habr @[email protected] · 2026-03-13 · 18:32 UTC

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT - быстрее, дешевле, без vendor lock-in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

https://habr.com/ru/companies/raft/articles/1010028/

#gliner #ai #ml #llm #nlp #gliner2 #zeroshot #encoder

#gliner #ai #ml #llm #nlp #gliner2

Habr @[email protected] · 2026-03-13 · 18:32 UTC

Тихая эволюция zero-shot энкодеров. От UniNER до GLiNER 2

Пока все говорят про LLM агентов, есть целый класс задач где 205M энкодер делает ту же работу что ChatGPT - быстрее, дешевле, без vendor lock-in. Я хочу рассказать про эволюцию энкодеров, которую вы возможно пропустили: начиная от UniNER, заканчивая GLiNER 2, с ключевыми инсайтами на каждом шаге.

https://habr.com/ru/companies/raft/articles/1010028/

#gliner #ai #ml #llm #nlp #gliner2 #zeroshot #encoder

#encoder #zeroshot #gliner2 #nlp #llm #ml

Habr @[email protected] · 2026-03-08 · 20:52 UTC

Современные LLM – это больше, чем просто предсказание слов

« Эта модель лучше шутит, а та лучше пишет код » — отличный критерий выбора, если вы просто переписываетесь с чатиком. Но как только LLM оказывается внутри продукта, нас перестаёт интересовать юмор и начинает волновать архитектура: encoder‑decoder против decoder‑only, мультимодальные энкодеры, test‑time reasoning, скрытые цепочки рассуждений. В этом посте попробуем перестать выбирать между логотипами и посмотреть на языковые модели как на инженерные конструкции с понятными trade‑off’ами.

https://habr.com/ru/articles/1008006/

#llm #encoder #decoder #ml

#ml #decoder #encoder #llm

Habr @[email protected] · 2026-03-08 · 20:52 UTC

Современные LLM – это больше, чем просто предсказание слов

« Эта модель лучше шутит, а та лучше пишет код » — отличный критерий выбора, если вы просто переписываетесь с чатиком. Но как только LLM оказывается внутри продукта, нас перестаёт интересовать юмор и начинает волновать архитектура: encoder‑decoder против decoder‑only, мультимодальные энкодеры, test‑time reasoning, скрытые цепочки рассуждений. В этом посте попробуем перестать выбирать между логотипами и посмотреть на языковые модели как на инженерные конструкции с понятными trade‑off’ами.

https://habr.com/ru/articles/1008006/

#llm #encoder #decoder #ml

#ml #decoder #encoder #llm

Habr @[email protected] · 2026-03-08 · 20:52 UTC

Современные LLM – это больше, чем просто предсказание слов

« Эта модель лучше шутит, а та лучше пишет код » — отличный критерий выбора, если вы просто переписываетесь с чатиком. Но как только LLM оказывается внутри продукта, нас перестаёт интересовать юмор и начинает волновать архитектура: encoder‑decoder против decoder‑only, мультимодальные энкодеры, test‑time reasoning, скрытые цепочки рассуждений. В этом посте попробуем перестать выбирать между логотипами и посмотреть на языковые модели как на инженерные конструкции с понятными trade‑off’ами.

https://habr.com/ru/articles/1008006/

#llm #encoder #decoder #ml

#ml #decoder #encoder #llm

Habr @[email protected] · 2026-03-08 · 20:52 UTC

Современные LLM – это больше, чем просто предсказание слов

« Эта модель лучше шутит, а та лучше пишет код » — отличный критерий выбора, если вы просто переписываетесь с чатиком. Но как только LLM оказывается внутри продукта, нас перестаёт интересовать юмор и начинает волновать архитектура: encoder‑decoder против decoder‑only, мультимодальные энкодеры, test‑time reasoning, скрытые цепочки рассуждений. В этом посте попробуем перестать выбирать между логотипами и посмотреть на языковые модели как на инженерные конструкции с понятными trade‑off’ами.

https://habr.com/ru/articles/1008006/

#llm #encoder #decoder #ml

Habr @[email protected] · 2026-02-17 · 01:12 UTC

Трансформер своими руками: с нуля до Numpy реализации и обучения

В этой статье пойдет речь об одной из самых сложных и интересных архитектур — трансформере, лежащей в основе современных моделей от OpenAI и Google DeepMind. И это не научпоп для обывателя с наивным уровнем объяснения, а полноценный учебный материал, который поможет вам понять работу трансформера на фундаментальном уровне без черных ящиков типа TensorFlow и Pytorch. А для того чтобы лучше вникнуть, давайте напишем настоящий мини-трансформер на процедурном Python и обучим его! Данный материал можно изучать в разных режимах: * Как объяснение архитектуры для общего представления; * Как полноценный гайд с чтением кода и самостоятельной практикой; * Как основу для собственных экспериментов. Вы сами можете выбрать тот режим, который нужен для ваших целей на данный момент. Наш трансформер будет довольно простым: со статическим графом и одноблочными энкодером и декодером. Сам код написан в парадигме процедурного программирования (за исключением некоторых модулей) и может быть прочитан на любом уровне и без знания ООП. И все же это будет полноценный обучаемый трансформер с мультиголовым вниманием, батчами данных, параллельным вычислением и множеством параметров. Для закрепления материала, выполните Домашнее задание, которое ждет вас в конце статьи. Напишем трансформер!

https://habr.com/ru/articles/982268/

#transformer #encoder #decoder #numpy #с_нуля #deeplearning #attention #backpropagation #нейросети #pytorch

#pytorch #нейросети #backpropagation #attention #deeplearning #с_нуля

Habr @[email protected] · 2026-02-17 · 01:12 UTC

Трансформер своими руками: с нуля до Numpy реализации и обучения

В этой статье пойдет речь об одной из самых сложных и интересных архитектур — трансформере, лежащей в основе современных моделей от OpenAI и Google DeepMind. И это не научпоп для обывателя с наивным уровнем объяснения, а полноценный учебный материал, который поможет вам понять работу трансформера на фундаментальном уровне без черных ящиков типа TensorFlow и Pytorch. А для того чтобы лучше вникнуть, давайте напишем настоящий мини-трансформер на процедурном Python и обучим его! Данный материал можно изучать в разных режимах: * Как объяснение архитектуры для общего представления; * Как полноценный гайд с чтением кода и самостоятельной практикой; * Как основу для собственных экспериментов. Вы сами можете выбрать тот режим, который нужен для ваших целей на данный момент. Наш трансформер будет довольно простым: со статическим графом и одноблочными энкодером и декодером. Сам код написан в парадигме процедурного программирования (за исключением некоторых модулей) и может быть прочитан на любом уровне и без знания ООП. И все же это будет полноценный обучаемый трансформер с мультиголовым вниманием, батчами данных, параллельным вычислением и множеством параметров. Для закрепления материала, выполните Домашнее задание, которое ждет вас в конце статьи. Напишем трансформер!

https://habr.com/ru/articles/982268/

#transformer #encoder #decoder #numpy #с_нуля #deeplearning #attention #backpropagation #нейросети #pytorch

#transformer #encoder #decoder #numpy #с_нуля #deeplearning

Habr @[email protected] · 2026-02-17 · 01:12 UTC

Трансформер своими руками: с нуля до Numpy реализации и обучения

В этой статье пойдет речь об одной из самых сложных и интересных архитектур — трансформере, лежащей в основе современных моделей от OpenAI и Google DeepMind. И это не научпоп для обывателя с наивным уровнем объяснения, а полноценный учебный материал, который поможет вам понять работу трансформера на фундаментальном уровне без черных ящиков типа TensorFlow и Pytorch. А для того чтобы лучше вникнуть, давайте напишем настоящий мини-трансформер на процедурном Python и обучим его! Данный материал можно изучать в разных режимах: * Как объяснение архитектуры для общего представления; * Как полноценный гайд с чтением кода и самостоятельной практикой; * Как основу для собственных экспериментов. Вы сами можете выбрать тот режим, который нужен для ваших целей на данный момент. Наш трансформер будет довольно простым: со статическим графом и одноблочными энкодером и декодером. Сам код написан в парадигме процедурного программирования (за исключением некоторых модулей) и может быть прочитан на любом уровне и без знания ООП. И все же это будет полноценный обучаемый трансформер с мультиголовым вниманием, батчами данных, параллельным вычислением и множеством параметров. Для закрепления материала, выполните Домашнее задание, которое ждет вас в конце статьи. Напишем трансформер!

https://habr.com/ru/articles/982268/

#transformer #encoder #decoder #numpy #с_нуля #deeplearning #attention #backpropagation #нейросети #pytorch

#pytorch #нейросети #backpropagation #attention #deeplearning #с_нуля

Habr @[email protected] · 2026-02-17 · 01:12 UTC

Трансформер своими руками: с нуля до Numpy реализации и обучения

В этой статье пойдет речь об одной из самых сложных и интересных архитектур — трансформере, лежащей в основе современных моделей от OpenAI и Google DeepMind. И это не научпоп для обывателя с наивным уровнем объяснения, а полноценный учебный материал, который поможет вам понять работу трансформера на фундаментальном уровне без черных ящиков типа TensorFlow и Pytorch. А для того чтобы лучше вникнуть, давайте напишем настоящий мини-трансформер на процедурном Python и обучим его! Данный материал можно изучать в разных режимах: * Как объяснение архитектуры для общего представления; * Как полноценный гайд с чтением кода и самостоятельной практикой; * Как основу для собственных экспериментов. Вы сами можете выбрать тот режим, который нужен для ваших целей на данный момент. Наш трансформер будет довольно простым: со статическим графом и одноблочными энкодером и декодером. Сам код написан в парадигме процедурного программирования (за исключением некоторых модулей) и может быть прочитан на любом уровне и без знания ООП. И все же это будет полноценный обучаемый трансформер с мультиголовым вниманием, батчами данных, параллельным вычислением и множеством параметров. Для закрепления материала, выполните Домашнее задание, которое ждет вас в конце статьи. Напишем трансформер!

https://habr.com/ru/articles/982268/

#transformer #encoder #decoder #numpy #с_нуля #deeplearning #attention #backpropagation #нейросети #pytorch

#pytorch #нейросети #backpropagation #attention #deeplearning #с_нуля

Doc Cool @[email protected] · 2025-12-20 · 13:23 UTC

Neues Video:

#Mailbag #153: #Elektronik von #Elecrow #China: #ESP32 Rotary #Encoder mit 1.28in 240x240px IPS #Display

--> https://youtu.be/sDsGfX4up_4

#Maker #DIY #ESP32S3 #Mikrocontroller #Warentest #Review #Produkttest #Gadgets

#mailbag #elektronik #elecrow #china #esp32 #encoder

Doc Cool @[email protected] · 2025-12-20 · 13:23 UTC

Neues Video:

#Mailbag #153: #Elektronik von #Elecrow #China: #ESP32 Rotary #Encoder mit 1.28in 240x240px IPS #Display

--> https://youtu.be/sDsGfX4up_4

#Maker #DIY #ESP32S3 #Mikrocontroller #Warentest #Review #Produkttest #Gadgets

#mailbag #elektronik #elecrow #china #esp32 #encoder

Doc Cool @[email protected] · 2025-12-20 · 13:23 UTC

Neues Video:

#Mailbag #153: #Elektronik von #Elecrow #China: #ESP32 Rotary #Encoder mit 1.28in 240x240px IPS #Display

--> https://youtu.be/sDsGfX4up_4

#Maker #DIY #ESP32S3 #Mikrocontroller #Warentest #Review #Produkttest #Gadgets

#mailbag #elektronik #elecrow #china #esp32 #encoder

Doc Cool @[email protected] · 2025-12-20 · 13:23 UTC

Neues Video:

#Mailbag #153: #Elektronik von #Elecrow #China: #ESP32 Rotary #Encoder mit 1.28in 240x240px IPS #Display

--> https://youtu.be/sDsGfX4up_4

#Maker #DIY #ESP32S3 #Mikrocontroller #Warentest #Review #Produkttest #Gadgets

#gadgets #produkttest #review #warentest #mikrocontroller #esp32s3

Doc Cool @[email protected] · 2025-12-20 · 13:23 UTC

Neues Video:

#Mailbag #153: #Elektronik von #Elecrow #China: #ESP32 Rotary #Encoder mit 1.28in 240x240px IPS #Display

--> https://youtu.be/sDsGfX4up_4

#Maker #DIY #ESP32S3 #Mikrocontroller #Warentest #Review #Produkttest #Gadgets

#mailbag #elektronik #elecrow #china #esp32 #encoder

N-gated Hacker News @[email protected] · 2025-12-18 · 20:49 UTC

🚀🤖 Behold, the T5Gemma 2: a groundbreaking #innovation in... something, presumably. But don't worry, it's just another #buzzword salad from the world's favorite ad company, masquerading as groundbreaking #tech, because nothing spells excitement like "encoder-decoder" to the masses. 🥱✨
https://blog.google/technology/developers/t5gemma-2/ #T5Gemma2 #encoder-decoder #marketing #HackerNews #ngated

#innovation #buzzword #tech #t5gemma2 #encoder #marketing

N-gated Hacker News @[email protected] · 2025-12-18 · 20:49 UTC

🚀🤖 Behold, the T5Gemma 2: a groundbreaking #innovation in... something, presumably. But don't worry, it's just another #buzzword salad from the world's favorite ad company, masquerading as groundbreaking #tech, because nothing spells excitement like "encoder-decoder" to the masses. 🥱✨
https://blog.google/technology/developers/t5gemma-2/ #T5Gemma2 #encoder-decoder #marketing #HackerNews #ngated

#innovation #buzzword #tech #t5gemma2 #encoder #marketing

N-gated Hacker News @[email protected] · 2025-12-18 · 20:49 UTC

🚀🤖 Behold, the T5Gemma 2: a groundbreaking #innovation in... something, presumably. But don't worry, it's just another #buzzword salad from the world's favorite ad company, masquerading as groundbreaking #tech, because nothing spells excitement like "encoder-decoder" to the masses. 🥱✨
https://blog.google/technology/developers/t5gemma-2/ #T5Gemma2 #encoder-decoder #marketing #HackerNews #ngated

#ngated #hackernews #marketing #encoder #t5gemma2 #tech

N-gated Hacker News @[email protected] · 2025-12-18 · 20:49 UTC

🚀🤖 Behold, the T5Gemma 2: a groundbreaking #innovation in... something, presumably. But don't worry, it's just another #buzzword salad from the world's favorite ad company, masquerading as groundbreaking #tech, because nothing spells excitement like "encoder-decoder" to the masses. 🥱✨
https://blog.google/technology/developers/t5gemma-2/ #T5Gemma2 #encoder-decoder #marketing #HackerNews #ngated

#innovation #buzzword #tech #t5gemma2 #encoder #marketing

Habr @[email protected] · 2025-11-16 · 18:42 UTC

Пример реализации агентного RAG'а

Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и вызвать внешние инструменты. И все это для выполнения поставленной задачи. В этой статье на практическом примере разберем как с помощью marker'а, Qwen3-14B, MCP-сервера, энкодера FRIDA и библиотеки Agno создать несложный агентный RAG. --------------- Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

https://habr.com/ru/articles/966966/

#agent #llm #ai #tools #rag #data_science #encoder #mcp #mcpserver

#mcpserver #mcp #encoder #data_science #rag #tools

Habr @[email protected] · 2025-11-16 · 18:42 UTC

Пример реализации агентного RAG'а

Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и вызвать внешние инструменты. И все это для выполнения поставленной задачи. В этой статье на практическом примере разберем как с помощью marker'а, Qwen3-14B, MCP-сервера, энкодера FRIDA и библиотеки Agno создать несложный агентный RAG. --------------- Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

https://habr.com/ru/articles/966966/

#agent #llm #ai #tools #rag #data_science #encoder #mcp #mcpserver

#mcpserver #mcp #encoder #data_science #rag #tools

Habr @[email protected] · 2025-11-16 · 18:42 UTC

Пример реализации агентного RAG'а

Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и вызвать внешние инструменты. И все это для выполнения поставленной задачи. В этой статье на практическом примере разберем как с помощью marker'а, Qwen3-14B, MCP-сервера, энкодера FRIDA и библиотеки Agno создать несложный агентный RAG. --------------- Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

https://habr.com/ru/articles/966966/

#agent #llm #ai #tools #rag #data_science #encoder #mcp #mcpserver

#mcpserver #mcp #encoder #data_science #rag #tools

Habr @[email protected] · 2025-11-16 · 18:42 UTC

Пример реализации агентного RAG'а

Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и вызвать внешние инструменты. И все это для выполнения поставленной задачи. В этой статье на практическом примере разберем как с помощью marker'а, Qwen3-14B, MCP-сервера, энкодера FRIDA и библиотеки Agno создать несложный агентный RAG. --------------- Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

https://habr.com/ru/articles/966966/

#agent #llm #ai #tools #rag #data_science #encoder #mcp #mcpserver