#bert — Public Fediverse posts on home.social

Habr @[email protected] · 2026-05-14 · 09:52 UTC

Клиент — это тоже вектор? Как мы хотели улучшить ML-модель, а построили similarity engine

Поговорим о том, как превращать последовательности пользовательских событий в векторы, зачем обучать BERT на "языке" клиентского поведения и почему embedding-пространство может неожиданно начать отражать будущую ценность пользователей

https://habr.com/ru/articles/1034880/

#машинное_обучение #анализ_данных #bert #deep_learning #machine_learning #embeddings #transformers

#transformers #embeddings #machine_learning #deep_learning #bert #анализ_данных

GLOBAL Visibility aéPiot - by aePiot.ro @[email protected] · 2026-05-09 · 10:43 UTC

#STRANGERS IN ##THE #NIGHT ##THE #MUSIC OF #BERT #KAEMPFERT aepiot.com/advanced-sea... #LIST OF #WALLACE #GROMIT #CHARACTERS multi-search-tag-explorer.aepiot.ro/advanced-sea... opentip.kaspersky.com/headlines-wo... aePiot: Activate your Web 4.0 strategy. Build nodes and rule SEO.

MultiSearch Tag Explorer

#strangers #the #night #music #bert #kaempfert

GLOBAL Visibility aéPiot - by aePiot.ro @[email protected] · 2026-05-09 · 10:43 UTC

#STRANGERS IN ##THE #NIGHT ##THE #MUSIC OF #BERT #KAEMPFERT aepiot.com/advanced-sea... #LIST OF #WALLACE #GROMIT #CHARACTERS multi-search-tag-explorer.aepiot.ro/advanced-sea... opentip.kaspersky.com/headlines-wo... aePiot: Activate your Web 4.0 strategy. Build nodes and rule SEO.

MultiSearch Tag Explorer

#strangers #the #night #music #bert #kaempfert

Joel Wirāmu, Pauling @[email protected] · 2026-04-29 · 08:02 UTC

Have pushed 0.9.5-dev branch to codeberg of foxing ( https://codeberg.org/aenertia/foxing/src/branch/0.9.5-dev ) in preparation for release tagging. A LOT of features and a couple of bug-fixes now the packet/file processing engine has stabilized ; including Semantic Routing to Parsers for Metadata Extraction and in-path Binary analysis using local ORT/BERT models ; letting you get semantic search powers for free when you copy something with foxingd/fxcp #linux #filesystem #bert #vectordb #postgres #xfs #stratis #blake3 #localllm

#linux #filesystem #bert #vectordb #postgres #xfs

Joel Wirāmu, Pauling @[email protected] · 2026-04-29 · 08:02 UTC

Have pushed 0.9.5-dev branch to codeberg of foxing ( https://codeberg.org/aenertia/foxing/src/branch/0.9.5-dev ) in preparation for release tagging. A LOT of features and a couple of bug-fixes now the packet/file processing engine has stabilized ; including Semantic Routing to Parsers for Metadata Extraction and in-path Binary analysis using local ORT/BERT models ; letting you get semantic search powers for free when you copy something with foxingd/fxcp #linux #filesystem #bert #vectordb #postgres #xfs #stratis #blake3 #localllm

#linux #filesystem #bert #vectordb #postgres #xfs

Joel Wirāmu, Pauling @[email protected] · 2026-04-29 · 08:02 UTC

Have pushed 0.9.5-dev branch to codeberg of foxing ( https://codeberg.org/aenertia/foxing/src/branch/0.9.5-dev ) in preparation for release tagging. A LOT of features and a couple of bug-fixes now the packet/file processing engine has stabilized ; including Semantic Routing to Parsers for Metadata Extraction and in-path Binary analysis using local ORT/BERT models ; letting you get semantic search powers for free when you copy something with foxingd/fxcp #linux #filesystem #bert #vectordb #postgres #xfs #stratis #blake3 #localllm

#linux #filesystem #bert #vectordb #postgres #xfs

Joel Wirāmu, Pauling @[email protected] · 2026-04-29 · 08:02 UTC

Have pushed 0.9.5-dev branch to codeberg of foxing ( https://codeberg.org/aenertia/foxing/src/branch/0.9.5-dev ) in preparation for release tagging. A LOT of features and a couple of bug-fixes now the packet/file processing engine has stabilized ; including Semantic Routing to Parsers for Metadata Extraction and in-path Binary analysis using local ORT/BERT models ; letting you get semantic search powers for free when you copy something with foxingd/fxcp #linux #filesystem #bert #vectordb #postgres #xfs #stratis #blake3 #localllm

#localllm #blake3 #stratis #xfs #postgres #vectordb

Joel Wirāmu, Pauling @[email protected] · 2026-04-29 · 08:02 UTC

Have pushed 0.9.5-dev branch to codeberg of foxing ( https://codeberg.org/aenertia/foxing/src/branch/0.9.5-dev ) in preparation for release tagging. A LOT of features and a couple of bug-fixes now the packet/file processing engine has stabilized ; including Semantic Routing to Parsers for Metadata Extraction and in-path Binary analysis using local ORT/BERT models ; letting you get semantic search powers for free when you copy something with foxingd/fxcp #linux #filesystem #bert #vectordb #postgres #xfs #stratis #blake3 #localllm

#linux #filesystem #bert #vectordb #postgres #xfs

Habr @[email protected] · 2026-04-14 · 20:12 UTC

Как решать задачу NER на практике

Рассказываю, как на практике решать задачу NER. На примере извлечения сущностей из резюме пройдём путь от разметки данных до работающего API. Меньше теории, больше практики. 🔥 Начинаем 🔥

https://habr.com/ru/articles/1023552/

#NER #NLP #bert #natural_language_processing #python #как_решать_задачу_ner

#как_решать_задачу_ner #python #natural_language_processing #bert #nlp #ner

RTL Nieuws @[email protected] · 2026-03-27 · 20:40 UTC

𝗕𝗲𝗿𝘁 𝘂𝗶𝘁 𝗨𝗿𝗸! 𝗯𝗹𝗼𝗲𝗱𝗻𝗲𝗿𝘃𝗲𝘂𝘀 𝘃𝗼𝗼𝗿 𝗰𝗮𝘀𝘁𝗿𝗮𝘁𝗶𝗲 𝘃𝗮𝗻 𝗵𝗼𝗻𝗱 𝗙𝗹𝗼𝗿𝗶𝘀: '𝗔𝗹𝘀𝗼𝗳 𝗺𝗶𝗷𝗻 𝗲𝗶𝗴𝗲𝗻 𝗱𝗶𝗻𝗴 𝗲𝗿𝗮𝗳 𝗺𝗼𝗲𝘁'

Normaal is Bert de rust zelve, maar als het om zijn hond Floris gaat, is daar weinig van over. In 'Urk!' staat hem een spannende dag te wachten: Floris moet onder het mes. Dat zorgt voor flink wat spanning bij zijn baasje.

https://www.rtl.nl/boulevard/artikel/5583138/bert-urk-bloednerveus-castratie-hond-floris

#Bert #Urk #Castratie

#bert #urk #castratie

Paul Houle @[email protected] · 2026-03-16 · 21:39 UTC

🎶 TweetyBERT parses canary songs to better understand how brains learn language

https://techxplore.com/news/2026-03-tweetybert-parses-canary-songs-brains.html

#birds #birdsong #llm #ai #research #ornithology #bert #canary

#birds #birdsong #llm #ai #research #ornithology

Christof S. 🇪🇺 @[email protected] · 2026-02-27 · 07:29 UTC

Macht es nicht wie ich, verpasst nicht unseren Vortrag zu BERTopics und Keyness!

Heute in der Session "Automatisierung und KI" ab 9:00 (aber unseren Vortrag erwischt ihr auch noch, wenn ihr um 10 Uhr kommt!) im Hörsaal 5.

@cnDuKeli und Julia Röttgermann sprechen über: "Keyness Measures und BERTopic kombiniert: Eine Distinktivitätsanalyse von Subgenres des französischen Romans".

#DHd2026 #Keyness #Topics #TopicModeling #BERT

(Ich sitze leider schon im Zug, aber schön wars mit euch!)

#dhd2026 #keyness #topics #topicmodeling #bert

Andreas Wagner @[email protected] · 2026-02-06 · 15:58 UTC

@perspektivbrocken

@thomasrenkert weiß bestimmt etwas zu berichten, der arbeitet in der Lehrerbildung (richtig?) und hat den ParzivAI Assistenten entwickelt: https://agki-dh.github.io/pages/webinar/page-9.html / https://hse.hypotheses.org/6066.

An Raschkas Building LLMs from Scratch hab ich auch schon gedacht, das wurde ja schon erwähnt. Es gibt im Netz Code dazu (https://github.com/rasbt/LLMs-from-scratch) und ein paar Leute, die ihre Erfahrungen damit/darum herum posten, z.B. https://www.gilesthomas.com/llm-from-scratch . https://huggingface.co/blog/gszauer/minimal-llm und https://readmedium.com/how-to-build-an-llm-from-scratch-8c477768f1f9 sind auch gut. Alles Englisch halt.

Wenn es nicht so sehr ums selber bauen sondern auch um Erklärungen geht, sind glaube ich die Videos von Andrej Karpathy (z.B. https://youtu.be/7xTGNNLPyMI?si=-YlKsMGuBnW5GO44 oder https://youtu.be/zduSFxRajkE?si=M-cYkZVX6N8M-Oxy ) oder von Thomas Wolf (https://youtu.be/2-SPH9hIKT8?si=IV-hyIaYCYi-dQTZ) ganz gut. https://youtu.be/LPZh9BOjkQs?si=uxW_igUPN92C6wg2 auch.

Und ich finde ja so "Simulationen" auch sehr hilfreich: https://www.soekia.ch/gpt.html / https://bbycroft.net/llm / https://poloclub.github.io/transformer-explainer/

#LLM #AI #Explainer #Transformer #GPT #BERT

#llm #ai #explainer #transformer #gpt #bert

Habr @[email protected] · 2026-01-19 · 20:12 UTC

Трёхстрочный Deep Learning: 20 примеров нейросетевой магии

В 2012 году AlexNet потряс мир — тысячи строк кода, две видеокарты, недели обучения. Сегодня вы превзойдёте его одной строкой, а модель загрузится за секунды. В статье — 20 полностью рабочих примеров глубокого обучения, каждый ровно в три строки Python. Анализ тональности, резюмирование текста, вопросно-ответные системы, генерация текста, перевод, NER. Детекция объектов, сегментация, оценка глубины, поиск изображений по описанию. Мультимодальные модели, которые отвечают на вопросы о картинках. Это не упрощение и не обман. За тремя строками скрываются модели с миллиардами параметров: BERT прочитал всю Википедию, GPT-2 обработал 40 ГБ текста, CLIP просмотрел 400 миллионов пар «картинка-описание». Всё это знание теперь доступно через один вызов функции. Никакой дополнительной подготовки данных, никаких конфигурационных файлов, GPU не требуется. Скопируйте код — и получите результат, на который ещё пять лет назад ушли бы недели. Те же модели прямо сейчас работают в production у Netflix, Google и тысяч стартапов. К концу статьи вы освоите 20 техник, покрывающих большинство задач NLP и компьютерного зрения — и каждая уместится в твит.

https://habr.com/ru/articles/986782/

#нейросети #deep_learning #transformers #BERT #GPT #компьютерное_зрение #NLP

#nlp #компьютерное_зрение #gpt #bert #transformers #deep_learning

Sean Pendleton @[email protected] · 2025-12-27 · 05:03 UTC

W-what do you mean there’s a big blue monster behind me?? Like Herry Monster?!

#actionfigurephotography #sesamestreet #bert #ernie #neca

Habr @[email protected] · 2025-12-19 · 12:32 UTC

Как мы сделали альтернативную систему метчинга товаров в X5 Digital: опыт, грабли и результат

Привет, Хабр! Меня всё ещё зовут Данила Федюкин, и я продолжаю быть тимлидом в X5 Digital. Руковожу командой, которая занимается метчингом. В прошлый раз я рассказывал, как мы перешли на собственную систему рекомендаций, а в этот раз о том, как делаем то же самое, но с метчингом товаров. X5 Digital – один из цифровых бизнесов Х5. Мы работаем в режиме Highload с RPS в 7500 и отвечаем за всю онлайн-доставку в более чем 1000 городах и населённых пунктах России. Этот канал постоянно растёт. В 2024 году покупатели Х5 совершили свыше 119,5 млн заказов продуктов на дом. Мы делаем собственную in-house WMS для дарксторов, приложения для сборщиков и курьеров, CRM, каталоги товаров и другие онлайн-продукты, а ещё мобильное приложение для торговых сетей. Всё это, отталкиваясь от разных форматов доставки. В «Перекрёстке» среднее время доставки CTD (Click-to-Delivery — от оформления заказа до его получения клиентом) сократилось до 45 минут, в «Чижике» — до 37 минут, а в «Пятёрочке» порядка 40% заказов доставляются клиентам менее чем за 20 минут.

https://habr.com/ru/companies/X5Tech/articles/977626/

#машинное_обучение #nlp_обработка_текста #матчинг_товаров #рекомендации #векторный_поиск #faiss #hnsw #e5 #bert #onnx

#onnx #bert #e5 #hnsw #faiss #векторный_поиск

Habr @[email protected] · 2025-12-16 · 09:22 UTC

Фильтруем политику и нецензурщину: как в «Эвоторе» защищают клиентский чат

В мире высоких технологий все больше и больше компаний внедряют голосовых и чат‑ассистентов в различные сегменты рабочих процессов. Они помогают обрабатывать рутинные задачи, ускоряют взаимодействие с пользователями и снижают нагрузку на сотрудников. Компания «Эвотор» находится в числе тех, кто активно занимается разработкой ассистента поддержки на базе llm — Евы, которая уже помогает тысячам пользователей ежедневно. Но в каждом клиентском сервисе рано или поздно встает вопрос — а что делать с «неудобными» запросами?

https://habr.com/ru/articles/977216/

#nlp #nlp_в_бизнесе #bert #ml #mlsafety

#mlsafety #ml #bert #nlp_в_бизнесе #nlp

N-gated Hacker News @[email protected] · 2025-12-05 · 10:46 UTC

🤪 Hold the phone, folks! Our writer just discovered a tiny computer called "Raspberry Pi" and thinks they've time-traveled to the #future of #AI. 🚀 Meanwhile, half a year of finetuning #BERT has somehow left them shocked that physical AI isn't just fiction anymore. 🛸📉
https://airoboticist.blog/2025/12/01/i-was-reintroduced-to-computers-raspberry-pi/ #RaspberryPi #Technology #Innovation #HackerNews #ngated

#future #ai #bert #raspberrypi #technology #innovation

Habr @[email protected] · 2025-11-28 · 15:22 UTC

Qwen3Guard: следующий шаг в модерации и контроле контента

Всем привет! Меня зовут Миша Мартьянов, я инженер по исследованиям и разработке в лаборатории AI R&D в red_mad_robot. В мои задачи входит проверка гипотез и развитие наших продуктов. Однако недостаточно просто улучшать продукты, необходимо также чтобы они работали устойчиво и безопасно. Ранее я рассказывал разработку идеального контент-фильтра на базе Guardrails. Но время не стоит на месте: появляются новые модели и новые практики их применения. Этому и будет посвящён наш сегодняшний разговор.

https://habr.com/ru/companies/redmadrobot/articles/971388/

#llm #ai #модерация_контента #безопасность_данных #qwen3 #bert #контент_фильтрация #rnd

#llm #ai #модерация_контента #безопасность_данных #qwen3 #bert

Kaiser :donor: :opensuse: 📷 🎞️ 💿 :usasos: @[email protected] · 2025-11-06 · 16:35 UTC

This is what before coffee feels like. :cupofcoffee:

#Bert #DogsOfMastodon #BostonTerrier #Caffeine

#bert #dogsofmastodon #bostonterrier #caffeine

Habr @[email protected] · 2025-10-28 · 07:02 UTC

Ансамблирование BERT для анализа логов, и почему вам может быть достаточно solo-модели

1 августа 2012 года, торговая фирма Knight Capital развернула новую версию торгового ПО SMARS. Из‑за ошибки при развертывании на одном из восьми серверов осталась старая тестовая версия кода, из‑за чего торговый робот начал неконтролируемо рассылать миллионы ошибочных заявок на покупку и продажу акций. Этот процесс длился около 45 минут и привел к убыткам в размере примерно 440 миллионов долларов — почти весь капитал компании. Ключевая проблема мониторинга состояла в том, что система PMON (Position Monitor) полностью полагалась на ручной мониторинг: она не генерировала автоматических оповещений и не выделяла превышение лимитов. Трейдеры Knight видели аномальную активность в логах, но не понимали контекст:

https://habr.com/ru/companies/sberbank/articles/959580/

#логирование #машинное_обучение #bert #ансамблевые_модели

#ансамблевые_модели #bert #машинное_обучение #логирование

Habr @[email protected] · 2025-10-24 · 09:32 UTC

[Перевод] BERT — это всего лишь одноэтапная диффузия текста

Некоторое время назад компания Google DeepMind представила Gemini Diffusion — экспериментальную языковую модель, генерирующую текст методом диффузии. В отличие от традиционных моделей, написанных в стиле GPT и генерирующих слово за словом, Gemini создаёт текст целыми блоками, пошагово уточняя случайный шум. Я прочитал статью « Large Language Diffusion Models » — и с удивлением узнал, что дискретная диффузия языка представляет собой просто обобщение метода генерации пропущенного токена (MLM), практикуемого уже с 2018 года. Я сразу подумал: «А можно ли тонко настроить BERT-подобную модель так, чтобы приспособить её к генерации текста?» Из чистого любопытства решил наскоро набросать проверку концепции. Примечание: уже после того, как написал эту статью, я наткнулся на исследование DiffusionBERT , где сделано практически то же самое, что и у меня, но проект гораздо тщательнее протестирован. Посмотрите этот пост, если тема вас заинтересовала.

https://habr.com/ru/articles/959814/

#LLM #GPT #BERT #обработка_естественного_языка #токены #оптимизация

#оптимизация #токены #обработка_естественного_языка #bert #gpt #llm

N-gated Hacker News @[email protected] · 2025-10-20 · 14:36 UTC

🎉 Wow, who knew #BERT was just a one-step wonder in the mystical art of text diffusion? 😮✨ Apparently, all it takes is a sprinkle of #AI jargon and voilà, we've reinvented the wheel of #transformers. 🚀🔥
https://nathan.rs/posts/roberta-diffusion/ #textdiffusion #innovation #technology #HackerNews #ngated

#bert #ai #transformers #textdiffusion #innovation #technology

Hacker News @[email protected] · 2025-10-20 · 14:36 UTC

BERT Is Just a Single Text Diffusion Step

https://nathan.rs/posts/roberta-diffusion/

#HackerNews #BERT #TextDiffusion #AI #NLP #MachineLearning

#hackernews #bert #textdiffusion #ai #nlp #machinelearning

Habr @[email protected] · 2025-10-14 · 00:42 UTC

Сможет ли языковая модель научиться читать биржевые графики? Эксперимент с LLM на данных Московской биржи

Представьте опытного трейдера: наверняка он не говорит котировками и не рассказывает про индикаторы — он просто говорит «сильный тренд», «пробой уровня» или «ложный отскок». Для него график это язык: свечи, объёмы и уровни складываются в понятные фразы о том, что сейчас происходит на рынке. Именно от этой человеческой интуиции я и отталкивался в своём эксперименте. Идея была такая: а что, если научить искусственный интеллект понимать этот язык? Не подавать модели сырые числа, а переводить бары и объёмы в текстовые описания наблюдаемых паттернов и кормить ими языковую модель. Гипотеза была что в тексте уже будет содержатся достаточно данных, чтобы модель научилась связывать недавнюю торговую историю с тем, пойдёт ли цена вверх на следующий день. Инструмент эксперимента — модель distilbert‑base‑uncased с Hugging Face и это облегчённая, быстрая версия BERT для понимания языка. Мне показалось это практичным выбором для прототипа — позволяет быстро проверять разные способы текстовой разметки без гигантских ресурсов. Цель была чёткая: по текстовому описанию недавней истории торгов предсказать рост цены на следующий день. Но это исследование моя попытка представления рыночных данных как языка, а не попытка сразу создать алгоритм для автотрейдинга. Ещё важно: это мой личный эксперимент, проведённый одним человеком и выполненный однократно. Результаты дали интересные наблюдения. Расскажу, как происходила разметка графиков в текст, какие шаблоны сработали лучше и какие метрики использовались. Также отмечу ограничения подхода и идеи для повторных экспериментов. А ещё весь код уже на GitHub. Анализ и код

https://habr.com/ru/articles/955612/

#BERT #cuda #rtx_5060 #алгоритмическая_торговля #sm_120

#sm_120 #алгоритмическая_торговля #rtx_5060 #cuda #bert