#ner — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #ner, aggregated by home.social.
-
https://www.europesays.com/hu/99844/ hvg360: Hamvay Péter: Tovarisi, konyec #budapest #fülszöveg #HU #Hungarian #Hungary #lapajánló #Magyar #MagyarPéter #Magyarország #ner #TiszaPárt #vélemény
-
https://www.europesays.com/hu/97413/ Közel száz nagy értékű, múzeumból kölcsönzött festmény között dolgozott a Fidesz a Karmelitában #festmény #HU #Hungarian #Hungary #karmelita #Kultúra #Magyar #MagyarNemzetiGaléria #MagyarPéter #Magyarország #ner #OrbánViktor #RogánAntal
-
✨ Today at the #LT4HALA workshop at #LREC2026, my brilliant student Wenhui Cui and I present some work on #NER in #Latin #inscriptions 🪦 . Paper 📜 can be found here: http://lrec-conf.org/proceedings/lrec2026/workshops/lt4hala/2026.lt4hala-1.0.pdf
-
https://www.europesays.com/hu/93675/ Novák Katalin Fidesz-fülbevalója, Orbán Viktor kisszéke, Navracsics krumplipucolása – képekkel búcsúzunk a NER-től #Fidesz #fotóválogatás #galéria #HU #Hungarian #Hungary #képválogatás #Magyar #Magyarország #ner #OrbánViktor
-
https://www.europesays.com/hu/70061/ Majka a Heti hetesben próbálta védeni Ördög Nórát azzal, hogy ő is fellépett Mészáros Lőrinc rendezvényén #cba #Entertainment #Fidesz #HetiHetes #HU #Hungarian #Hungary #LengyelTamás #Magyar #Magyarország #Majka #MészárosCsoport #MészárosLőrinc #ner #ördögNóra #rtl #StohlAndrás #Szórakozás #tévé #TiszaPárt #tv2 #VadonJános #Választás2026
-
Как решать задачу NER на практике
Рассказываю, как на практике решать задачу NER. На примере извлечения сущностей из резюме пройдём путь от разметки данных до работающего API. Меньше теории, больше практики. 🔥 Начинаем 🔥
https://habr.com/ru/articles/1023552/
#NER #NLP #bert #natural_language_processing #python #как_решать_задачу_ner
-
📣 Vortrag: Holle Meding (@hmeding) & Aurel Daugs (Digital History Berlin) sprechen bei der DHd AGKI-DH über #LLMs in der historischen Forschung.
🗓 13.04.2026 | 11:30–12:30 Uhr
💻 Zoom: https://uni-graz.zoom.us/j/69588616456?pwd=CnjYI539FaYbpnVC37v9ir8fWA2hvM.1Im Fokus stehen: Potenziale & Grenzen von LLMs – u. a. #Chronosensitivität, #Bias, #Alignment & #Opazität.
Mit Beispielen: #NER zur Analyse von TikTok-Inhalten & #RAG auf Basis historischer Zeitungen. -
https://www.europesays.com/hu/56578/ Demjén Ferenc letiltatta a „Mi vagyunk a NER”-t #dal #DemjénFerenc #Entertainment #HU #humor #Hungarian #Hungary #Magyar #Magyarország #ner #politika #SzerzőiJog #Szórakozás
-
https://www.europesays.com/hu/33253/ Válasz Lázár Jánosnak: A budai polgárok tényleg kiábrándultak a Fideszből #Buda #budapest #Fidesz #HU #Hungarian #Hungary #LázárJános #Magyar #Magyarország #ner #polgárság #populizmus
-
Как маскировать персональные данные на изображениях: наш эксперимент с OCR и NER
Всем привет! Меня зовут Андрей Иванов, я NLP-исследователь в R&D red_mad_robot. Мы разрабатываем систему Guardrails для защиты персональных данных (PII) и фильтрации небезопасного контента. В этой статье расскажу, как мы решали задачу точечного маскирования PII на картинках без обучения специальных визуальных детекторов. Разберём связку оптического распознавания символов (OCR) с NER-моделью, покажем метрики на реальных данных, раскроем ограничения подхода и наши решения для их преодоления.
https://habr.com/ru/companies/redmadrobot/articles/1011450/
#ai #llm #ocr #ner #pii #computer_vision #маскирование_данных #обработка_изображений #nlp #rnd
-
Our paper "NERdME: a Named Entity Recognition Dataset for Indexing Research Artifacts in Code Repositories" by @GenAsefa Zongxiong Chen, @shufan Mary Ann Tan, Zhaotai Liu, @sonjas0815 & @lysander07 was accepted at The ACM Web Conference 2026.
...as it is still not sure whether WWW2026 will take place (in Dubai) we published the paper already in #arxivhttps://arxiv.org/abs/2603.05750
#AI #NER #NLP #researchdatamanagement @NFDI4DS @fiz_karlsruhe #semanticweb
-
Сравнение RuModernBERT и multilingual-e5-base для NER на русском
Однажды при мне два ИИ экcперта закусились на тему какая модель лучше извлекает именованные данные на русском языке: RuModernBERT или multilingual-e5-base. Я послушал их аргументы и решил поставить небольшой эксперимент на реальных данных (благо данных хоть отбавляй). Итак, условия NER задачи:
-
Wrote an article and published a nuget package sitting here in the hospital. https://www.mostlylucid.net/blog/simple-ocr-ner-extraction
(RDP over tailscale rules 🤓)
Companion CLI and nuget packages linked at the top. Makes OCR & Named Entity Extraction SUPER EASY. -
NER не про токены: почему span важнее BIO
NER часто воспринимают как задачу классификации токенов: BIO-теги, последовательности меток, декодирование. Такой взгляд удобен с точки зрения моделей, но плохо отражает то, как NER работает в реальных системах. Сущности - это не токены, а фрагменты текста. Результаты работы NER-систем, как правило, представлены в виде спанов - с явными границами начала и конца (start / end) и типами сущностей. В этой статье мы разберём два уровня разметки в NER: span-level и token-level и покажем, какую роль каждый из них играет в практических пайплайнах.
https://habr.com/ru/companies/raft/articles/991404/
#ner #named_entity_recognition #аннотация_данных #машинное+обучение #machine_learning #nlp #span #token #персональные_данные #pii
-
Problem: we keep using frontier LLMs as glue for jobs that are already solved.
Solution: run OCR + NER locally in C# with ONNX Runtime. Deterministic extraction on ingest. Store the entities. Use an LLM later only if you actually need synthesis.
OCR with Tesseract, then BERT NER via ONNX in .NET. No Python, no cloud, no tokens.
This is my 'for beginners' article. I'm DEEP in OCR but realised I never explained the quickest way to do this *locally*.
https://www.mostlylucid.net/blog/simple-ocr-ner-extraction
#CSharp #DotNet #ONNX #OnnxRuntime #OCR #NER #LocalAI #RAG #DocumentAI
-
Built a cybersecurity NER model. 13 entity types. 1,500+ security entities. It's on HuggingFace.
Spent months extracting and annotating cybersecurity entities from real job postings, threat reports, and compliance docs. Turning it into a tool anyone can use.
What it extracts:
- Security roles (CISO, SOC Analyst, Pen Tester)
- Certifications (CISSP, OSCP, CEH)
- Tools (Splunk, CrowdStrike, Metasploit)
- Threats (APT, ransomware, phishing)
- Attack techniques (SQLi, XSS, RCE)
- CVEs, frameworks (MITRE ATT&CK, NIST), regulations (GDPR, PCI-DSS)
- Technical skills, acronyms, compliance termsBuilt for:
- Threat intel parsing
- Security talent matching
- Skills inventory extraction
- Compliance doc analysisThe tech:
- RoBERTa transformer, domain-adapted on 40K security texts
- spaCy pipeline for easy integration
- 69% F1 score (and improving)Where I need help:
- More annotated security text (CVs, job posts, threat reports)
- Edge cases the model misses
- Ideas for entity types I haven't covered -
Автоматизация обработки ТI-отчетов с помощью NER: как мы сэкономили время аналитиков
Привет, Хабр! Меня зовут Виктор Пронин, я старший аналитик киберугроз в центре компетенций группы компаний «Гарда». Мы формируем для Гарда Threat Intelligence Feeds данные об угрозах на основе обезличенной телеметрии из наших инсталляций, а для получения более полной картины обращаемся, в том числе, и к информации из открытых источников. В статье я расскажу об автоматизированной обработке публикаций по информационной безопасности. Кейс будет полезен аналитикам киберугроз и специалистам, интересующимся применением ML в ИБ.
https://habr.com/ru/companies/garda/articles/970034/
#threat_intelligence #NER #обработка_текстов #искусственный_интеллект #ml
-
ChamelOn: как мы создали production-ready систему анонимизации ПД с защитой от ReDoS и 95% точностью
Команда AI Dev Team разработала ChamelOn за 3 месяца как реальный заказ от клиента — крупного колл-центра с тысячами записей разговоров в день. Система уже работает в production на реальных клиентских проектах.
https://habr.com/ru/articles/969766/
#анонимизация #персональные_данные #gdpr #фз152 #typescript #nodejs #nextjs #re2 #ml #ner
-
Master Named Entity Recognition NLP in 7 steps! Extract key info & automate tasks using Hugging Face. #NLP #NER #HuggingFace #DataScience
-
Как я пытался подружить PHP с NER — драма в 5-ти актах
Это статья - пример небольшого личного опыта, где я пытался решить одну чисто техническую задачу для одного из моих текущих проектов. Задача в конце-концов была решена, насколько правильно - не знаю, но, надеюсь, многим будет интересен и полезен мой опыт. Итак, небольшая драма в 5-ти актах.
https://habr.com/ru/articles/948014/
#php #ner #named_entity_recognition #nlpмодели #nlp_обработка_текста #nlp4code
-
Кофе — мой type, музыка — мой out: строим NERвный-пайплайн на продуктовых запросах
Привет, Хабр! На связи команда Ad-Hoc аналитики X5 Tech. В этой статье расскажем, как мы научили поиск извлекать важные сущности из запросов пользователей. Полный разбор реализации NER (Named Entity Recognition) для продуктового ритейла, шаг за шагом: как мы размечали данные, считали метрики на уровне токенов и сущностей — и почему для коротких и длинных запросов потребовались разные архитектурные решения.
https://habr.com/ru/companies/X5Tech/articles/941634/
#ner #ии #искусственный_интеллект #машинное_обучение #nlp #трансформеры
-
[LangExtract](https://developers.googleblog.com/en/introducing-langextract-a-gemini-powered-information-extraction-library/) has got me curious, but I don't get what makes it different from a [spacy-llm/prodigy](https://prodi.gy/docs/large-language-models) setup. Is it just that I am spared the effort of chunking long input and/or constructing output JSON from entities and offsets by writing the corresponding python code myself?...
Ah, one more difference is that langextract is #OpenSource whereas prodigy is not (?). (On the other hand, prodigy has a better integration with a correction+training workflow.)
-
In meinem Blogbeitag auf ETHeritage beschreibe ich, wie wir auf e-rara #NamedEntityRecognition und #NamedEntityLinking einsetzten.
https://etheritage.ethz.ch/2025/06/27/drachenkopf/
#erara #ner #nel #ocr #ethbibliothek #bibliothek #AlteDrucke #rarebooks #drachenkopf #fisch #fish #Scorpaena
-
Что такое NER, зачем он нужен и когда не поможет
Про NER написано немало, но этот материал носит прикладной характер. Статья будет полезна тем, кто интересуется NLP и ищет разные подходы для решения узкопрофильных задач, требующих извлечения сущностей из текста. Для джунов это возможность пройти весь путь — от разметки данных до обучения собственной кастомной NER-модели, попутно понять типичные сложности и ограничения. Привет, меня зовут Александр Агеев, на протяжении года я занимался NER-моделями для определения сущностей на этикетках продуктов питания. Несмотря на мою любовь к NER, у этой технологии есть свои границы — кейсы, которые она не может решить хорошо, поэтому надо подключать другие инструменты. В статье я дам критерии применимости NER для решения практических задач.
https://habr.com/ru/articles/921698/
#нейросети_python #named_entity_recognition #ner #natural_language_processing #nlp #spacy #примеры_кода #обучение_моделей
-
Also presented at #dae2025 : a research platform developed by Dariah PL for uploading, annotating, enriching and sharing #humanities data. The platform also allows collaborations. Interesting features are embedded #OCR and #NER functionalities. Find out more: https://lab.dariah.pl/en/
-
От хаоса к порядку: как ML помогает искать и защищать конфиденциальную информацию
В современном мире объемы данных растут экспоненциально: компании ежедневно генерируют и обрабатывают огромные массивы информации — от реляционных баз данных и текстовых документов до изображений, аудио и видео. С ростом объемов информации усложняется и ее защита, особенно в отношении чувствительных сведений: персональных данных сотрудников и клиентов, финансовой информации, корпоративных документов и других конфиденциальных материалов. Традиционные методы обнаружения и классификации информации, основанные на формальной экспертизе и регулярных выражениях, демонстрируют ограниченную эффективность: они неплохо работают для стандартных форматов, таких как email-адреса и банковские карты, но могут не покрывать с должной полнотой обнаружение в реальных сценариях. На помощь приходит машинное обучение, позволяющее автоматизировать процесс классификации, учитывать контекст и работать с разными источниками информации. Меня зовут Вадим Безбородов. Мы c Максимом Митрофановым в департаменте Data science & ML в Positive Technologies занимаемся исследованием и внедрением машинного обучения в продукты компании. В этой статье расскажем о наших исследованиях и внедрении ML в модуль поиска и классификации чувствительных данных в PT Data Security. Читать
https://habr.com/ru/companies/pt/articles/908556/
#машинное_обучение #обработка_естественного_языка #персональные_данные #информационная_безопасность #named_entity_recognition #machine_learning #nlp #data_security #защита_данных #ner
-
Stelle 3/5
Für das Projekt „TextPloring. Forschungsdatenexploration in den Geisteswissenschaften mit dem LAUDATIO-Repository“ suchen wir befristet auf 2 Jahre ein*e #WiMi (65%) für die Modellierung mittelalterlicher Städtechroniken, Integration in das #LAUDATIO Repositorium & eigenständiger Beforschung der Daten mit #DigitalHistory Methoden.
In diesem Rahmen besteht die Möglichkeit zur Entwicklung eines Promotionsprojekts.
-
📢 Wir stellen ein! 📢
Am Lehrstuhl für Digital HIstory der @HumboldtUni bzw. verbundenen Drittmittelprojekten sind über den Sommer 5 Stellen zu besetzen!
Mehr Details zu den Stellen und zur Bewerbung gesammelt auf unserem Blog... 👉 https://dhistory.hypotheses.org/10656
...oder im Kurzformat hier im Thread. 👇
@histodons @historikerinnen
#DH #DigitalHistory #NFDI #DHJobs #WiMi #RSE #InfoWiss #WissKomm #OER #NER #LLM #Mediävistik
1/6 -
Today, the 2nd lecture of #ISE2025 took place with an introduction into Natural Language Processing, which will be subject of our lecture for the next 4 weeks.
#AI #nlp #informationextraction #ocr #ner #linguistics #computationallinguistics #morphology #pos #ambiguity #language @fiz_karlsruhe @fizise @tabea @enorouzi @sourisnumerique #AIart #generativeAI #machinetranslation #languagemodels #llm
-
📖 #NLP people, a reminder that the brilliant notebooks developed by #Ghent CDH are a game-changing walkthrough of #NER, #ABSA Sentiment Analysis, and #RelationalExtraction pipelines. ▶️
Please share widely!
https://github.com/GhentCDH/CLSinfra/tree/main -
📖 #NLP people, a reminder that the brilliant notebooks developed by #Ghent CDH are a game-changing walkthrough of #NER, #ABSA Sentiment Analysis, and #RelationalExtraction pipelines. ▶️
Please share widely!
https://github.com/GhentCDH/CLSinfra/tree/main -
📖 #NLP people, a reminder that the brilliant notebooks developed by #Ghent CDH are a game-changing walkthrough of #NER, #ABSA Sentiment Analysis, and #RelationalExtraction pipelines. ▶️
Please share widely!
https://github.com/GhentCDH/CLSinfra/tree/main -
📖 #NLP people, a reminder that the brilliant notebooks developed by #Ghent CDH are a game-changing walkthrough of #NER, #ABSA Sentiment Analysis, and #RelationalExtraction pipelines. ▶️
Please share widely!
https://github.com/GhentCDH/CLSinfra/tree/main -
📖 #NLP people, a reminder that the brilliant notebooks developed by #Ghent CDH are a game-changing walkthrough of #NER, #ABSA Sentiment Analysis, and #RelationalExtraction pipelines. ▶️
Please share widely!
https://github.com/GhentCDH/CLSinfra/tree/main -
📖 three CLS INFRA Deliverables on #NLP are out now! 📖
In this video Tess Dejaghere and Pranaydeep Singh of Ghent University CDH explain and demo work on #NER (#NamedEntityRecognition), #ABSA (Aspect-based #SentimentAnalysis) and #RelationalExtraction.
https://youtu.be/RJE83eb7a6A -
📖 three CLS INFRA Deliverables on #NLP are out now! 📖
In this video Tess Dejaghere and Pranaydeep Singh of Ghent University CDH explain and demo work on #NER (#NamedEntityRecognition), #ABSA (Aspect-based #SentimentAnalysis) and #RelationalExtraction.
https://youtu.be/RJE83eb7a6A -
📖 three CLS INFRA Deliverables on #NLP are out now! 📖
In this video Tess Dejaghere and Pranaydeep Singh of Ghent University CDH explain and demo work on #NER (#NamedEntityRecognition), #ABSA (Aspect-based #SentimentAnalysis) and #RelationalExtraction.
https://youtu.be/RJE83eb7a6A -
📖 three CLS INFRA Deliverables on #NLP are out now! 📖
In this video Tess Dejaghere and Pranaydeep Singh of Ghent University CDH explain and demo work on #NER (#NamedEntityRecognition), #ABSA (Aspect-based #SentimentAnalysis) and #RelationalExtraction.
https://youtu.be/RJE83eb7a6A -
📖 three CLS INFRA Deliverables on #NLP are out now! 📖
In this video Tess Dejaghere and Pranaydeep Singh of Ghent University CDH explain and demo work on #NER (#NamedEntityRecognition), #ABSA (Aspect-based #SentimentAnalysis) and #RelationalExtraction.
https://youtu.be/RJE83eb7a6A