#data_governance — Public Fediverse posts on home.social

Habr @[email protected] · 2026-07-27 · 07:22 UTC

Зрелость управления данными: предлагаю простую методику оценки

Многие компании собирают данные, строят отчёты и внедряют аналитические системы, но не всегда понимают, насколько эффективно всё это работает и зачем это нужно. В статье предлагаем упрощённую методику скрининговой оценки зрелости управления данными по пяти направлениям: цели и экономика, люди и ответственность, процессы, качество данных, технологии и архитектура. В конце — чек-лист и калькулятор, которые помогут определить текущее состояние, найти блокирующие проблемы и выбрать следующие шаги.

https://habr.com/ru/articles/1063316/

#управление_данными #зрелость_управления_данными #Data_Management #Data_Governance #качество_данных #оценка_зрелости #DAMADMBOK #бизнесаналитика #культура_данных #скрининг

#скрининг #культура_данных #бизнесаналитика #damadmbok #оценка_зрелости #качество_данных

RedPacket Security @[email protected] · 2026-07-24 · 02:08 UTC

Microsoft Copilot deployment delays: security concerns over confidential data exposure - https://www.redpacketsecurity.com/microsoft-copilot-deployments-delayed-over-security-concerns/

#threatintel #Microsoft_Copilot #security_risk #data_governance

#threatintel #microsoft_copilot #security_risk #data_governance

RedPacket Security @[email protected] · 2026-07-24 · 02:08 UTC

Microsoft Copilot deployment delays: security concerns over confidential data exposure - https://www.redpacketsecurity.com/microsoft-copilot-deployments-delayed-over-security-concerns/

#threatintel #Microsoft_Copilot #security_risk #data_governance

#threatintel #microsoft_copilot #security_risk #data_governance

Habr @[email protected] · 2026-07-02 · 19:22 UTC

Почему российский бизнес проигрывает битву за информацию и как это исправить. Часть 3

Классическая картина для многих крупных российских компаний: рабочая группа из методологов, ИТ-архитекторов и приглашённых консультантов на несколько месяцев запирается в переговорных, чтобы создать «идеальный» регламент по управлению данными. На выходе появляется документ на 300–400 страниц: словарь из тысяч терминов, матрица ролей с десятками стюардов, пошаговые правила валидации и график заседаний совета по качеству данных на годы вперёд. Документ торжественно принимается, иногда даже переплетается в кожу. А спустя полгода дублирование номенклатуры может вырасти на 10–15 %, мастер-данные контрагентов по-прежнему содержат несколько версий одного юрлица, а отчёты продолжают врать. Data Governance умирает, не успев родиться. Эта ситуация — не единичный инцидент, а системный диагноз. Российский бизнес, подталкиваемый регуляторами и желанием «навести порядок», массово влюбился в концепцию «золотого стандарта» данных — всеобъемлющей непротиворечивой модели, где каждое поле описано, каждый процесс стандартизован, а любые отклонения подсвечиваются дашбордами. Теоретически это привлекательно. Практически — губительно. Причина проста: управление данными не существует в вакууме документации, оно жизнеспособно только внутри конкретных сценариев использования.

https://habr.com/ru/articles/1055014/

#Data_Governance #управление_мастерданными #сценарии_использования #бизнесанализ #миграция_данных #SCD #медленно_меняющиеся_измерения #золотой_стандарт_данных #российское_ПО #SAP_миграция

#sap_миграция #российское_по #золотой_стандарт_данных #медленно_меняющиеся_измерения #scd #миграция_данных

Habr @[email protected] · 2026-07-02 · 08:42 UTC

Каталог данных: что нужно знать, прежде чем начинать внедрение

Объем данных в компаниях постоянно растет, и это вынуждает бизнес и ИТ-специалистов перестраивать ИТ-ландшафт, чтобы упростить поиск, понимание и использование информации. В качестве одного из компонентов подобных модернизированных реализаций нередко рассматривают дата-каталог, который помогает навести порядок в метаданных и сделать данные более доступными. Вместе с тем хоть такой подход и имеет право на жизнь, но практика показывает, что наибольший потенциал каталоги данных раскрывают, когда их внедрению предшествует выстраивание базовых процессов управления: ответственности за данные, контроля качества и управления изменениями. Меня зовут Сергей Петриченко. Я продуктовый менеджер VK Data Platform . В этой статье разберем, почему каталог — это не первый шаг к порядку, а скорее мультипликатор уже существующей зрелости и что необходимо сделать, чтобы его внедрение принесло реальную пользу.

https://habr.com/ru/companies/vktech/articles/1054554/

#data_catalog #data_governance #метаданные #качество_данных #lineage #data_contracts #etl #sla #управление_данными #vk_data_platform

#vk_data_platform #управление_данными #sla #etl #data_contracts #lineage

Habr @[email protected] · 2026-04-23 · 12:42 UTC

Как мы строили MVP data lineage системы в ЮMoney

Привет, меня зовут Юля, я дата-инженер в департаменте аналитических решений ЮMoney. Мы разрабатываем и поддерживаем ETL(ELT)-процессы загрузки данных для BI-продуктов компании: отчётов, дашбордов, витрин, API и других. В этой статье поделюсь, как мы разрабатывали MVP для построения data lineage системы и к каким выводам пришли, — так вы сможете адаптировать подход под свои процессы. Проблема, которая привела нас к разработке MVP, заключается в том, что в начале работы над большинством задач требуется подготовительная аналитика: восстановить путь происхождения данных, чтобы понимать, какие ETL(ELT)-процессы будут затронуты и на что повлияют изменения. Это увеличивает время выполнения задачи. Но, что ещё существеннее, процесс достаточно рутинный: каждый раз необходимо проводить статический анализ кода и изучать документацию (при её наличии). Мы решили автоматизировать эту работу, чтобы иметь под рукой инструмент для построения пути данных по точкам их обработки и применения, — то есть создать data lineage систему.

https://habr.com/ru/companies/yoomoney/articles/1027068/

#data_lineage #etl #elt #dwh #neo4j #kafka #cypher #data_governance #mvp #метаданные

#метаданные #mvp #data_governance #cypher #kafka #neo4j

Habr @[email protected] · 2026-04-16 · 13:02 UTC

От формального качества к реальной пользе: как избежать потери доверия к данным и снижения их бизнес-ценности

Внедрение современных инструментов Data Governance (управления данными) часто воспринимается как финальная точка в построении культуры работы с данными. Компании инвестируют в Data Quality-проверки (качества данных), создают каталоги данных и выстраивают красивые дашборды, которые сигнализируют о полном порядке. Однако на практике бизнес часто обнаруживает, что за фасадом «зеленых галочек» скрывается хаос: отчеты не сходятся, ключевые метрики вызывают вопросы, а доверие к аналитике падает. Этот разрыв между формальным качеством данных и их реальной ценностью для бизнеса приводит к финансовым потерям и неверным управленческим решениям. Меня зовут Сергей Петриченко. Я продуктовый менеджер VK Data Platform . В этой статье я покажу типовой путь компании и расскажу, как сделать работу с данными не самоцелью для ИТ, а инструментом, который полезен для бизнеса.

https://habr.com/ru/companies/vktech/articles/1024060/

#vk_cloud #Data_Governance #управление_данными #vk_tech

#vk_tech #управление_данными #data_governance #vk_cloud

Habr @[email protected] · 2026-04-07 · 05:22 UTC

Объясняю на пальцах — зачем твоему бизнесу каталог данных

Статья носит исключительно образовательный/ознакомительный характер. Она не служит цели, рекламировать какой-либо инструмент или ПО. Все наименования программного обеспечения, упомянутые в статье приведены из личного опыта. Ну-ка что там

https://habr.com/ru/articles/1020142/

#openmetadata #каталог_данных #датакаталог #datacatalog #data_governance #управление_данными #big_data #datahub #data #datadriven

#datadriven #data #datahub #big_data #управление_данными #data_governance

Habr @[email protected] · 2026-03-20 · 07:42 UTC

Reference Data Management по-русски: что мы называем НСИ и почему это не всегда RDM

В российских проектах НСИ часто выходит далеко за рамки справочников и включает задачи MDM и Data Quality. Разбираемся, чем это отличается от классического RDM и к чему это приводит.

https://habr.com/ru/companies/datasapience/articles/1012404/

#RDM #НСИ #Reference_Data_Management #MDM #Master_Data_Management #Data_Quality #Справочные_данные #Управление_данными #Data_governance

#data_governance #управление_данными #справочные_данные #data_quality #master_data_management #mdm

Habr @[email protected] · 2026-03-17 · 15:22 UTC

Как мы прокачиваем HealthScore для 6000+ витрин и готовим DWH к AI

Привет! Меня зовут Дмитрий Мележиков, я отвечаю за BI в домене Маркетинг и участвую в общих DWH/BI-проектах Авито. В статье рассказываю, как мы построили систему HealthScore — метрику здоровья данных. От математической модели и пайплайна сбора метаданных до процесса массовой очистки. А ещё вы узнаете, почему HealthScore и сертификация витрин важны для AI Copilot. Без белого списка доверенных витрин ассистент может масштабировать ошибки так же быстро, как и инсайты.

https://habr.com/ru/companies/avito/articles/1011332/

#dwh #data_engineering #data_quality #data_governance #bi #каталог_данных #управление_метаданными #avito

#avito #управление_метаданными #каталог_данных #bi #data_governance #data_quality

Habr @[email protected] · 2026-03-15 · 07:32 UTC

Почему российский бизнес проигрывает битву за информацию и как это исправить. Введение и Часть 1

Российский бизнес переживает эпоху «Великого перехода». Санкционное давление и уход западных вендоров заставили компании в спешке мигрировать на отечественное ПО. Но гонка за новыми платформами обнажила старую как мир проблему: наши системы полны «мусора» . На многочисленных проектах по миграции с SAP и западных CRM на российские решения наблюдается одна и та же картина: бизнес ждет «магии» от новой системы, а получает перенос хаоса. Аналитики и ИТ-специалисты приходят к выводу: битва за качество данных проигрывается не из-за отсутствия талантливых разработчиков, а потому что бизнес-анализ как дисциплина в России до сих пор не воспринимает данные как стратегический актив. В этом цикле будут разобраны три фатальные ловушки, в которые попадают компании, и главное — предложены пошаговые рецепты спасения, основанные на реальной практике и современных методологиях.

https://habr.com/ru/articles/1010370/

#системный_анализ #бизнесанализ #миграция_данных #управление_данными #качество_данных #очистка_данных #data_governance #erpсистемы #историчность_данных #требования_к_данным

#системный_анализ #бизнесанализ #миграция_данных #управление_данными #качество_данных #очистка_данных

Habr @[email protected] · 2026-02-24 · 15:02 UTC

Data catalog есть, а пользы нет: Частые ошибки внедрения

Data governance, data mesh, modern data stack, data lineage – столько разных data, столько разных популярных подходов и инструментов. Лидером по популярности (на мой скромный взгляд) среди всех них является data catalog. Многие говорят о нем, многие хотят его, многие уже внедрили. Но внедрить это одно дело, а вот получить от него пользу – дело совсем другое. Мы сформировали список самых частых проблем, основанные не только на нашем опыте, но и на опыте наших коллег, проанализировав множество статей и материалов на эту тему.

https://habr.com/ru/articles/1003158/

#data_catalog #data_governance #openmetadata #datahub #ai #metadata #метаданные #каталог_данных #управление_данными #data_quality

#data_quality #управление_данными #каталог_данных #метаданные #metadata #ai

Habr @[email protected] · 2026-02-10 · 10:52 UTC

LLM в инструментах Data Governance и их практическое применение

В статье подробно описывается как и в каких условиях принималось решение о внедрении Искусственного интеллекта в инструмент Data Governance. Какие критерии повлияли на выбор технического стека. Какую пользу принесли LLM в продут управления данными.

https://habr.com/ru/companies/rostelecom/articles/994860/

#llm #data_governance #бизнесэффективность #искусственный_интеллект #разработка

#разработка #искусственный_интеллект #бизнесэффективность #data_governance #llm

Habr @[email protected] · 2025-12-24 · 16:22 UTC

Обзор Lakehouse: архитектура, которая объединяет порядок и хаос

Вопрос: что же такого прорывного добавили в архитектуру, чтобы она стала считаться чем-то новым с точки зрения инженеров, а не маркетологов ? Ответ: фундаментально изменилась парадигма хранения и обработки данных. В отличие от традиционных подходов, где Data Warehouse оперировал исключительно структурированными данными в табличной форме, а Data Lake работал с файлами в их исходном виде, разработчики Lakehouse сумели соединить лучшие качества обеих архитектур. Ключевым отличием стал формат OTF — Open Table Format, через который удалось реализовать единый стандарт доступа к данным и 4 технологически-культурных сдвига. Перечислю их: ...

https://habr.com/ru/companies/cinimex/articles/978522/

#lakehouse #data_lakehouse #delta_lake #iceberg #otf #data_warehouse #data_lake #архитектура_данных #управление_данными #data_governance

#data_governance #управление_данными #архитектура_данных #data_lake #data_warehouse #otf

Habr @[email protected] · 2025-12-16 · 09:02 UTC

Почему каталог данных превращается в кладбище и как это исправить

Кажется, о внедрении каталога данных не написал только ленивый. Каждая крупная компания так или иначе к этому (каталогу) приходит. Пробует разные решения и методологию. У кого-то успешно только на презентации для совета директоров (чаще всего), у кого-то на деле. Здесь же я хочу рассказать не о том, как заполнять каталог или какой выбрать. А о том, что нужно сделать, прежде чем переходить к покупке/запуску этого каталога. Для тех, кто уже имеет такого зверя в своем зоопарке, но с ним что-то не так, думаю, тоже будет полезно. Если вы один из счастливчиков, у кого каталог действительно взлетел, можете дальше не читать. Однако что-то мне подсказывает, что таких будет не много. Осторожно, статья-детектор.

https://habr.com/ru/articles/977014/

#каталог_данных #управление_разработкой #управление_продуктом #управление_данными #data_governance #data_catalog

#data_catalog #data_governance #управление_данными #управление_продуктом #управление_разработкой #каталог_данных

Habr @[email protected] · 2025-11-12 · 22:52 UTC

Культура «AI-First»: как перестроить мышление команды, чтобы не отстать от рынка

Пока одни компании разочаровываются в искусственном интеллекте, другие строят на его основе бизнес-империи. В чем их секрет? Не в деньгах и не в доступе к технологиям, а в особой культуре. Разберемся, как перестать просто использовать ИИ в работе и перейти к мышлению в стиле AI-First, и почему это единственный способ не превратиться в динозавра.

https://habr.com/ru/articles/965874/

#aifirst #иистартап #ии_в_бизнесе #цифровая_трансформация #цифровая_трансформация_бизнеса #автоматизация_процессов #ИИпесочницы #обучение_ии #data_governance #ИИ_в_бизнеспроцессах

#ии_в_бизнеспроцессах #data_governance #обучение_ии #иипесочницы #автоматизация_процессов #цифровая_трансформация_бизнеса

Habr @[email protected] · 2025-08-26 · 10:52 UTC

Как найти свой путь в дата-инженерии и управлять петабайтами данных

На первый взгляд работа с данными может показаться скучной, состоящей из перетаскивания данных из одного хранилища в другое. В этом действительно есть часть правды :) но не вся правда… Если присмотреться, мы увидим, что дата-инженеры помогают компаниям сокращать время на поиск инсайтов, обучение моделей и понимание нужд пользователей. Данные — это новая нефть, поэтому важно понимать, как правильно их организовывать и какие сложности в работе могут повлиять на успешность бизнеса. Привет, Хабр! Меня зовут Алёна Катренко, и я уже больше 10 лет работаю с данными. Сейчас занимаю позицию руководителя платформы данных в Циане, но начинала как BigData-инженер в Неофлексе. Сегодня расскажу, как мы приручали петабайты данных, искали призраков забытых таблиц и нашли инструмент, который сделал работу с метаданными понятной, безопасной и полезной для бизнеса. А ещё о том, как сейчас развиваться дату-инженеру, чтобы успевать за тенденциями на рынке.

https://habr.com/ru/companies/oleg-bunin/articles/940392/

#data_engineering #data_catalog #cloud_native #data_governance #data_ownership #amundsen #arenadata_catalog #data_lineage #scala #комьюнити

#data_engineering #data_catalog #cloud_native #data_governance #data_ownership #amundsen

Habr @[email protected] · 2025-08-12 · 14:52 UTC

Как правильно тащить данные в хранилище и не чувствовать боль

Так обычно начинается повесть о созданном в рекордные сроки дашборде. А потом боль и унижение, и никто не хочет брать на себя ответственность, когда упал прод, потому что BI‑аналитик выгружал 90 миллионов строк join’ом без фильтра. А вашему бизнесу всё равно, кто виноват. Данные не пришли, отчёта нет, шеф злой. Пуск

https://habr.com/ru/articles/936360/

#Интеграция_данных #Хранилище_данных #Data_governance #etlпроцессы

#etlпроцессы #data_governance #хранилище_данных #интеграция_данных

Habr @[email protected] · 2025-04-16 · 07:12 UTC

7 опорных функций, которые должны быть в вашей системе Data Governance

Привет, Хабр! Я Татьяна, в РСХБ-Интех работаю с данными, в прошлый раз я рассказывала про свои любимые фреймворки для повышения эффективности бизнеса. В этот раз статья посвящена Data Governance. Data Governance управляет не самими данными и их потоками, а метаданными, которые сопровождают их во всех точках ввода, обработки, хранения и перемещения, вплоть до уничтожения. Наиболее прогрессивные компании сегодня имеют целые экосистемы по управлению жизненным циклом данных. Такие экосистемы могут включать в себя несколько приложений или программных продуктов, которые дирижируются Data Governance процессом, выстроенным внутри организации.

https://habr.com/ru/companies/rshb/articles/900750/

#data_governance #Управление_качеством_данных #Происхождение_данных #Ведение_реестров_обмена_данными #Владельцы_данных #Бизнесглоссарий #Управление_метаданными #Архитектура_и_моделирование_данных

#data_governance #управление_качеством_данных #происхождение_данных #ведение_реестров_обмена_данными #владельцы_данных #бизнесглоссарий

Habr @[email protected] · 2025-04-09 · 10:32 UTC

Data Governance и Бизнес: как найти общий язык

«Data Governance — это дополнительная надстройка, которая увеличивает сложность и длительность процессов. Это тормозит бизнес!» «Нам нужны качественные данные, а вы все про свои процессы!» «Data Governance – это IT-шная история, пусть они и занимаются. Причем здесь бизнес?!» Эти фразы часто звучат, когда речь заходит о внедрении Data Governance. Бизнес и Data \ IT могут по-разному смотреть на роль DG: для команды управления данными это фундамент прозрачности и управления, а для бизнеса — дополнительные шаги, которые могут замедлять процессы. Но ведь цель Data Governance (DG) — не процесс ради процесса, а создание ценности для бизнеса за счёт качественных, управляемых данных. Почему же возникают разногласия? Из моего опыта можно выделить несколько ключевых факторов, которые влияют на восприятие DG в бизнесе: 1.Неочевидная связь между DG и бизнес-результатами. Если Data Governance не подкреплён показателями, влияющими на прибыль (P&L, снижение затрат, ускорение процессов), для бизнеса его сложно воспринимать как приоритетную задачу. 2.Бизнес хочет скорость, а не контроль. Как правило новые процессы и роли означают изменение привычных моделей работы, а это что требует времени и затраты энергии на адаптацию. Поэтому новые процессы начинают казаться бизнесу фактором, замедляющим их работу. 3.Долгий цикл внедрения. Когда DG запускается с прицелом на долгосрочную выгоду, интерес к DG снижается, так как бизнесу нужны быстрые результаты, бизнесу нужно решать задачи уже сегодня. Как же выстроить эффективный диалог между DG и бизнесом?

https://habr.com/ru/articles/899080/

#data_governance #data_management #data #управление_данными #data_quality #качество_данных #data_catalog #dwh

#data_governance #data_management #data #управление_данными #data_quality #качество_данных

Habr @[email protected] · 2025-04-01 · 14:22 UTC

Великий и могучий: как мы учим нашу систему находить нецензурную лексику в ФИО

Привет, Хабр! Меня зовут Макс Траулько, я занимаюсь анализом данных и проработкой новый фичей в команде RnD в HFLabs. Прямо сейчас я работаю над нетривиальной задачей — учу наши алгоритмы распознавать в именах и фамилиях русский мат и прочие ругательства. Как появилась эта задача? В одной крупной компании клиенты могут оставить обращения во фронт-системе. И иногда пишут в полях ФИО, прямо скажем, черт знает что. А у бизнеса риски: если при ответе на обращение автоматически использовать данные из поля «Имя», можно стать героем насмешливых или гневных постов. Чуть раньше с такой же проблемой к нам пришел другой клиент, из ретейла. У того клиенты вообще большие выдумщики — придумывают составные и сложные имена и фамилии с обсценной лексикой. Даже жаль, что показать эти примеры не можем. В статье расскажу, как мы решаем эту задачу.

https://habr.com/ru/companies/hflabs/articles/896436/

#качество_данных #стандартизация #ругательства #персональные_данные #mdm #data_analysis #data_governance #алгоритмы

#качество_данных #стандартизация #ругательства #персональные_данные #mdm #data_analysis

Habr @[email protected] · 2025-03-21 · 15:42 UTC

Управление качеством данных

Итак, у нас есть данные, и есть требования к ним. От кого? От тех, кто будет ими пользоваться. Если те, кто ставит задачу говорят что "данные плохие" и не могут сформулировать критерии к качеству данных, им можно их подсказать, подсмотрев в предыдущей статье . Таким образом, управление качеством данных - это, в первую очередь, методология, которая обеспечивает некий уровень качества в отношении выбранных данных. Управление качеством данных - это постоянный процесс. Да, для начала неплохо разобраться с уже имеющимися данными, но наша задача сделать так, чтобы все новые данные, попадающие в систему, проверялись, валидировались, насыщались и, в итоге, соответствовали предъявляемым к ним требованиям. Управление качеством, кстати, является важной частью управления Нормативно-Справочной информацией, MDM (Master Data Management). Как же сделать так, чтобы данные попадали в системы уже "чистыми"? Думаю, что самый оптимальный способ - это правильно настроить поля ввода, не допуская ввод заведомо некорректный значений, а также предлагать автозаполнение по возможности: например, выбор адреса доставки предлагать из КЛАДР, а данные о компании автоматически заполнять используя специальные сервисы. Таким образом, и людям надо будет вводить меньше информации, и вероятность ошибки будет гораздо меньше.

https://habr.com/ru/articles/893158/

#data_engineering #data_quality #data_governance #качество_данных

#качество_данных #data_governance #data_quality #data_engineering

Habr @[email protected] · 2025-03-21 · 13:22 UTC

Качество данных простым языком

При подготовке статьи что главное? Источники! А что может быть источником надежнее, чем стандарты ISO? Давайте посмотрим, есть ли стандарты "качества данных"? Есть! ISO/TS 8000 и даже соответствующий ГОСТ 56214. Что ж, читаем определения: 3.1.3 качество (quality): Степень соответствия совокупности присущих характеристик объекта требованиям (3.1.2). Примечания: 1 Термин "качество" может применяться с прилагательными, такими как "плохое", "хорошее" или "превосходное". Так. Хватит ГОСТов на сегодня. Итак, есть данные, у них есть качество - характеристика, показывающая степень пригодности данных к использованию, и которое может быть "плохим", "хорошим" или "превосходным". На самом деле, есть 7 основных качественных характеристики: точность, полнота, непротиворечивость, достоверность, своевременность, уникальность и доступность.

https://habr.com/ru/articles/893104/

#data_governance #data_engineering #data_quality #качество_данных

#качество_данных #data_quality #data_engineering #data_governance

Habr @[email protected] · 2025-03-20 · 04:22 UTC

Как пройти сертификацию CDMP от DAMA International и сделать это с первого раза

Меня зовут Мария Русина и я работаю в направлении Data Governance в "ДАР". Так как в нашем направлении большое внимание уделяется именно методологии управления данными, мне важно постоянно повышать уровень собственных навыков. В связи с этим, около года назад я решила пройти сертификацию CDMP от DAMA International, но на тот момент в русскоязычном интернете не нашла ни одной статьи, которая описывала бы опыт сдачи. Поэтому решила поделиться своим. Надеюсь, что будет полезно. Сразу скажу, что никаких ограничений для сдачи экзамена из России нет, главное – иметь возможность оплатить его сдачу.

https://habr.com/ru/articles/892540/

#data_governance #управление_данными #сертификация #экзамены #dama_international

#dama_international #экзамены #сертификация #управление_данными #data_governance

Habr @[email protected] · 2025-03-19 · 12:22 UTC

Бизнес-глоссарий и Каталог Данных

Что такое «Каталог Данных»? Это список «чистых» и готовых к использованию данных, которые можно использовать для интеграции или формирования витрин данных – Datamart для построения отчетности или дашбордов, или для предоставления аналитикам и бизнес-пользователям («Гражданским Аналитикам») для самостоятельно (Self-Service) аналитики, когда они смогут самостоятельно построить необходимую им отчетность, не прибегая к помощи специалистов по управлению данными или, тем более, ИТ-отдела, для которого управление данными и разработка отчетности явно не является приоритетной задачей. Каталогизация данных, в свою очередь предполагает наличие программного продукта для хранения списка каталогизированных данных и их описания (метаданных) — «Каталога Данных». Но дело в то, что еще до формирования каталога данных и проектов по очистке данных должны быть другие проекты: в первую очередь я говорю про бизнес-глоссарий, в котором бизнес расписывается кровью, что означает тот или иной показатель.

https://habr.com/ru/articles/892318/

#data_governance #data_lineage #каталог_данных #описание_бизнеспроцессов

#описание_бизнеспроцессов #каталог_данных #data_lineage #data_governance

Habr @[email protected] · 2025-03-19 · 11:42 UTC

Что подразумевают под Data Governance?

Если говорить про Data Governance, то это, в первую очередь, не продукты, а огромная методология управления жизненным циклом данных, и только потом – технологии. Близко к идеалу считается методология DAMA-DMBOK, и у любого специалиста по данным это должна быть настольная книга. К сожалению, в подавляющем большинстве случаев, когда люди начинают задумываться про управление данных, она попросту неприменима, так как она показывает «правильное» управление данными больших предприятий, до неё еще надо «дорасти», при этом точечно применяя сначала простые приемы, с возможностью расширения методик управления данными как «вширь», на другие отделы, так в «вглубь» на все процессы, связанные с управлением данными (Data Management): получением («добычей»), обработкой, хранением, извлечением и использованием информации. Без подобного управления жизненным циклом данных получим картину как в последнем исследовании Makves , что 40% данных никогда не используется: к ним не зафиксировано ни одного обращения за 5 лет. Найти «Ценность в данных» становится искусством, так как на предприятии растут «Кладбища данных» вместо «Хранилищ данных». Сейчас зачастую под Data Governance имеют в виду две части, это Data Quality – управление качеством данных, и Data Linage – «понять, откуда пришли данные, как они изменялись и можно ли им доверять». Если данные методологии использовать «в лоб», то это очень сильно замедлит разработку и перегрузит команду по управлению данными.

https://habr.com/ru/articles/892302/

#data_governance #data_lineage #каталог_данных

#каталог_данных #data_lineage #data_governance

Habr @[email protected] · 2025-03-14 · 11:32 UTC

Мои любимые фреймворки для управления данными: чем они так хороши?

Привет, Хабр! Меня зовут Татьяна, в РСХБ-Интех я работаю с данными — помогаю ими управлять. У меня в бэкграунде больше 10 лет работы в сфере ИТ над различными проектами и продуктами, в работе я применяла разные подходы и методики и, конечно, среди них есть мои любимые. В этом материале я рассказываю о трёх фреймворках, к которым отношусь в высшей степени уважительно и местами трепетно, так как считаю их крайне полезными. В своём роде это лучшее, что придумали для бизнеса, по моему скромному мнению. Почему я выбрала их? Каждый фреймворк помещается на листе А4, поэтому удобен в использовании, и к тому же обладает универсальной применимостью — ко всем предметным областям и сферам бизнеса.

https://habr.com/ru/companies/rshb/articles/890850/

#управление_данными #data_governance

#data_governance #управление_данными

Habr @[email protected] · 2024-11-08 · 06:02 UTC

Что такое Data Driven подход

В современном мире бизнес сталкивается с необходимостью постоянно принимать решения. От их качества зависит не только успех отдельных проектов, но и будущее всей компании. В этой статье мы разберём основные подходы к принятию решений в бизнесе и узнаем, почему компании всё чаще строят свою работу на данных. А ещё расскажу о роли, без которой data-driven подход попросту невозможен – о роли дата-инженера.

https://habr.com/ru/articles/856920/

#data_driven #data_engineering #data_engineer #дата_инженер #дата_инжиниринг #принятие_решение_в_компаниях #data_governance #аналитика #аналитика_данных #рост_компании

#data_driven #data_engineering #data_engineer #дата_инженер #дата_инжиниринг #принятие_решение_в_компаниях

Habr @[email protected] · 2024-03-06 · 14:42 UTC

Business intelligence и качество исходных данных

Сегодня бизнес хочет принимать решения, основываясь на данных, а не на ощущениях, тем более что сейчас для этого есть все возможности. Предприятия накопили терабайты и эксабайты данных, их количество растет в геометрической прогрессии каждый день. Как повлиял ковид на ценообразование загородной недвижимости? Какой регион выбрать для новой мебельной фабрики? Вложиться в жилой комплекс эконом или бизнес-класса? Какие факторы влияют на продление ДМС? Как должно работать индивидуальное автострахование? В наши дни ты должен быть data-driven или проиграешь. Сырые данные предприятия проходят большой путь, чтобы превратиться в управленческие решения. Этот путь включает такие шаги как:

https://habr.com/ru/articles/798515/

#business_intelligence #качество_данных #качество_данных_(data_quality) #master_data_management #data_hub #data_quality #data_governance

#data_governance #data_quality #data_hub #master_data_management #качество_данных_ #качество_данных

Habr @[email protected] · 2023-11-24 · 08:52 UTC

Приглашаем на двухдневную онлайн-конференцию для IT-специалистов в финтехе

Ежегодная бесплатная онлайн-конференция ЮMoney Day пройдёт в пятый раз и продлится два дня — 1 и 2 декабря. Вас ждут 18 докладов по 13-ти разным направлениям , среди которых — бэкенд, фронтенд, архитектура, тестирование, DevOps, SQL и другие. Посмотреть программу

https://habr.com/ru/companies/yoomoney/articles/775730/

#devops #openapi #sql #архитектура #менеджмент_проектов #системный_анализ #ssdlc #data_governance #sso

#sso #data_governance #ssdlc #системный_анализ #менеджмент_проектов #архитектура

Josquin Debaz @[email protected] · 2022-11-28 · 09:05 UTC

AI ethics and data governance in the geospatial domain of Digital Earth
Marina Micheli, et al, 2022
https://journals.sagepub.com/doi/full/10.1177/20539517221138767

#Artificial_intelligence_ethics #data_governance #digital_earth

#artificial_intelligence_ethics #data_governance #digital_earth