home.social

#openmetadata — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #openmetadata, aggregated by home.social.

  1. Объясняю на пальцах — зачем твоему бизнесу каталог данных

    Статья носит исключительно образовательный/ознакомительный характер. Она не служит цели, рекламировать какой-либо инструмент или ПО. Все наименования программного обеспечения, упомянутые в статье приведены из личного опыта. Ну-ка что там

    habr.com/ru/articles/1020142/

    #openmetadata #каталог_данных #датакаталог #datacatalog #data_governance #управление_данными #big_data #datahub #data #datadriven

  2. Кто такой инженер по обеспечению качества данных и почему без него уже не обойтись?

    Современный бизнес переживает очередную трансформацию под влиянием информационных технологий. Он движется от стадии слепого принятия концепций больших данных (Big data) и искусственного интеллекта к более осознанной работе с информацией. На этом фоне появляются новые профессии, такие как инженер по обеспечению качества данных — data quality assurance engineer, или просто инженер DQ, как часто указывают в вакансиях. Почему эта профессия на пике востребованности, где она нужна и кому легче освоить её прямо сейчас? На эти и другие вопросы отвечают эксперты российской ИТ-компании «Криптонит»: руководитель департамента тестирования Александр Гречин и ведущий инженер по тестированию качества данных Вероника Казакова. Как и в любой профессиональной среде, у специалистов по работе с данными есть своя терминология. Мы подготовили краткий глоссарий, чтобы говорить с вами на одном языке: Метаданные, или «данные о данных» — это их происхождение (источник), формат, время создания, правила обработки и контроля качества. Например, к нам загружаются таблицы с данными о компании (ИНН, названием компании, коды ОКВЭД и так далее). Здесь метаданные — это атрибуты таблицы (какие колонки мы загружаем, какой в них тип данных, обязательно ли их заполнение, какие правила мы накладываем на значения. Пайплайны (data pipelines): автоматизированные последовательности получения, преобразования и перемещения данных из источников в хранилища. Пайплайны работают как конвейеры, подготавливающие сырые данные для их дальнейшего анализа.

    habr.com/ru/companies/kryptoni

    #data_quality #qa_engineer #data_driven #OpenMetadata #Soda #качество_данных #quality_assurance #Great_Expectations #ETL #карьера_в_IT

  3. New metadata dashboards are here! 🎉 Explore metadata quality and completeness across key properties and spot opportunities to boost discoverability and impact. Search for an organization or repository at metadata.datacite.org and read the announcement for more details: doi.org/10.5438/p7h4-9s17
    @kelly
    #openscience #openresearch #openmetadata #openinfrastructure #metadata

  4. Хороший, плохой, злой: База данных, data catalog и AI

    Всех приветствую! Меня зовут Павел, работаю в компании Lasmart. Одно из направлений деятельности всегда было внедрение и развитие DWH. В какой-то момент задумались о том, чтобы оптимизировать прежде всего свою работу в некоторых аспектах. И первым инструментом сделали генерацию бизнес-описания на основе AI. Назвали Datadesc (data + description). Об этом опыте и пойдет речь в этой статье.

    habr.com/ru/articles/996288/

    #dwh #sql #data_catalog #openmetadata #datahub #data_engineering #data_analyst #semantic #arenadata_catalog #ai

  5. Sitting without electricity and heating, but still thinking about… open #bibliometric data. Sharing our presentation from Bergen 2025. Even in these conditions, we keep building resilient research infrastructures:

    👉 doi.org/10.6084/m9.figshare.30

    The bibliometrics market is a textbook case of market failure: monopolies dominate, national research stays invisible, and profit beats #data quality. That’s why national infrastructures and #openmetadata really matter.

    #OpenScience #OpenData #SciencePolicy

  6. Microsoft reports that financially motivated attackers are exploiting several OpenMetadata vulnerabilities to gain access to Kubernetes workloads for cryptomining activity. CVE-2024-28255, CVE-2024-28847, CVE-2024-28253, CVE-2024-28848, CVE-2024-28254 could be exploited by attackers to bypass authentication and achieve remote code execution. "Since the beginning of April, we have observed exploitation of this vulnerability in Kubernetes environments." Microsoft describes the attack flow and provides IOC 🔗 microsoft.com/en-us/security/b

    #threatintel #eitw #OpenMetadata #activeexploitation #CVE_2024_28255 #CVE_2024_28847 #CVE_2024_28253 #CVE_2024_28848 #CVE_2024_28254 #IOC