home.social

Search

1000 results for “dataplane”

  1. Most ML issues are not model problems. They are data problems.

    I retrained the same churn model twice.
    Same code. Same path to the data.
    Different result.

    Why? Because of mutable data references.

    :blobcoffee: I wrote a small Data Lake vs Data Lakehouse demo showing why versioned data makes ML debugging reproducible: tinyurl.com/lake-vs-lakehouse-

    :blobcoffee: Friend-Link: medium.com/towards-artificial-

    #ai #machinelearning #data #lakehouse #warehouse #python #datalake #technology #regression

  2. Want to implement CI/CD for Microsoft Fabric? On 2026-02-19, Kev Chant walks us through Azure DevOps integration with Fabric. We will be covering Git workflows, branching strategies, and deployment approaches for Data Warehouses and SQL databases. meetup.com/fabricpowerbiwales/
    #MicrosoftFabric #AzureDevOps #DataPlatform

  3. Want to implement CI/CD for Microsoft Fabric? On 2026-02-19, Kev Chant walks us through Azure DevOps integration with Fabric. We will be covering Git workflows, branching strategies, and deployment approaches for Data Warehouses and SQL databases. meetup.com/fabricpowerbiwales/
    #MicrosoftFabric #AzureDevOps #DataPlatform

  4. Want to implement CI/CD for Microsoft Fabric? On 2026-02-19, Kev Chant walks us through Azure DevOps integration with Fabric. We will be covering Git workflows, branching strategies, and deployment approaches for Data Warehouses and SQL databases. meetup.com/fabricpowerbiwales/
    #MicrosoftFabric #AzureDevOps #DataPlatform

  5. Want to implement CI/CD for Microsoft Fabric? On 2026-02-19, Kev Chant walks us through Azure DevOps integration with Fabric. We will be covering Git workflows, branching strategies, and deployment approaches for Data Warehouses and SQL databases. meetup.com/fabricpowerbiwales/

  6. Los Angeles based creative coder folks looking for a job?

    Dataland by Refik Anadol Studio is looking for a senior and junior creative coder:

    For details and application, see: dataland.art/careers/creative-

    If you know relevant people in the area, please share!

    #vvvv #visualprogramming #creativecoding #job #unity #unreal #touchdesigner #LA

  7. "ICE gebruikt superapp Elite van Palantir voor klopjachten op migranten"

    -> "Agenten van de federale immigratiedienst ICE maken gebruik van een dataplatform dat alle mogelijke informatie van personen op een kaart projecteert. Het omstreden techbedrijf Palantir is de maker."

    -> "Het systeem kan een kaart genereren met potentiële te deporteren personen en toont van hen een dossier"

    (Via @volkskrant ) #VS #Schurkenstaat #palantir #fascisme #ICE #gestapo
    volkskrant.nl/tech/ice-gebruik

  8. Never ceases to amaze me, the mad world of AI training - companies like Mercor, Surge & Handshake are pulling in billions by hiring humans to label data so big labs can teach models real skills. A new labor boom - and a big IF bet on AI actually delivering. #AI #MachineLearning #DataLabeling

    Who’s making the most money in...

  9. "Invisible labellers’ toil has allowed self-driving cars to recognise pedestrians and chatbots to speak in natural-sounding sentences.

    For a generative artificial intelligence system to learn how to write an autopsy report, human workers must sort and annotate thousands of crime scene images.

    The precarious work of training AI, which generally pays just a few dollars, has sparked a movement for better wages and conditions stretching from Kenya to Colombia.

    “You have to spend your whole day looking at dead bodies and crime scenes… Mental health support was not provided,” Kenyan national Ephantus Kanyugi told AFP.

    Labellers “need to spend time with these images, zoom into the wounds of dead people” to outline them so they can be fed into the AI, the 30-year-old added.

    Kanyugi, who has worked on image labelling since 2018, is the vice-president of the Data Labelers Association (DLA), an 800-strong labour group based in Nairobi.

    The DLA plans to unveil a code of conduct this month aimed at major labelling platforms, calling for improved conditions for workers."

    dawn.com/news/1949310

    #AI #GenerativeAI #AITraining #DataLabeling #Precarity #Kenya

  10. New research shows AI agent evaluation is overtaking data labeling as the bottleneck before real‑world deployment. From reasoning and tool use to code generation, the shift promises faster, safer autonomous agents. Curious how this changes the startup landscape? Dive in to see the details. #AIAgent #Evaluation #DataLabeling #Deployment

    🔗 aidailypost.com/news/ai-agent-

  11. New research shows AI agent evaluation is overtaking data labeling as the bottleneck before real‑world deployment. From reasoning and tool use to code generation, the shift promises faster, safer autonomous agents. Curious how this changes the startup landscape? Dive in to see the details. #AIAgent #Evaluation #DataLabeling #Deployment

    🔗 aidailypost.com/news/ai-agent-

  12. Бенчмарк бенчмарка Lakehouse-движков, в котором побеждает объективная реальность

    Недавно на хабре вышла статья с громким заголовком “Бенчмарк lakehouse-движков, часть 1: StarRocks и Doris падают под нагрузкой, Presto аутсайдер, CedrusData быстрее всех”. В своей статье авторы из Кверифай Лабс выбрали методику TPC-DS, но вместо 99 запросов остановилась на одном, который к тому же запускается на одной машине. Обосновывается это тем, что на одном конкретном запросе нужно разобрать работу оптимизаторов. По результатам исследования делается вывод, что решение, разработанное авторами, является лучшим, в том числе для запуска одного конкретного запроса на одном узле. Давайте попробуем разобраться, действительно ли это так.

    habr.com/ru/companies/datasapi

    #starrocks #trino #impala #mpp #bigdata #dwh #lakehouse #datalake #s3 #hadoop

  13. Cloudflare has just launched the open beta of its Cloudflare Data Platform - a managed service for ingesting, storing & querying analytical data tables using open standards like Apache Iceberg.

    🔍 Dive into the key insights on #InfoQbit.ly/49y1tIa

    #CloudComputing #DataLake #DataAnalytics #ApacheIceberg #Cloudflare

  14. Cloudflare has just launched the open beta of its Cloudflare Data Platform - a managed service for ingesting, storing & querying analytical data tables using open standards like Apache Iceberg.

    🔍 Dive into the key insights on #InfoQbit.ly/49y1tIa

    #CloudComputing #DataLake #DataAnalytics #ApacheIceberg #Cloudflare

  15. Wir hatten #Datawarehouse.
    Wir hatten #DataCubes.
    Wir hatten #datalake
    Wir hatten #DataSwamp.

    Und wir hatten immer das Versprechen, "Entscheider" könnten nun endlich datengetriebene Entscheidungen treffen, selber Auswertungen machen, selber Muster erkennen. Funktioniert hat das noch nie, immer haben Entwickler versucht, mit den passenden Werkzeugen passende Reports zu bauen.

    Jetzt füttert man den Datenbestand in ein LLM. Und hofft, dass das LLM nun die Muster findet. Ob diesmal klappt?

  16. Spark Connect. А нужны ли перемены?

    Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. Apache Spark давно и прочно занял место одного из ключевых инструментов в арсенале инженеров и дата-сайентистов, работающих с большими данными. Его способность быстро обрабатывать огромные объёмы информации, гибкость за счёт поддержки множества языков (Python, Scala, Java, SQL) и возможность решать самые разнообразные задачи — от сложных ETL до машинного обучения и стриминга — делают его незаменимым инструментом в мире анализа данных.

    habr.com/ru/companies/arenadat

    #spark_connect #apache #datalake #lakehouse #платформа_данных #bigdata #dataframe #интеграция_сервисов #apache_arrow #spark

  17. Spark Connect. А нужны ли перемены?

    Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. Apache Spark давно и прочно занял место одного из ключевых инструментов в арсенале инженеров и дата-сайентистов, работающих с большими данными. Его способность быстро обрабатывать огромные объёмы информации, гибкость за счёт поддержки множества языков (Python, Scala, Java, SQL) и возможность решать самые разнообразные задачи — от сложных ETL до машинного обучения и стриминга — делают его незаменимым инструментом в мире анализа данных.

    habr.com/ru/companies/arenadat

    #spark_connect #apache #datalake #lakehouse #платформа_данных #bigdata #dataframe #интеграция_сервисов #apache_arrow #spark

  18. Spark Connect. А нужны ли перемены?

    Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. Apache Spark давно и прочно занял место одного из ключевых инструментов в арсенале инженеров и дата-сайентистов, работающих с большими данными. Его способность быстро обрабатывать огромные объёмы информации, гибкость за счёт поддержки множества языков (Python, Scala, Java, SQL) и возможность решать самые разнообразные задачи — от сложных ETL до машинного обучения и стриминга — делают его незаменимым инструментом в мире анализа данных.

    habr.com/ru/companies/arenadat

    #spark_connect #apache #datalake #lakehouse #платформа_данных #bigdata #dataframe #интеграция_сервисов #apache_arrow #spark

  19. 📺 #Netflix has introduced a new engineering specialization: Media ML Data Engineering - powered by a Media Data Lake designed to handle video, audio, text, and image assets at scale.

    The impact so far:
    ✅ Richer ML models trained on standardized media
    ✅ Faster evaluation cycles
    ✅ Deeper insights into creative workflows

    🔗 Learn more: bit.ly/4oWM3T3

    #InfoQ #DataLake #AI