#предобработка_данных — Public Fediverse posts on home.social

Habr @[email protected] · 2026-04-17 · 11:12 UTC

Метрики упали в лужу

Метрики могут «упасть» даже если вы ничего не меняли в модели. Разбираемся, как распознать distribution shift и что с ним делать в продакшене.

https://habr.com/ru/articles/1024380/

#eda #анализ_данных #мониторинг #статистика #предобработка_данных #pandas #data_science #machine_learning #data_analysis #production

#production #data_analysis #machine_learning #data_science #pandas #предобработка_данных

Habr @[email protected] · 2026-04-17 · 11:12 UTC

Метрики упали в лужу

Метрики могут «упасть» даже если вы ничего не меняли в модели. Разбираемся, как распознать distribution shift и что с ним делать в продакшене.

https://habr.com/ru/articles/1024380/

#eda #анализ_данных #мониторинг #статистика #предобработка_данных #pandas #data_science #machine_learning #data_analysis #production

#production #data_analysis #machine_learning #data_science #pandas #предобработка_данных

Habr @[email protected] · 2026-04-17 · 11:12 UTC

Метрики упали в лужу

Метрики могут «упасть» даже если вы ничего не меняли в модели. Разбираемся, как распознать distribution shift и что с ним делать в продакшене.

https://habr.com/ru/articles/1024380/

#eda #анализ_данных #мониторинг #статистика #предобработка_данных #pandas #data_science #machine_learning #data_analysis #production

#production #data_analysis #machine_learning #data_science #pandas #предобработка_данных

Habr @[email protected] · 2026-04-17 · 11:12 UTC

Метрики упали в лужу

Метрики могут «упасть» даже если вы ничего не меняли в модели. Разбираемся, как распознать distribution shift и что с ним делать в продакшене.

https://habr.com/ru/articles/1024380/

#eda #анализ_данных #мониторинг #статистика #предобработка_данных #pandas #data_science #machine_learning #data_analysis #production

#eda #анализ_данных #мониторинг #статистика #предобработка_данных #pandas

Habr @[email protected] · 2024-03-18 · 10:02 UTC

Предварительная обработка данных для машинного обучения

В данной статье рассмотрим пример предобработки данных для дальнейшего исследования, например, использование метода кластеризации. Но для начала проясним, что из себя представляет машинное обучение и из каких этапов оно состоит.

https://habr.com/ru/articles/800973/

#предобработка_данных #датафреймы #пропуски #дубликаты

#дубликаты #пропуски #датафреймы #предобработка_данных

Habr @[email protected] · 2024-03-18 · 10:02 UTC

Предварительная обработка данных для машинного обучения

В данной статье рассмотрим пример предобработки данных для дальнейшего исследования, например, использование метода кластеризации. Но для начала проясним, что из себя представляет машинное обучение и из каких этапов оно состоит.

https://habr.com/ru/articles/800973/

#предобработка_данных #датафреймы #пропуски #дубликаты

#дубликаты #пропуски #датафреймы #предобработка_данных

Habr @[email protected] · 2024-03-18 · 10:02 UTC

Предварительная обработка данных для машинного обучения

В данной статье рассмотрим пример предобработки данных для дальнейшего исследования, например, использование метода кластеризации. Но для начала проясним, что из себя представляет машинное обучение и из каких этапов оно состоит.

https://habr.com/ru/articles/800973/

#предобработка_данных #датафреймы #пропуски #дубликаты

#дубликаты #пропуски #датафреймы #предобработка_данных

Habr @[email protected] · 2024-02-28 · 17:32 UTC

Когнитивные искажения у аналитика данных: найти и починить

df.head() — с этого момента вы начинаете работу с данными и полагаетесь на увиденное? Я тоже. Так мы наступаем в феномен what you see is all there is . У ограниченного набора данных, возможно, отсортированного, мы видим ещё более ограниченный набор данных. Мы сами этого не понимаем, но дальше нашу работу строим только на увиденном. Как починить себя? Принять как данность, что все подвержены когнитивным искажениям. От них нельзя избавиться полностью. Можно «пойти на компромисс: научиться распознавать ситуации, в которых возможны ошибки. И стараться избегать серьёзных ошибок, если ставки высоки» . В этой фразе скрыт рецепт для нас: понимаем, где происходят значимые действия во время работы с данными → пробуем распознать «ситуации, в которых возможны ошибки» → придумываем, как можно избежать этих ошибок. Я работаю с данными почти 20 лет, и из них семь набирала и растила джунов, три — наставник в Практикуме на курсе

https://habr.com/ru/companies/yandex_praktikum/articles/795213/

#когнитивные_искажения #предобработка_данных #анализ_данных

#анализ_данных #предобработка_данных #когнитивные_искажения

Habr @[email protected] · 2024-02-28 · 17:32 UTC

Когнитивные искажения у аналитика данных: найти и починить

df.head() — с этого момента вы начинаете работу с данными и полагаетесь на увиденное? Я тоже. Так мы наступаем в феномен what you see is all there is . У ограниченного набора данных, возможно, отсортированного, мы видим ещё более ограниченный набор данных. Мы сами этого не понимаем, но дальше нашу работу строим только на увиденном. Как починить себя? Принять как данность, что все подвержены когнитивным искажениям. От них нельзя избавиться полностью. Можно «пойти на компромисс: научиться распознавать ситуации, в которых возможны ошибки. И стараться избегать серьёзных ошибок, если ставки высоки» . В этой фразе скрыт рецепт для нас: понимаем, где происходят значимые действия во время работы с данными → пробуем распознать «ситуации, в которых возможны ошибки» → придумываем, как можно избежать этих ошибок. Я работаю с данными почти 20 лет, и из них семь набирала и растила джунов, три — наставник в Практикуме на курсе

https://habr.com/ru/companies/yandex_praktikum/articles/795213/

#когнитивные_искажения #предобработка_данных #анализ_данных

#анализ_данных #предобработка_данных #когнитивные_искажения