home.social

#data_scientist — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #data_scientist, aggregated by home.social.

  1. Победить дракона: что общего между Data Science и игрой Dungeons & Dragons

    Что общего между броском d20 и проверкой гипотезы? Между походом в таверну за информацией и сбором данных от заказчика? Оказывается, довольно много. Хабр, привет! Меня зовут Вячеслав Демин, я больше пяти лет работаю в сфере Data Science. Сейчас я руководитель направления аналитики данных в Сбере и эксперт на курсе

    habr.com/ru/companies/yandex_p

    #днд #dungeons_and_dragons #подземелья_и_драконы #data_science #data_scientist #работа_с_данными #дата_сайенс #анализ_данных

  2. Победить дракона: что общего между Data Science и игрой Dungeons & Dragons

    Что общего между броском d20 и проверкой гипотезы? Между походом в таверну за информацией и сбором данных от заказчика? Оказывается, довольно много. Хабр, привет! Меня зовут Вячеслав Демин, я больше пяти лет работаю в сфере Data Science. Сейчас я руководитель направления аналитики данных в Сбере и эксперт на курсе

    habr.com/ru/companies/yandex_p

    #днд #dungeons_and_dragons #подземелья_и_драконы #data_science #data_scientist #работа_с_данными #дата_сайенс #анализ_данных

  3. Победить дракона: что общего между Data Science и игрой Dungeons & Dragons

    Что общего между броском d20 и проверкой гипотезы? Между походом в таверну за информацией и сбором данных от заказчика? Оказывается, довольно много. Хабр, привет! Меня зовут Вячеслав Демин, я больше пяти лет работаю в сфере Data Science. Сейчас я руководитель направления аналитики данных в Сбере и эксперт на курсе

    habr.com/ru/companies/yandex_p

    #днд #dungeons_and_dragons #подземелья_и_драконы #data_science #data_scientist #работа_с_данными #дата_сайенс #анализ_данных

  4. Победить дракона: что общего между Data Science и игрой Dungeons & Dragons

    Что общего между броском d20 и проверкой гипотезы? Между походом в таверну за информацией и сбором данных от заказчика? Оказывается, довольно много. Хабр, привет! Меня зовут Вячеслав Демин, я больше пяти лет работаю в сфере Data Science. Сейчас я руководитель направления аналитики данных в Сбере и эксперт на курсе

    habr.com/ru/companies/yandex_p

    #днд #dungeons_and_dragons #подземелья_и_драконы #data_science #data_scientist #работа_с_данными #дата_сайенс #анализ_данных

  5. Сравниваю Jupyter Notebook, Google Colab, Kaggle и Marimo глазами исследователя и начинающего Data Scientist

    Я пришел в Data Science не сразу. Учился в магистратуре по вечерам, работая в совершенно другой сфере (строительство). Осваивать машинное обучение и анализ данных было интересно, но один из самых неожиданных вопросов, который возник буквально сразу - в какой среде писать код? На первый взгляд кажется, что Jupyter Notebook, Google Colab, Kaggle и сравнительно новая Marimo - это одно и то же, ноутбук с ячейками и Python (так же поддерживаются другие языки программирования). Но на практике каждая из этих сред подходит для разных задач, где-то удобнее учиться, а где-то работать командой. Эта статья - результат моего практического сравнения сред, которое я проводил во время обучения и выполнения исследовательских задач, связанных с анализом и подготовкой данных, моделированием и машинным обучением. Статья будет полезна:

    habr.com/ru/articles/969090/

    #jupyter_notebook #google_colab #kaggle #data_scientist #сравнение #исследователь #опыт

  6. Сравниваю Jupyter Notebook, Google Colab, Kaggle и Marimo глазами исследователя и начинающего Data Scientist

    Я пришел в Data Science не сразу. Учился в магистратуре по вечерам, работая в совершенно другой сфере (строительство). Осваивать машинное обучение и анализ данных было интересно, но один из самых неожиданных вопросов, который возник буквально сразу - в какой среде писать код? На первый взгляд кажется, что Jupyter Notebook, Google Colab, Kaggle и сравнительно новая Marimo - это одно и то же, ноутбук с ячейками и Python (так же поддерживаются другие языки программирования). Но на практике каждая из этих сред подходит для разных задач, где-то удобнее учиться, а где-то работать командой. Эта статья - результат моего практического сравнения сред, которое я проводил во время обучения и выполнения исследовательских задач, связанных с анализом и подготовкой данных, моделированием и машинным обучением. Статья будет полезна:

    habr.com/ru/articles/969090/

    #jupyter_notebook #google_colab #kaggle #data_scientist #сравнение #исследователь #опыт

  7. Сравниваю Jupyter Notebook, Google Colab, Kaggle и Marimo глазами исследователя и начинающего Data Scientist

    Я пришел в Data Science не сразу. Учился в магистратуре по вечерам, работая в совершенно другой сфере (строительство). Осваивать машинное обучение и анализ данных было интересно, но один из самых неожиданных вопросов, который возник буквально сразу - в какой среде писать код? На первый взгляд кажется, что Jupyter Notebook, Google Colab, Kaggle и сравнительно новая Marimo - это одно и то же, ноутбук с ячейками и Python (так же поддерживаются другие языки программирования). Но на практике каждая из этих сред подходит для разных задач, где-то удобнее учиться, а где-то работать командой. Эта статья - результат моего практического сравнения сред, которое я проводил во время обучения и выполнения исследовательских задач, связанных с анализом и подготовкой данных, моделированием и машинным обучением. Статья будет полезна:

    habr.com/ru/articles/969090/

    #jupyter_notebook #google_colab #kaggle #data_scientist #сравнение #исследователь #опыт

  8. Сравниваю Jupyter Notebook, Google Colab, Kaggle и Marimo глазами исследователя и начинающего Data Scientist

    Я пришел в Data Science не сразу. Учился в магистратуре по вечерам, работая в совершенно другой сфере (строительство). Осваивать машинное обучение и анализ данных было интересно, но один из самых неожиданных вопросов, который возник буквально сразу - в какой среде писать код? На первый взгляд кажется, что Jupyter Notebook, Google Colab, Kaggle и сравнительно новая Marimo - это одно и то же, ноутбук с ячейками и Python (так же поддерживаются другие языки программирования). Но на практике каждая из этих сред подходит для разных задач, где-то удобнее учиться, а где-то работать командой. Эта статья - результат моего практического сравнения сред, которое я проводил во время обучения и выполнения исследовательских задач, связанных с анализом и подготовкой данных, моделированием и машинным обучением. Статья будет полезна:

    habr.com/ru/articles/969090/

    #jupyter_notebook #google_colab #kaggle #data_scientist #сравнение #исследователь #опыт

  9. Топ вопросов с Data Science собеседований: Деревья и ансамбли, кластеризация, метрические модели

    Знание классики - база любых собеседований на все грейды в DS! Этот материал не рассчитан на изучение тем с нуля. Это чеклист и тренажёр , по которому стоит пройтись перед техническим интервью по классическому ML. Кратко, по делу, с акцентом на то, что действительно спрашивают. В этой части разберем: Деревья и ансамбли, метрические модели, кластеризацию кластеризацию Узнать вопросы и ответы на них

    habr.com/ru/articles/955636/

    #data_science #machinelearning #ml #ds #собеседование #деревья_решений #ансамбли #кластеризация #ml_engineer #data_scientist

  10. Топ вопросов с Data Science собеседований: Деревья и ансамбли, кластеризация, метрические модели

    Знание классики - база любых собеседований на все грейды в DS! Этот материал не рассчитан на изучение тем с нуля. Это чеклист и тренажёр , по которому стоит пройтись перед техническим интервью по классическому ML. Кратко, по делу, с акцентом на то, что действительно спрашивают. В этой части разберем: Деревья и ансамбли, метрические модели, кластеризацию кластеризацию Узнать вопросы и ответы на них

    habr.com/ru/articles/955636/

    #data_science #machinelearning #ml #ds #собеседование #деревья_решений #ансамбли #кластеризация #ml_engineer #data_scientist

  11. Топ вопросов с Data Science собеседований: Деревья и ансамбли, кластеризация, метрические модели

    Знание классики - база любых собеседований на все грейды в DS! Этот материал не рассчитан на изучение тем с нуля. Это чеклист и тренажёр , по которому стоит пройтись перед техническим интервью по классическому ML. Кратко, по делу, с акцентом на то, что действительно спрашивают. В этой части разберем: Деревья и ансамбли, метрические модели, кластеризацию кластеризацию Узнать вопросы и ответы на них

    habr.com/ru/articles/955636/

    #data_science #machinelearning #ml #ds #собеседование #деревья_решений #ансамбли #кластеризация #ml_engineer #data_scientist

  12. Топ вопросов с Data Science собеседований: Деревья и ансамбли, кластеризация, метрические модели

    Знание классики - база любых собеседований на все грейды в DS! Этот материал не рассчитан на изучение тем с нуля. Это чеклист и тренажёр , по которому стоит пройтись перед техническим интервью по классическому ML. Кратко, по делу, с акцентом на то, что действительно спрашивают. В этой части разберем: Деревья и ансамбли, метрические модели, кластеризацию кластеризацию Узнать вопросы и ответы на них

    habr.com/ru/articles/955636/

    #data_science #machinelearning #ml #ds #собеседование #деревья_решений #ансамбли #кластеризация #ml_engineer #data_scientist

  13. AI-ассистент в мире кода: как стать пилотом, а не пассажиром

    Сегодня невозможно игнорировать тот факт, что AI-ассистенты, такие как ChatGPT, GitHub Copilot или Gemini, стали частью рабочего процесса. Но использовать их бездумно — значит обесценить собственное обучение и будущие карьерные перспективы. Меня зовут Дмитрий Махортов, я специалист по машинному обучению и ревьюер на курсе

    habr.com/ru/companies/yandex_p

    #ds #ai #llm #data_science #data_scientist #нейросети #ии

  14. ML — курсы vs реальность: Где же обещанные цветочки и единороги?

    Привет, хабр! 👋 Позвольте представиться: я - Настя, Data Scientist и TeamLead в одной вполне себе серьезной компании (когда чистишь данные в 3 ночи, чувствуешь себя совсем не серьезно, но это детали). Веду свой скромный телеграм-канальчик , где делюсь болью, радостью и абсурдом нашей необъятной профессии. И вот сегодня хочу вынести на ваш суд тему, которая не дает спать спокойно не только мне, но и многим моим коллегам. Помните тот трепетный момент, когда вы только начинали свой путь в Data Science? Я — очень хорошо. Картинка была радужной: ты — повелитель нейросетей, твои модели творят магию, а бизнес-задачи падают к ногам, поверженные точностью в 99.9% (ну или хотя бы 97%). Курсы, будь то знаменитые онлайн-платформы или университетские программы, учат нас прекрасному: бустинги, метрики, градиентный спуск, SVM, k-means, сверточные слои... Это наш фундамент, наш джентельменский набор. И да, именно за этим набором охотятся 90% рекрутеров на собеседованиях. Создается стойкое ощущение, что я и интервьюер одновременно загуглили «Топ-50 вопросов на DS собеседовании» и теперь ритуально их отрабатываем. Ну, must have, что уж тут. Но потом ты выходишь из уютного мира clean data и идеальных датасетов в дикие джунгли реального проекта. И здесь начинается магия настоящей работы. Та самая, про которую не снимают вдохновляющие ролики. А порой многие именно тут и бросают этот, казалось бы увлекательный и перспективный карьерный путь в мир ML... Читать и обсудить...

    habr.com/ru/articles/942558/

    #курсы #data_science #machinelearning #ml #data_scientist_career #data_scientist #машинное_обучение #стажировка #классификация #хакатон

  15. РосНОУ повысил свои позиции в рейтинге вузов-лидеров ИИ

    Альянс в сфере искусственного интеллекта опубликовал третий ежегодный рейтинг российских университетов, готовящих специалистов для ИИ-отрасли. В этом году в список вошли 203 вуза из 68 регионов страны.

    habr.com/ru/articles/934646/

    #высшее_образование #рейтинги_вузов #российский_новый_университет #itтехнологии #подготовка_кадров #образовательные_программы #образовательные_ресурсы #data_engineering #data_analysis #data_scientist

  16. РосНОУ повысил свои позиции в рейтинге вузов-лидеров ИИ

    Альянс в сфере искусственного интеллекта опубликовал третий ежегодный рейтинг российских университетов, готовящих специалистов для ИИ-отрасли. В этом году в список вошли 203 вуза из 68 регионов страны.

    habr.com/ru/articles/934646/

    #высшее_образование #рейтинги_вузов #российский_новый_университет #itтехнологии #подготовка_кадров #образовательные_программы #образовательные_ресурсы #data_engineering #data_analysis #data_scientist

  17. РосНОУ повысил свои позиции в рейтинге вузов-лидеров ИИ

    Альянс в сфере искусственного интеллекта опубликовал третий ежегодный рейтинг российских университетов, готовящих специалистов для ИИ-отрасли. В этом году в список вошли 203 вуза из 68 регионов страны.

    habr.com/ru/articles/934646/

    #высшее_образование #рейтинги_вузов #российский_новый_университет #itтехнологии #подготовка_кадров #образовательные_программы #образовательные_ресурсы #data_engineering #data_analysis #data_scientist

  18. РосНОУ повысил свои позиции в рейтинге вузов-лидеров ИИ

    Альянс в сфере искусственного интеллекта опубликовал третий ежегодный рейтинг российских университетов, готовящих специалистов для ИИ-отрасли. В этом году в список вошли 203 вуза из 68 регионов страны.

    habr.com/ru/articles/934646/

    #высшее_образование #рейтинги_вузов #российский_новый_университет #itтехнологии #подготовка_кадров #образовательные_программы #образовательные_ресурсы #data_engineering #data_analysis #data_scientist

  19. Со скоростью кометы: ускоряем Spark без переписывания кода

    Привет, Хабр! Меня зовут Лев Маковеев. Я младший инженер по обработке данных в компании «Криптонит». В этой статье хочу поделиться с вами результатами небольшого исследования, в ходе которого мы протестировали ускоритель запросов Apache DataFusion Comet и пришли к довольно впечатляющим результатам. Забегая вперёд, отмечу, что в отдельных тестах ускорение было более чем десятикратным!

    habr.com/ru/companies/kryptoni

    #spark #apache #comet #DataFusion #большие_данные #анализ_данных #data_engineering #data_scientist #big_data #оптимизация

  20. Введение в синтетические данные для ML: зачем они нужны?

    Генерация документов, лиц и даже симуляция целых атак: как далеко можно зайти в создании и использовании синтетических данных? В этой статье Артур Казукевич, Data Science Engineer в Data Light, расскажет, почему синтетика становится крупнейшей тенденцией в сфере ML, как такие данные можно использовать и какие ограничения для генерации существуют, а также поделится своим опытом.

    habr.com/ru/companies/data_lig

    #data_science #generative_models #data_scientist #data_engineering

  21. Как растут data science-инженеры и что советуют синьоры, чтобы развиваться быстрее

    Привет, на связи Светлана Морозова и Сергей Кляхандлер из команды data science Авито . Рассказываем, как у нас устроен рост сотрудников, поговорим и о особенностях этого процесса в big tech-компаниях в целом и в Авито в частности. Статья будет интересна всем, кто хочет развиваться в профессии или просто ищет работу в направлении data science.

    habr.com/ru/companies/avito/ar

    #карьера #data_science #data_scientist #развитие_навыков #карьера_в_itиндустрии #рост_в_data_science #грейды #avito #авито

  22. Дата-сайентистам: рецензия на книгу “Машинное обучение с PyTorch и Scikit-Learn”

    Это наконец случилось: в русском переводе вышла самая объемная из когда-либо издававшихся книг по машинному и глубокому обучению. "Machine Learning with PyTorch and Scikit-Learn" Себастьяна Рашки и его соавторов — это огромное, почти на 800 страниц, руководство по практическому применению Python в сфере Data Science. Книга изначально планировалась как 4-е издание "Python Machine Learning", но из-за множества изменений авторы решили выпустить его под новым названием. Ввиду достаточно высокой цены, вам пригодится наш промокод SSPSOFT для покупки этой книги со скидкой 25%.

    habr.com/ru/companies/ssp-soft

    #data_science #data_mining #data_analysis #data_engineering #data_scientist #dataset #python #pytorch #scikitlearn

  23. Перспективы профессии Data Science: ликбез для джунов

    Меня зовут Женя Толстов, я тимлид ML-отдела в группе компаний ФСК и наставник на курсе

    habr.com/ru/companies/yandex_p

    #data_science #data_scientist #дата_сайенс #перспективы_профессии #профессии_в_it

  24. Перспективы профессии Data Science: ликбез для джунов

    Меня зовут Женя Толстов, я тимлид ML-отдела в группе компаний ФСК и наставник на курсе

    habr.com/ru/companies/yandex_p

    #data_science #data_scientist #дата_сайенс #перспективы_профессии #профессии_в_it

  25. Перспективы профессии Data Science: ликбез для джунов

    Меня зовут Женя Толстов, я тимлид ML-отдела в группе компаний ФСК и наставник на курсе

    habr.com/ru/companies/yandex_p

    #data_science #data_scientist #дата_сайенс #перспективы_профессии #профессии_в_it

  26. Дата-сайентистам: «Обработка данных на Python. Data Wrangling и Data Quality»

    В этом посте познакомим специалистов по изучению данных (Data Scientists) с довольно интересной книгой Сьюзан МакГрегор, дающей пошаговые рекомендации по извлечению зависимостей (автор называет их insights) из неочищенных наборов данных с помощью конструкций на языке Python. «Эта книга заполняет пробел в литературе по обработке данных на Python. Она предлагает весьма необходимое практическое руководство по очистке, преобразованию и подготовке к анализу наборов сырых данных.» — рецензия на Amazon.

    habr.com/ru/companies/ssp-soft

    #data_science #data_scientist #python

  27. Красиво и понятно: какие инструменты для визуализации данных нужны дата-аналитику

    Ежедневно аналитики обрабатывают массу данных в формате таблиц. Они хорошо ориентируются в них и видят взаимосвязи. Но для коллег из других сфер такой объем неструктурированной информации может быть шокирующим. Сделать данные более наглядными помогает визуализация графиков и таблиц. Собрали подборку инструментов для визуализации данных из сложных таблиц в читабельные дашборды.

    habr.com/ru/companies/skillfac

    #аналитика #аналитика_данных #data_science #data_scientist #визуализация #визуализация_данных #визуализация_информации #excel #powerbi #инструменты

  28. Красиво и понятно: какие инструменты для визуализации данных нужны дата-аналитику

    Ежедневно аналитики обрабатывают массу данных в формате таблиц. Они хорошо ориентируются в них и видят взаимосвязи. Но для коллег из других сфер такой объем неструктурированной информации может быть шокирующим. Сделать данные более наглядными помогает визуализация графиков и таблиц. Собрали подборку инструментов для визуализации данных из сложных таблиц в читабельные дашборды.

    habr.com/ru/companies/skillfac

    #аналитика #аналитика_данных #data_science #data_scientist #визуализация #визуализация_данных #визуализация_информации #excel #powerbi #инструменты

  29. Красиво и понятно: какие инструменты для визуализации данных нужны дата-аналитику

    Ежедневно аналитики обрабатывают массу данных в формате таблиц. Они хорошо ориентируются в них и видят взаимосвязи. Но для коллег из других сфер такой объем неструктурированной информации может быть шокирующим. Сделать данные более наглядными помогает визуализация графиков и таблиц. Собрали подборку инструментов для визуализации данных из сложных таблиц в читабельные дашборды.

    habr.com/ru/companies/skillfac

    #аналитика #аналитика_данных #data_science #data_scientist #визуализация #визуализация_данных #визуализация_информации #excel #powerbi #инструменты

  30. Вопросы и задачи по SQL на собеседованиях 2024: готовьтесь эффективно

    В 2024 году вопросы и тестовые задания на собеседованиях не потеряли своей актуальности и продолжают вызывать огромный интерес у соискателей. Если вы сейчас погружены в процесс прохождения интервью, то наверняка сталкиваетесь с множеством непростых, но захватывающих задач. Давайте вместе рассмотрим некоторые из новых вопросов и задач, которые реально задаются на собеседованиях в различных командах. Эти примеры основаны на моем собственном опыте и актуальны на сегодняшний день. Новые вопросы и задачи будут публиковаться по мере их поступления и прохождения собеседований.

    habr.com/ru/articles/816537/

    #sql #data_analyst #bigdata #собеседование_вопросы #задачи_на_собеседованиях #вопросы_на_собеседование #data_science #data_scientist

  31. Вопросы и задачи по SQL на собеседованиях 2024: готовьтесь эффективно

    В 2024 году вопросы и тестовые задания на собеседованиях не потеряли своей актуальности и продолжают вызывать огромный интерес у соискателей. Если вы сейчас погружены в процесс прохождения интервью, то наверняка сталкиваетесь с множеством непростых, но захватывающих задач. Давайте вместе рассмотрим некоторые из новых вопросов и задач, которые реально задаются на собеседованиях в различных командах. Эти примеры основаны на моем собственном опыте и актуальны на сегодняшний день. Новые вопросы и задачи будут публиковаться по мере их поступления и прохождения собеседований.

    habr.com/ru/articles/816537/

    #sql #data_analyst #bigdata #собеседование_вопросы #задачи_на_собеседованиях #вопросы_на_собеседование #data_science #data_scientist

  32. Вопросы и задачи по SQL на собеседованиях 2024: готовьтесь эффективно

    В 2024 году вопросы и тестовые задания на собеседованиях не потеряли своей актуальности и продолжают вызывать огромный интерес у соискателей. Если вы сейчас погружены в процесс прохождения интервью, то наверняка сталкиваетесь с множеством непростых, но захватывающих задач. Давайте вместе рассмотрим некоторые из новых вопросов и задач, которые реально задаются на собеседованиях в различных командах. Эти примеры основаны на моем собственном опыте и актуальны на сегодняшний день. Новые вопросы и задачи будут публиковаться по мере их поступления и прохождения собеседований.

    habr.com/ru/articles/816537/

    #sql #data_analyst #bigdata #собеседование_вопросы #задачи_на_собеседованиях #вопросы_на_собеседование #data_science #data_scientist

  33. Как мы упростили процесс интерактивной визуализации данных в веб-приложении, используя HoloViews

    Идея этой статьи родилась, когда наша команда занималась разработкой минимально жизнеспособного продукта (MVP) внутренней веб-системы, важной составляющей которой было визуальное представление данных, а именно результатов работы различных анализаторов исходного кода программного обеспечения. Из всего разнообразия библиотек визуализации в веб мы выбрали HoloViews, поскольку она в наибольшей степени соответствовала компетенциям нашей команды, костяк которой в силу специфики проекта составляли специалисты по анализу данных. Однако для успешной интеграции HoloViews в веб-приложение нам, как разработчикам, пришлось проявить и некоторую изобретательность. Мы посчитали, что имеет смысл поделиться этим опытом, поскольку в одном месте подобный материал до сих пор нигде не был собран.

    habr.com/ru/companies/astralin

    #data_analyst #визуализация_данных #графики #датааналитик #вебприложения #датасайентист #data_scientist #интерактивная_визуализация #HoloViews

  34. Как мы упростили процесс интерактивной визуализации данных в веб-приложении, используя HoloViews

    Идея этой статьи родилась, когда наша команда занималась разработкой минимально жизнеспособного продукта (MVP) внутренней веб-системы, важной составляющей которой было визуальное представление данных, а именно результатов работы различных анализаторов исходного кода программного обеспечения. Из всего разнообразия библиотек визуализации в веб мы выбрали HoloViews, поскольку она в наибольшей степени соответствовала компетенциям нашей команды, костяк которой в силу специфики проекта составляли специалисты по анализу данных. Однако для успешной интеграции HoloViews в веб-приложение нам, как разработчикам, пришлось проявить и некоторую изобретательность. Мы посчитали, что имеет смысл поделиться этим опытом, поскольку в одном месте подобный материал до сих пор нигде не был собран.

    habr.com/ru/companies/astralin

    #data_analyst #визуализация_данных #графики #датааналитик #вебприложения #датасайентист #data_scientist #интерактивная_визуализация #HoloViews

  35. Как мы упростили процесс интерактивной визуализации данных в веб-приложении, используя HoloViews

    Идея этой статьи родилась, когда наша команда занималась разработкой минимально жизнеспособного продукта (MVP) внутренней веб-системы, важной составляющей которой было визуальное представление данных, а именно результатов работы различных анализаторов исходного кода программного обеспечения. Из всего разнообразия библиотек визуализации в веб мы выбрали HoloViews, поскольку она в наибольшей степени соответствовала компетенциям нашей команды, костяк которой в силу специфики проекта составляли специалисты по анализу данных. Однако для успешной интеграции HoloViews в веб-приложение нам, как разработчикам, пришлось проявить и некоторую изобретательность. Мы посчитали, что имеет смысл поделиться этим опытом, поскольку в одном месте подобный материал до сих пор нигде не был собран.

    habr.com/ru/companies/astralin

    #data_analyst #визуализация_данных #графики #датааналитик #вебприложения #датасайентист #data_scientist #интерактивная_визуализация #HoloViews

  36. Материалы для подготовки к собеседованию на позицию Data Scientist. Часть 2: Классическое машинное обучение

    Привет! Меня зовут Артем. Я работаю Data Scientist'ом в компании МегаФон (платформа для безопасной монетизации данных OneFactor ). Мы строим скоринговые (credit scoring), лидогенерационные (lead generation) и антифрод (anti-fraud) модели на телеком данных, а также делаем гео-аналитику (geoanalytics). В предыдущей статье я поделился материалами для подготовки к одному из самых волнительных (для многих) этапов - Live Coding. В этой статье рассмотрим материалы, которые можно использовать для подготовки к секции по классическому машинному обучению.

    habr.com/ru/companies/megafon/

    #собеседование_в_it #data_science #подготовка_к_собеседованию #data_scientist #машинное_обучение #курсы #книги #материалы #ресурсы #kaggle

  37. 40 Полезных инструментов Дата Саентиста

    В мире науки о данных существует бесчисленное множество библиотек и инструментов, которые помогают ускорить работу и повысить эффективность анализа. Но что если я расскажу вам о некоторых полезных библиотеках, о которых вы скорее всего не слышали? В списке не будет всем известных библиотек таких, как Pandas, Polars, Scipy и тд Сегодня, благодаря активному сообществу разработчиков, практически для любой задачи на Python можно найти готовый и полезный инструмент, который поможет вам в решении самых сложных задач. Надеюсь, вы найдете что-то полезное для себя. Читать

    habr.com/ru/articles/795785/

    #data_science #data_scientist #машинное_обучение

  38. Особенности машинного обучения в нефтегазовой отрасли

    Привет, меня зовут Олег Свидченко, я — Chief Data Scientist. Работаю в ассоциации «Цифровые технологии в промышленности». Если вы недавно перешли из крупной технологической компании в нефтегазовую или только планируете этот переход, либо слышали про машинное обучение только в теории, но у вас нет практики его применения в конкретных, особенно промышленных проектах, эта статья для вас. Когда я искал новое место работы, сперва рассматривал крупные IT-компании, но решил, что мне неинтересно допиливать 0,1% к точности поиска. А в промышленности — непаханное поле, можно внедрять интересные технологии крупными мазками и решать задачи, которые еще не исследовались. Хотя меня пугали страшилками, что будет строгий дресс-код, жесткий график, неудобный офис и скучные проекты...

    habr.com/ru/companies/oleg-bun

    #ml #machine_learning #большие_данные #нефтегазовая_отрасль #промышленная_автоматизация #data_scientist #agile #кип #ниокр #нир

  39. Особенности машинного обучения в нефтегазовой отрасли

    Привет, меня зовут Олег Свидченко, я — Chief Data Scientist. Работаю в ассоциации «Цифровые технологии в промышленности». Если вы недавно перешли из крупной технологической компании в нефтегазовую или только планируете этот переход, либо слышали про машинное обучение только в теории, но у вас нет практики его применения в конкретных, особенно промышленных проектах, эта статья для вас. Когда я искал новое место работы, сперва рассматривал крупные IT-компании, но решил, что мне неинтересно допиливать 0,1% к точности поиска. А в промышленности — непаханное поле, можно внедрять интересные технологии крупными мазками и решать задачи, которые еще не исследовались. Хотя меня пугали страшилками, что будет строгий дресс-код, жесткий график, неудобный офис и скучные проекты...

    habr.com/ru/companies/oleg-bun

    #ml #machine_learning #большие_данные #нефтегазовая_отрасль #промышленная_автоматизация #data_scientist #agile #кип #ниокр #нир

  40. Введение в SQL & СУБД на примере доступа к данным через Python

    Краткое введение в SQL (+СУБД) на примере доступа к данным через Python. Я начинающий Data Scientist и решил написать статью где будет базовое введение в sql, а также как извлекать данные через разные способы (SQLalchemy, Requests). Читать далеее

    habr.com/ru/articles/783260/

    #введение_в_бд #введение_в_python #flask #data_scientist #requests #sql #sqlite3

  41. Почему работа с данными так популярна: Data Scientist, Big Data и объектное хранение

    По оценкам Cybersecurity Ventures, к 2025 году общий объем данных в облаках достигнет 100 зеттабайт, или 50% всех мировых данных на тот момент. Ландшафт хранения этой информации разнообразен: от недорогих обычных серверов до огромных хранилищ на сотни петабайт. При экспоненциальном росте информации возможности работы с данными расширяются. Отчет LinkedIn о новых вакансиях показывает, что мировой рынок работы в области науки о данных вырастет до 230,80 млрд долларов к 2026 году. Наука о данных является востребованной, интересной, и, казалось бы, очень сложной областью знаний. Однако хорошая новость заключается в том, что она доступна для новичков. В статье мы разберемся, с какими базовыми основами нужно познакомиться при работе с данными.

    habr.com/ru/companies/cloud_mt

    #DataOps #data #данные #Data_Scientist #Big_Data #S3 #объектное_хранилище