#data_science — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #data_science, aggregated by home.social.
-
NumPy с нуля: понятный гайд для тех, кто хочет в Data Science
Стандартные списки в Python прекрасны своей гибкостью, но когда дело доходит до больших данных и математики, они превращаются в медленных черепах. 🐢 Подготовил для вас максимально практичный гайд: «NumPy с нуля до понимания за 1 статью». Никакой академической воды — только база для быстрого старта в Data Science и аналитике.
https://habr.com/ru/articles/1029440/
#numpy #numpy_datascience #python #python3 #python_для_начинающих #python_tutor #data_science #data_analysis
-
Метрики упали в лужу
Метрики могут «упасть» даже если вы ничего не меняли в модели. Разбираемся, как распознать distribution shift и что с ним делать в продакшене.
https://habr.com/ru/articles/1024380/
#eda #анализ_данных #мониторинг #статистика #предобработка_данных #pandas #data_science #machine_learning #data_analysis #production
-
Применение Data Science в цифровом производстве
Современное производство формирует большие объемы разнородных данных на всех этапах жизненного цикла изделия. Практическая ценность больших данных в производстве заключается в возможности их анализа и использования для принятия решений. В этой связи Data Science рассматривается как ключевой инструмент, интеграция которого в производственные процессы позволяет извлекать практическую ценность из больших данных и повышать эффективность производства. В статье рассматриваются принципы и ключевые понятия цифрового производства. Приведены основные направления применения Data Science в цифровом производстве, а также рассмотрены проблемы и перспективы его развития.
https://habr.com/ru/articles/1024458/
#data_science #цифровое_производство #цифровая_нить #цифровой_двойник #big_data #жизненный_цикл_изделия
-
Как мы за год собрали с нуля крупнейшую F&R-платформу для сети масштаба «Магнита»
33 000 магазинов, 46 РЦ сети «Магнит», 17 млрд прогнозов на 90 дней, 8 ПБ данных и ни одного готового решения, которое можно было бы просто взять с рынка. В 2024 году мы начали с нуля собирать собственную F&R-платформу (Forecast and Replenishment) для «Магнита» — систему прогнозирования спроса и пополнения. Меня зовут Фоменко Алексей, я руководитель ИТ-проекта ИС Прогнозирования и Пополнения, и в этой статье я расскажу, почему прошлые попытки не сработали, с какими ограничениями мы столкнулись, как выстроили разработку и что в итоге успели запустить за первый год. Это практический разбор того, как строить огромную критичную систему в условиях дефицита времени и готовых решений.
https://habr.com/ru/companies/magnit/articles/1023866/
#прогнозирование #прогнозирование_спроса #ml #mlops #data_science #data_lake #project_management #product_management #FnR #forecast
-
Как мы научили CatBoost находить борщевик на спутниковых снимках
С 1 марта 2026 года владельцы участков обязаны контролировать распространение борщевика Сосновского на законодательном уровне. Основным инструментом мониторинга стали спутниковые снимки, поскольку на них можно быстро обнаруживать очаги распространения борщевика на больших площадях. Однако ручное картографирование огромных территорий по снимкам с воздуха — процесс дорогой и плохо масштабируемый. Меня зовут Сергей Кукуруз, я руковожу ML‑проектами в центре технологий для общества Yandex Cloud. В этой статье расскажу, как мы совместно со студентами Школы анализа данных (ШАД), а также с движением добровольцев «СтопБорщевик» автоматизировали этот процесс с помощью машинного обучения. Мы подробно разберём технический пайплайн: от нормализации GeoTIFF‑файлов и извлечения признаков (индекс CIVE) до обучения модели в CatBoost. Я расскажу, почему для классификации объектов на спутниковых снимках градиентный бустинг зачастую эффективнее нейросетей, и как применить этот стек для поиска любых объектов — от лесных вырубок до руин крепостей. Собственный дата‑центр не потребуется, это можно сделать в домашних условиях — главное, чтобы у вас было достаточно спутниковых снимков для разметки данных:) Кому любопытно — добро пожаловать под кат!
https://habr.com/ru/companies/yandex/articles/1017876/
#computer_vision #data_science #экология #борщевик #ml #ai #ии #catboost
-
Как мы автоматизировали модерацию карточек товаров с помощью Computer Vision в Wildberries
Привет! Я Дмитрий Колесников, Team Lead DS-команды «Платформа модерации» в Wildberries & Russ. В этой статье по мотивам моего доклада на HighLoad расскажу, как у нас получилось превратить сотни Computer Vision моделей в единый масштабируемый пайплайн, который ежедневно обрабатывает 15 млн карточек товаров (50+ млн изображений и 500K видео).
https://habr.com/ru/companies/oleg-bunin/articles/992716/
#ml #machine_learning #data_science #cv #computer_vision #компьютерное_зрение #tritoninferenceserver #highload #wildberries #moderation
-
Обзор книг для анализа данных
Я аналитик данных и люблю бумажный формат книг (если есть сомнения, сначала пробую электронную версию, но если книга заходит всегда потом беру бумажную). В этой статье честный обзор, без рекламы, тех книг, которые я купила не так давно в бумажном формате.
https://habr.com/ru/articles/1007024/
#анализ_данных #алгоритмы #python #книги_для_аналитика #data_science #data_analysis #обзор_книг #грокаем #грокаем_алгоритмы #аналитика
-
Когда технологии выглядят красиво: WiDS Meetup 2026 как новая форма тех‑событий
6 марта 2026 года в Санкт‑Петербурге пройдёт WiDS Meetup — событие, которое я организую уже третий год подряд. Это не конференция в классическом смысле и не «просто митап». Да, у нас есть праздничная рамка, но смысл не в ней. Для меня WiDS Meetup — попытка нащупать новую форму технологического события, где инженерная глубина и практическая ценность не спорят с эстетикой, а усиливают друг друга. Судя по тому, как растёт аудитория и качество разговоров, это работает. Меня зовут Марк Паненко. Я руковожу направлением Machine Learning / Data Science в Ozon Банке и много лет участвую в организации мероприятий сообщества Open Data Science (ODS) в Санкт‑Петербурге. Ниже — история о том, как родился WiDS Meetup, почему он вырос до формата фестиваля/арт‑конференции и как это связано с тем, что происходит в индустрии прямо сейчас.
https://habr.com/ru/companies/ozonbank/articles/1003838/
#wids #meetup #conference #митап #ods #data_science #машинное_обучение
-
MDM: как навести порядок в НСИ и перестать чинить интеграции
В любой компании справочники НСИ сначала выглядят как “ну это же просто таблицы”. Контрагенты, номенклатура, адреса, подразделения, единицы измерения, статусы. Пока людей и систем мало - всё держится на внимательности пары сотрудников и привычке “если что, поправим руками”.
https://habr.com/ru/articles/993368/
#НСИ #мдм #mdm #mdmсистема #нси_и_интеграция #data #data_analysis #data_structures #базы_данных #data_science
-
Ред флаги, но не в тиндере: что важно понять data-специалисту ещё до офера
Пятничный вечер, бар, шумные разговоры. Мы - компания из нескольких ML-инженеров, DE и DA из Сбера, Магнита, Озона и Альфа-Банка собрались не ради обсуждения задачек в JIRA. Разговор зашел о наболевшем: как найти своих людей и команду мечты? Обсудили зарплату и плюшки, удалёнку и офис, стартапы и зрелые продукты, переработки, карьерный рост и рабочую культуру. В статье - цитаты из обсуждения и обобщённые выводы. А в конце - список вопросов, которые стоит задать на собеседовании, чтобы не ошибиться с выбором и найти тех людей, с кем не страшно будет выкатить релиз в пятницу вечером.
https://habr.com/ru/articles/988680/
#собеседование #вакансия #редфлаги #ml #data_science #data_analysis #переработки #команда_мечты #команда #плюшки
-
Автоматизированные системы мониторинга моделей машинного обучения с помощью нашего open source фреймворка
Любая модель машинного обучения начинается с данных . Известное выражение «garbage in, garbage out» как нельзя лучше описывает главную уязвимость ML‑систем. В автоматизированном машинном обучении (AutoML) наиболее критичными точками являются процесс сборки данных и проблема мониторинга данных, в т.ч. в онлайне. Если процессы feature engineering и обучения наша библиотека формализует «из коробки» с помощью конфигурационных файлов и единых правил, то ответственность за загрузку и получение данных несет пользователь.
https://habr.com/ru/companies/vsk_insurance/articles/988282/
#bigdata #big_data #big_data_analytics #python #opensource #ml #learning #mlинженер #dataset #data_science
-
Рынок лимонов и «размалеванные барышни»: текст вакансии как честное зеркало компании (датасет 146 000 вакансий)
Пока соискателей учат быть «размалеванными барышнями», работодатели на «рынке лимонов» никому ничего не должны. Можно ли узнать, что ждет внутри, еще до получения оффера? Что, если я скажу: текст вакансии — это честная проекция «внутренней кухни» компании? Я уверена, так как проверила это на личном кейсе, и, вооружившись этим инструментом, проанализировала 146 000 вакансий . О том, почему и как это возможно — для тех, кто не считает неудачное трудоустройство «ценным опытом» — рассказываю ниже.
https://habr.com/ru/articles/986086/
#NLP #Data_Science #анализ_данных #рынок_труда #поиск_работы #корпоративная_культура #анализ_вакансий #HRtech #карьера #выгорание
-
Анализ 400k вакансий hh.ru: как мы строили пайплайн и какие тренды нашли
Какие навыки реально нужны в IT? Разбор рынка по данным hh.ru . Мы обработали 393 000 вакансий за 2025 год и делимся результатами: универсальный стек технологий, медианные зарплаты по специальностям и доля удаленки. А еще — техническая реализация нашего open-source проекта для сбора данных.
https://habr.com/ru/articles/979118/
#Анализ_данных #Python #hhru #API #SQLite #Визуализация_данных #базы_данных #data_science #проектирование_систем
-
Автоэнкодер: как нейросеть учится понимать норму
Непосвящённому человеку кажется, что нейронная сеть может всё. Средства массовой информации этот миф только подпитывают, а где-то в недрах Голливуда Джеймс Камерон шепчет: «Я не режиссёр — я пророк». В реальной же повседневной работе от нейронной сети мне нужна одна простая и приземлённая вещь — поиск аномалий в данных . И вот с этим нейросети действительно справляются. Более того, для этого у них есть специальный инструмент — автоэнкодер . В этом небольшом опусе я попробую быстро, просто и без магии объяснить, что такое автоэнкодер, как он работает и почему он вообще способен находить аномалии .
-
DAG-классификация: как мы научили поиск определять нужную категорию ступенчатым образом
Одна из важнейших задач поиска — релевантная выдача. Простых универсальных решений здесь нет, а улучшение поиска — долгосрочный процесс, где крупные задачи приходится разбивать на небольшие, последовательные шаги. В этой статье делимся тем, как нам в «Магнит Маркете» удалось значительно улучшить качество поиска с помощью нетривиального подхода: ступенчатой классификации категории поискового запроса.
https://habr.com/ru/companies/magnit/articles/975980/
#ml #dag #поиск #ранжирование #релевантный_поиск #релевантность_поисковой_выдачи #data_science #dagмодель #оптимизация_поиска
-
Цифровые культиваторы, теплицы и мотоблоки или мультиагентная трансформация АПК
Миронов В.О., Кальченко С.Н. Приветствую вас, бравые хаброжители ;)) В наше время искусственный интеллект очень быстро развивается, при этом, вносит значительные коррективы в развитие различных профессий, диктуя там свои правила и виденье. При этом основные козыри — это скорость, время и профит. В этом контексте мы и будем говорить о сложившейся ситуации, а именно, о дифференцированной трансформации профессий. Да-да, все видели, эти километровые лонгриды, когда ИИшка выкатывает список профессий, которые попадают под трансформацию. При этом какие-то прогнозы сбываются какие-то нет, как и в целом всё в жизни. Однако, почему именно дифференцированной, да всё потому что, профессии даже не столько дифференцируются, сколько видоизменяются, но их суть остаётся той же. Бывает даже так, что не всегда удаётся охватить весь спектр нововведений.
https://habr.com/ru/articles/973682/
#analytics #analysis #agrohack #agrocode #machinelearning #computervision #computer_science #data_science #data_analysis #data_engineering
-
Как превратить хаотичный ML-проект в систему: пошаговый гайд по DVC + GitHub Actions
Пора строить систему, которая собирается за вечер на двух инструментах: DVC и GitHub Actions . Этот пост - пошаговый гайд , как превратить хаос в полноценный CI/CD‑пайплайн. Без кубернетесов, без сложной инфраструктуры. Зато с автоматизацией, воспроизводимостью и твоим спокойствием :) Начнем ↓ ⠀⠀
https://habr.com/ru/articles/973268/
#ml #data_science #базы_данных #devops #машинное_обучение #dvc #github_actions #mlops #воспроизводимость #python
-
Трансформеры для персональных рекомендаций на маркетплейсе: от гипотез до A/B-тестирования
Всем привет! На связи Ваня Ващенко, и я лид по развитию нейросетевых моделей в команде персональных рекомендаций Wildberries. Раньше я развивал B2C-рекомендации и нейросети кредитного скоринга в крупнейшем банке, а теперь вы видите результаты моей работы каждый раз, когда заходите на главную страницу любимого маркетплейса. Сегодняшний рассказ — о том, как мы развиваем WildBERT.
https://habr.com/ru/companies/wildberries/articles/972082/
#рекомендации #рекомендательные_системы #deep_learning #machine_learning #bert4rec #абтесты #recsys #маркетплейс #wildberries #data_science
-
AI-драгдизайн: первая молекула прошла Фазу II
AI-драгдизайн: первая молекула прошла Фазу II. Разбираем, как GNN, AlphaFold 3 и $2.23 млрд на провал меняют фармакологию
https://habr.com/ru/articles/964554/
#ai #аналитика_данных #фармацевтика #data_science #data_analysis #data_mining #искусственный_интеллект
-
Show HN: Erdos – open-source, AI data science IDE
https://www.lotas.ai/erdos
#ycombinator #Data_Science #AI_for_Data_Science #VSCode #RStudio #code_editor #Rprogramming #data_analysis #Rao #Erdos #Python #SQL #IDE #Coding_Agent #Data_Analysis -
Show HN: Erdos – open-source, AI data science IDE
https://www.lotas.ai/erdos
#ycombinator #Data_Science #AI_for_Data_Science #VSCode #RStudio #code_editor #Rprogramming #data_analysis #Rao #Erdos #Python #SQL #IDE #Coding_Agent #Data_Analysis -
Show HN: Erdos – open-source, AI data science IDE
https://www.lotas.ai/erdos
#ycombinator #Data_Science #AI_for_Data_Science #VSCode #RStudio #code_editor #Rprogramming #data_analysis #Rao #Erdos #Python #SQL #IDE #Coding_Agent #Data_Analysis -
Show HN: Erdos – open-source, AI data science IDE
https://www.lotas.ai/erdos
#ycombinator #Data_Science #AI_for_Data_Science #VSCode #RStudio #code_editor #Rprogramming #data_analysis #Rao #Erdos #Python #SQL #IDE #Coding_Agent #Data_Analysis -
Модель данных для успешного бизнеса: от простоты к компромиссам
История моделей данных — это не строгое следование хронологии, а путь нарастания сложности для решения всё более трудных задач. Чтобы понять, почему появились сложные модели, нужно начать с самой простой и интуитивно понятной из них. Это проведет нас от базовых структур к комплексным, позволит осознанно выбирать инструмент, понимая все предпосылки и компромиссы. «Широкие» таблицы Путь поиска баланса между простотой, производительностью и гибкостью начинался с «широких» (их также называют «плоских») таблиц, где вся информация хранится в единой структуре. Это была эпоха простоты: достаточно одного запроса — и все двести атрибутов пользователя оказывались у вас в руках. Процесс извлечения данных был быстрым и интуитивно понятным, поскольку обходился без сложных соединений и подзапросов. Однако у этой простоты обнаружилась обратная сторона — избыточность. Представьте, что данные о сотрудниках и их работодателях хранятся в одной таблице. Если компания меняет название, то необходимо обновлять каждую запись, которая связана с изменяемой информацией. Это не только расточительно с точки зрения хранения, но и чревато аномалиями в данных. Также при увеличении количества данных в «широких плоских» таблицах возрастает и риск нарушения консистентности информации.
https://habr.com/ru/companies/neoflex/articles/959066/
#модели_данных #data_analysis #data_science #ритейл #стартап #научная_работа
-
Diffusion Beats Autoregressive in Data-Constrained Settings
https://blog.ml.cmu.edu/2025/09/22/diffusion-beats-autoregressive-in-data-constrained-settings/
#ycombinator #Machine_learning #artificial_intelligence #deep_learning #natural_language_processing #automated_machine_learning #big_data #data_science #neural_networks #ethics_and_ai #computer_science #research -
Автоматизированное машинное обучение с помощью нашего Open Source фреймворка: задача о Титанике
Привет! Меня зовут Владимир Суворов, я Senior Data Scientist в Страховом Доме ВСК и core-разработчик нашей библиотеки машинного обучения OutBoxML. В статье сегодня мы поговорим не о выборе алгоритмов, а о том, как автоматизировать весь процесс ML — от данных до деплоя и мониторинга, сократив время на подготовку с дней до часов. Мы разберем это на примере классической задачи с Titanic, реализованной на нашем фреймворке. Приятного прочтения! Читать и обсуждать
https://habr.com/ru/companies/vsk_insurance/articles/948584/
#ml #opensource #python #fastapi #outbox #data_science #bigdata #machinelearning #framework #titanik
-
Polars — «убийца Pandas» на максималках
Всем привет! Меня зовут Александр Андреев, я инженер данных. Сегодня я хочу рассказать вам о библиотеке Polars - потенциальной замене Pandas, любимой у большинства дата-инженеров и дата-саентистов библиотеки для работы с данными. В своей статье я последовательно пройдусь от истории библиотеки Polars до примеров кода, технических аспектов ее производительности и в конце дам ссылки на все бенчмарки, обучающие материалы и дополнительные статьи, которые использовались для написания данного обзора-туториала по этой замечательной библиотеке.
https://habr.com/ru/articles/946788/
#polars #pandas #data_engineering #data_science #data_analysis #dataframe #library #python #rust #dataset
-
Spark 4.0 на горизонте: Готовимся к апгрейду или остаёмся на проверенном 3.0?
Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. Кажется, ещё вчера мы радовались возможностям Apache Spark 3.0 , разбирались с Adaptive Query Execution и наслаждались улучшениями Pandas API . Но мир больших данных не стоит на месте, и вот уже на подходе Apache Spark 4.0 . Новый мажорный релиз — это всегда событие: он обещает новые фичи, прирост производительности и, конечно же, новые вызовы при миграции. Apache Spark де-факто стал стандартом для распределённой обработки данных. От классических ETL-пайплайнов и SQL-аналитики до сложного машинного обучения и стриминга — Spark так или иначе задействован во многих современных data-платформах. Поэтому каждый новый релиз вызывает живой интерес у комьюнити: что там под капотом? Какие проблемы решены? Не сломается ли то, что работало годами?
https://habr.com/ru/companies/arenadata/articles/921252/
#spark #data_science #data_engineering #bigdata #sql #lakehouse #datalake #хранение_данных #hadoop #производительность
-
Koda: AI-помощник разработчика – бесплатно, без VPN, с поддержкой русского языка
Индустрия ИИ переживает рекордный бум: каждую неделю появляются новые модели, а заголовки пестрят новостями о многомиллионных контрактах и громких переходах звёздных исследователей. Прорывы происходят на всех уровнях: от чипов и инфраструктуры (NVIDIA и др.) до моделей и инструментов вроде Cursor или Windsurf. Но у российских разработчиков выбор заметно ýже: ограничения, VPN, трудности с оплатой. Мы решили это изменить и создали
https://habr.com/ru/companies/koda/articles/936906/
#koda #llm #AI #copilot #AIинструменты #вайбкодинг #агент #vibecoding #data_science #machine_learning
-
Вебинары трека Наука о данных Летней цифровой школы Сбера
Привет, коллеги ML инженеры, Data scientist'ы и все, кто интересуется искусственным интеллектом, созданием нейросетей, машинным обучением и анализом данных! Принёс вам пачку вебинаров с интенсива трека Наука о данных курсов повышения квалификации Летней цифровой школы Сбера.
https://habr.com/ru/articles/935564/
#машинное_обучениe #искусственный_интеллект #data_science #data_analysis #ai #artificial_intelligence #ии #нейросети #нейронные_сети #глубокое_обучение
-
Как автоматизировать обучение ML-моделей и сократить время вывода в прод до двух дней
В прошлой статье мы говорили о подходе к рекомендации сервисов на основании автоматизации расчета склонностей клиентов и единого репозитория предложений. В ней мы углубились в создание репозитория, описание логики категоризации и набора в кампании для коммуникации с клиентами. Сегодня мы подробнее расскажем про наш подход к автоматизации построения и вывода в прод набора моделей.
https://habr.com/ru/companies/beeline_tech/articles/926982/
#data_science #machine_learning #automl #feature_store #automatization
-
Фундаментальные вопросы по ML/DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация
У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение. Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять , но так же не лишая полноты! Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу ! Это самое важное, оно происходит в секции с кодом. Будет здорово получить ваши задачи и в следующих выпусках разобрать! Взглянуть на старое под новым углом
https://habr.com/ru/articles/918438/
#machine_learning #data_science #python #scikitlearn #mlинтервью #svm #naive_bayes #регуляризация #линейная_регрессия #алгоритмы
-
Фундаментальные вопросы по ML/DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация
У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение. Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять , но так же не лишая полноты! Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу ! Это самое важное, оно происходит в секции с кодом. Будет здорово получить ваши задачи и в следующих выпусках разобрать! Взглянуть на старое под новым углом
https://habr.com/ru/articles/918438/
#machine_learning #data_science #python #scikitlearn #mlинтервью #svm #naive_bayes #регуляризация #линейная_регрессия #алгоритмы
-
Фундаментальные вопросы по ML/DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация
У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение. Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять , но так же не лишая полноты! Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу ! Это самое важное, оно происходит в секции с кодом. Будет здорово получить ваши задачи и в следующих выпусках разобрать! Взглянуть на старое под новым углом
https://habr.com/ru/articles/918438/
#machine_learning #data_science #python #scikitlearn #mlинтервью #svm #naive_bayes #регуляризация #линейная_регрессия #алгоритмы
-
Как алгоритм Recovering Difference Softmax (RDS) делает рекомендации и уведомления точнее и эффективнее
Алгоритм Recovering Difference Softmax (RDS) — полноценный подход к оптимизации уведомлений и контента для повышения вовлеченности пользователей. Алгоритм выбирает единственно лучший вариант, удерживая пользователей дольше и возвращая их чаще. Если коротко, улучшает работу алгоритмов машинного обучения, особенно когда нужно делать выбор из нескольких вариантов. Как RDS превращает простые сигналы в рост вовлечённости? Разбираемся в статье!
https://habr.com/ru/companies/datafeel/articles/908770/
#Recovering_Difference_Softmax #RDS #duolingo #data_science #machinelearning #datafeeling
-
Топ-статей Saint HighLoad++ 2025
В этом году Saint HighLoad++ снова собирает экспертов индустрии на берегу Невы. А я уже знаю, какие темы вызовут настоящий хайп среди инженеров и разработчиков. Ловите инсайдерскую подборку топовых статей самых ожидаемых докладов конференции: только практика, реальные факапы и технологические прорывы.
https://habr.com/ru/companies/oleg-bunin/articles/912138/
#highload++ #архитектура #базы_данных #системы_хранения #platform_engineering #безопасность #эксплуатация_систем #data_science #тестирование #data_engineering
-
Full-stack в аналитике: почему это будущее Data Science?
Привет. Представьте: вы запилили нейросеть, которая определяет котиков на фото с точностью 99.9% (оставшиеся 0.1% — это когда хомяк притворяется котом). Воодушевлённый результатом, бежите к руководству — а там оказывается, что:
https://habr.com/ru/articles/904376/
#data_science #data_analysis #python #бекенд #фронтенд #ml #javascript
-
12 событий апреля, которые нельзя пропустить
Мы собрали для вас серию открытых уроков, которые пройдут в апреле и помогут не просто разобраться в сложных темах, а применить знания на практике. Будущее AI агентов на основе LLM, Prometheus для мониторинга, как избежать хаоса в IT-проектах и как обучить модель понимать языки — на эти и не только темы поговорим с экспертами в IT. Рассмотрим реальные кейсы, обсудим опыт и получим понимание того, как внедрять эти технологии в проекты.
https://habr.com/ru/companies/otus/articles/899644/
#AI_агенты #Scrum #seq2seq #автоматизация_тестирования #Docker #Apache_Kafka #Смартконтракты #data_science #prometheus
-
PhD and Postdoc Positions in Data-Driven Simulation and Digital Twins
Karlsruhe Institute of Technology
See the full job description on jobRxiv: https://jobrxiv.org/job/karlsruhe-institute-of-technology-27778-phd-and-postdoc-positions-in-data-driven-simulation-and-digital-twins-2/?feed_id=86685
#data_science #digital_signal_processing #mode...
https://jobrxiv.org/job/karlsruhe-institute-of-technology-27778-phd-and-postdoc-positions-in-data-driven-simulation-and-digital-twins-2/?feed_id=86685 -
PhD and Postdoc Positions in Data-Driven Simulation and Digital Twins
Karlsruhe Institute of Technology
See the full job description on jobRxiv: https://jobrxiv.org/job/karlsruhe-institute-of-technology-27778-phd-and-postdoc-positions-in-data-driven-simulation-and-digital-twins-2/?feed_id=85027
#data_science #digital_signal_processing #mode...
https://jobrxiv.org/job/karlsruhe-institute-of-technology-27778-phd-and-postdoc-positions-in-data-driven-simulation-and-digital-twins-2/?feed_id=85027 -
Линейная регрессия. Основная идея, модификации и реализация с нуля на Python
В машинном и глубоком обучении линейная регрессия занимает особое место, являясь не просто статистическим инструментом, но а также фундаментальным компонентом для многих более сложных концепций. В данной статье рассмотрен не только принцип работы линейной регрессии с реализацией с нуля на Python, но а также описаны её модификации и проведён небольшой сравнительный анализ основных методов регуляризации. Помимо этого, в конце указаны дополнительные источники для более глубокого ознакомления.
https://habr.com/ru/articles/804135/
#линейная_регрессия #linear_regression #polynomial #ridge #lasso #elasticnet #regularization #реализация_с_нуля #python #data_science
-
Побеждаем рутину в Data Science: как перестать быть недопрограммистами и недоисследователями
Профессия Data Scientist сейчас стала особенно привлекательна, вовлекая еще больше энтузиастов и даже евангелистов, благодаря последним достижениям в области генерации текстов и изображений. Внешний фон наводит на мысли, что будни дата сайентиста заполнены исключительно творческой самореализацией, и рутина в процессы его работы никогда не сможет просочиться. Увы, но большую часть DS команд рутина уже поглотила.
https://habr.com/ru/companies/alfa/articles/788290/
#data_science #automl #services #automatization #productivity
-
Bioinformatician @lgatto
UCLouvain
UCLouvain is hiring a #bioinformatician for the e-OMIX project
See the full job description on jobRxiv: https://jobrxiv.org/job/uclouvain-27778-bioinformatician/?feed_id=68846
#cross_platform #data_analyses #Data_Science #FHIR #genomics #proteomics #transcriptomics #ScienceJobs #hiring #research
https://jobrxiv.org/job/uclouvain-27778-bioinformatician/?feed_id=68846 -
Bioinformatician @lgatto
UCLouvain
UCLouvain is hiring a #bioinformatician for the e-OMIX project
See the full job description on jobRxiv: https://jobrxiv.org/job/uclouvain-27778-bioinformatician/?feed_id=68846
#cross_platform #data_analyses #Data_Science #FHIR #genomics #proteomics #transcriptomics #ScienceJobs #hiring #research
https://jobrxiv.org/job/uclouvain-27778-bioinformatician/?feed_id=68846 -
Bioinformatician @lgatto
UCLouvain
UCLouvain is hiring a #bioinformatician for the e-OMIX project
See the full job description on jobRxiv: https://jobrxiv.org/job/uclouvain-27778-bioinformatician/?feed_id=68846
#cross_platform #data_analyses #Data_Science #FHIR #genomics #proteomics #transcriptomics #ScienceJobs #hiring #research
https://jobrxiv.org/job/uclouvain-27778-bioinformatician/?feed_id=68846 -
Bioinformatician @lgatto
UCLouvain
UCLouvain is hiring a #bioinformatician for the e-OMIX project
See the full job description on jobRxiv: https://jobrxiv.org/job/uclouvain-27778-bioinformatician/?feed_id=68846
#cross_platform #data_analyses #Data_Science #FHIR #genomics #proteomics #transcriptomics #ScienceJobs #hiring #research
https://jobrxiv.org/job/uclouvain-27778-bioinformatician/?feed_id=68846 -
Bioinformatician @lgatto
UCLouvain
UCLouvain is hiring a #bioinformatician for the e-OMIX project
See the full job description on jobRxiv: https://jobrxiv.org/job/uclouvain-27778-bioinformatician/?feed_id=68846
#cross_platform #data_analyses #Data_Science #FHIR #genomics #proteomics #transcriptomics #ScienceJobs #hiring #research
https://jobrxiv.org/job/uclouvain-27778-bioinformatician/?feed_id=68846