#scikit-learn — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #scikit-learn, aggregated by home.social.
-
One Open-source Project Daily
Genetic Programming in Python, with a scikit-learn inspired API
https://github.com/trevorstephens/gplearn
#1ospd #opensource #geneticprogramming #machinelearning #python #scikitlearn #symbolicregression -
Машинное обучение без боли: базовый гайд по scikit-learn на практическом примере
Осваиваем scikit-learn за 20 минут 🚀 Выкатил на Хабр гайд для тех, кто хочет понять классический ML на Python без воды. Внутри: — Главный секрет библиотеки (.fit, .predict, .transform) — Как не обмануть себя при оценке модели — Сборка правильного Pipeline, как у мидлов Залетайте читать и забирать шаблоны кода.
https://habr.com/ru/articles/1031044/
#python #scikitlearn #machine_learning #машинное_обучение #data_science #руководство #для_начинающих
-
Поиск аномалий: статистика или ML? Выбираем лучшее
Поиск аномалий под микроскопом: от базовой статистики до робастных моделей с нуля на NumPy В машинном обучении поиск аномалий (Anomaly Detection) часто остается в тени классического обучения с учителем. Однако именно эта «иммунная система» данных спасает миллионы долларов в финтехе, предотвращает катастрофы на производстве и находит критические ошибки в медицинских картах. В этой статье мы не просто импортируем готовые методы из sklearn. Мы разберем математическую логику трех мощных подходов, напишем их «примитивные» реализации на NumPy/Pandas, чтобы понять механику работы «под капотом», и проверим их в деле на реальном кейсе. Наш полигон: Credit Card Fraud Detection Для тестов мы возьмем классический датасет Credit Card Fraud Detection. Это идеальный пример «иголки в стоге сена»: здесь всего 0.17% мошеннических транзакций среди почти 300 тысяч записей. Смогут ли наши рукотворные алгоритмы их найти? Эволюция методов: от простого к сложному Мы пройдем путь от элементарной статистики до продвинутого геометрического анализа: IQR (Interquartile Range): Статистическая классика. Узнаем, как «усы» боксплота помогают находить грубые выбросы. Isolation Forest: Оригинальный подход, основанный на идее, что аномалию проще всего «изолировать» случайными разрезами пространства. Elliptic Envelope: Тяжелая артиллерия робастной статистики. Будем строить многомерный эллипс, который игнорирует попытки аномалий исказить его форму.
https://habr.com/ru/articles/996538/
#машинное+обучение #машинное_обучение #machinelearning #isolation_forest #anomaly_detection #поиск_аномалий #scikitlearn #mathematica #algorithms #python
-
Сравнил тоже! Нашел на Python разницу между «Бородино» и «Ледовым побоищем»
С помощью предобученной мультиязычной модели LaBSE и методов снижения размерности выяснил, что поэмы Лермонтова и Симонова, несмотря на столетнюю дистанцию, семантически близки. Подтвердил гипотезу, что русская патриотическая поэзия сохраняет устойчивое смысловое ядро, даже когда меняется стиль и идеология.
https://habr.com/ru/articles/979488/
#python #transformers #nlp #nltk #scikitlearn #нейросети #huggingface #torch #литература #поэзия
-
Curious how much performance you can squeeze out of decision-tree models when generating pure SQL?
With Orbital 0.3 we redesigned how tree-based models compile to SQL, cutting query size by ~7x and getting up to 300% speedups in real workloads.
If you ever hit limits with ML inference in databases, this blog post digs into what changed and why it matters.
👉 https://posit.co/blog/orbital-0-3-0/
#Python #DataEngineering #MachineLearning #SQL #ScikitLearn #opensource
-
We're hiring an open-source #python developer focused on modeling APIs!
https://tidyverse.org/blog/2025/11/python-open-source-developer/
-
Лучшие фреймворки для машинного обучения в 2025 году
Сегодня ни один крупный проект в области машинного обучения (ML) не обходится без фреймворков — готовых наборов библиотек, в которых базовые алгоритмы уже оптимизированы для различных архитектур. Выбор правильного фреймворка не только упрощает разработку, но и определяет успех проектов по внедрению искусственного интеллекта. В этой статье эксперты лаборатории искусственного интеллекта российской ИТ-компании «Криптонит» рассматривают самые актуальные фреймворки для машинного обучения, анализируют причины их популярности, ключевые области применения и тенденции развития. Аналитика строится как на собственном опыте, так и на данных специализированных источников, таких как GeeksforGeeks, Upgrad, Octal Software и других, чтобы предоставить аргументированный и непредвзятый обзор. Мы разделили обзор на две части. В первой рассматриваются фреймворки для глубокого обучения. Они ориентированы на построение и обучение нейронных сетей, в том числе сложных архитектур, таких как свёрточные модели и трансформеры. Вторая часть посвящена фреймворкам для классического машинного обучения. Они используются для работы с моделями, основанными на регрессии, решающих деревьях, методах ансамблирования (например, бустинг) и других алгоритмах без использования глубоких нейросетей.
https://habr.com/ru/companies/kryptonite/articles/950236/
#машинное+обучение #фреймворки #ML #pytorch #tensorflow #scikitlearn #xgboost #catboost #lightgbm #jax
-
nlock ML mastery with this Scikit-Learn tutorial! Step-by-step guidance to build & optimize models. Perfect for beginners! #MachineLearning #Python #ScikitLearn #Tutorial
-
📢 Want to master AI with Python?
Check out our new short video on the 3 most essential Python libraries used in AI & Machine Learning:
✔️ NumPy – fast numerical computing
✔️ Pandas – clean & manipulate datasets
✔️ Scikit-learn – build real ML models easily#Python #AI #MachineLearning #DataScience #NumPy #Pandas #ScikitLearn #TCCI #BopalAhmedabad #ComputerClasses #ShortTermCourses
-
Titanic + CatBoost (Первое решение, первый Jupyter Notebook)
Решение первого соревнования на kaggle титаник с помощью библиотеки от яндекса catboost. Два способа: обычная модель и второй: с перебором гиперпараметров с помощью randomizedsearch. Сравнение результатов.
https://habr.com/ru/articles/935540/
#kaggle #titanic #ml #машинноеобучение #machinelearning #scikitlearn #catboost #eda #соревнование #juniorml
-
Lazy-fedi-question... I have a "working"(?) code example of TF-IDF #tfidf using #scikitlearn and I know the main concepts, but all the tutorials I find are a bit — I don't want to be harsh but —crappy... Can someone point me to some nice open resource on it?
-
Нейросеть приближается к опыту профессионального дерматолога
Наконец наступило лето, а с ним и пора отпусков. Уезжая на южные моря, не забывайте: большинство из нас имеет типичную для северянина кожу с пониженным содержанием меланина — пигмента, отвечающего за защиту от ультрафиолета. Если кожа отреагировала непонятным новообразованием, вызывающим опасения, теперь можно проконсультироваться с искусственным интеллектом. Он предварительно осмотрит кожу и посоветует, бежать ли ко врачу, за которым, конечно, всегда последнее слово. К слову, данная медицинская ИИ-технология, как и публикация, не является медицинской рекомендацией: диагноз ставит лечащий врач.
https://habr.com/ru/companies/leader-id/articles/924702/
#медицина #красота_и_здоровье #приложения #сверточные_сети #нейросети #поиск_по_изображениям #стартапы #разработка_приложений #scikitlearn #opencv
-
Главное по ML/DL, часть 2: Вопрос → Краткий ответ → Разбор → Пример кода. SVD/PCA. Bias-variance. Деревья. Бустинг
У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение. Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять , но так же не лишая полноты! 💻 Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу ! Это самое важное, оно происходит в секции с кодом. Поэтому попробуйте сами решить предложенную задачку и придумать свою! Будет здорово получить ваши задачи и в следующих выпусках разобрать! Мы продолжаем. Обязательно испытайте себя в предыдущей [1] части! В лес, так в лес!
https://habr.com/ru/articles/921190/
#machinelearning #ds #python #scikitlearn #svd #pca #Biasvariance_tradeoff #random_forest #gradient_boosting #алгоритмы
-
[Перевод] Линейная регрессия в ML для самых маленьких
В мире машинного обучения есть много всего интересного, но тем, кто только начинает свой путь в этой области часто бывает многое непонятно. В этой статье мы попробуем разобраться с линейной регрессией. Линейная регрессия — это статистический метод, используемый для моделирования взаимосвязи между зависимой переменной и одной или несколькими независимыми переменными. Проще говоря, он помогает понять, как изменение одного или нескольких предикторов (независимых переменных) влияет на результат (зависимую переменную). Подумайте об этом, как о проведении прямой линии через диаграмму рассеяния точек данных, которая наилучшим образом отражает связь между этими точками.
https://habr.com/ru/companies/otus/articles/919258/
#ml #linear_regression #линейная_регрессия #обучение_модели #scikitlearn #python #data_science
-
Фундаментальные вопросы по ML/DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация
У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение. Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять , но так же не лишая полноты! Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу ! Это самое важное, оно происходит в секции с кодом. Будет здорово получить ваши задачи и в следующих выпусках разобрать! Взглянуть на старое под новым углом
https://habr.com/ru/articles/918438/
#machine_learning #data_science #python #scikitlearn #mlинтервью #svm #naive_bayes #регуляризация #линейная_регрессия #алгоритмы
-
Scikit-learn теперь умеет в пайплайны: что изменилось и как работать с библиотекой в 2025 году
Scikit-learn — это одна из основных Python-библиотек для машинного обучения. Её подключают в прикладных проектах, AutoML-системах и учебных курсах — как базовый инструмент для работы с моделями. Даже если вы давно пишете на PyTorch или CatBoost, в задачах с табличными данными, скорее всего, всё ещё вызываете fit , predict , score — через sklearn. В 2025 году в библиотеку добавили несколько важных обновлений: доработали работу с пайплайнами, подключили полную поддержку pandas API, упростили контроль за экспериментами. Мы подготовили гайд, как работать со scikit-learn в 2025 году. Новичкам он поможет собрать первую ML-задачу — с данными, моделью и метриками. А тем, кто уже использует библиотеку, — освежить знания и понять, что изменилось в новых версиях. Почитать гайд →
https://habr.com/ru/companies/netologyru/articles/911216/
#scikitlearn #sklearn #пайплайн #python #pandas #машинное_обучение #machine_learning #ml #классификация #регрессия
-
Как из аналитики данных перейти в дата-сайентисты
Перевели и дополнили статью Марины Уисс, applied scientist (дата-сайентист со специализацией в прикладной статистике) в Twitch. Когда-то Марина перешла в IT из не связанной с технологиями сферы деятельности, а потом помогла с этим переходом многим людям без IT-бэкграунда. В этой статье она делится советами для дата-аналитиков, которым хотелось бы заниматься data science. А мы добавили мнение экспертов и рекомендации, актуальные для российских образовательных реалий.
https://habr.com/ru/companies/netologyru/articles/905206/
#профессия_дата_сайентист #стать_датасайентистом #data_science #прогнозы_на_будущее #математика_и_статистика #scikitlearn #tensorflow #pytorch #mlops #docker
-
Как я сделала свой первый AI-продукт с ChatGPT и капелькой любви
В этой статье я расскажу о моем опыте самостоятельного изучения основ Python и Machine Learning и создании первого проекта OneLove на базе собственной модели искусственного интеллекта (ИИ).
https://habr.com/ru/articles/901548/
#python3 #chatgpt4 #api #flask #AIProduct #machinelearning #logistic_regression #scikitlearn #ml #data_science
-
🚗 GPUs can now accelerate vehicle intrusion detection by up to 159x compared to CPUs.
That’s not a tweak—it’s a leap.A new study dives into how libraries like cuML outperform scikit-learn in real-time IoV security applications, all while maintaining accuracy.
Could this reshape how we secure connected vehicles at the edge?
🔗 Dive into the details: https://blueheadline.com/tech-news/gpu-faster-intrusion-detection-iov/
#Technology #CyberSecurity #IoV #MachineLearning #EdgeComputing #AI #GPUAcceleration #cuML #ScikitLearn #BlueHeadline
-
Discover 10 effective Python one-liners for Scikit-learn that simplify your #MachineLearning tasks. These short snippets handle key operations like data import, splitting datasets, standardising features, PCA dimensionality reduction, and training SVM classifiers. Perfect for rapid experiments and cleaner code. #Python #DataScience #SoftwareDevelopment #ScikitLearn #AI https://www.kdnuggets.com/10-python-one-liners-for-scikit-learn
-
Рынок труда ML-специалистов в 2025 году: востребованные навыки и карьерные треки
В одном из недавних интервью Марк Цукерберг заявил , что к 2025 году искусственный интеллект (ИИ) сможет выполнять большинство задач Middle-разработчиков в Meta (запрещенная в РФ организация). По словам Цукерберга, ИИ уже помогает писать код и постепенно забирает на себя простые инженерные задачи, но хорошие Middle-инженеры все еще будут нужны. Правда при условии, что они будут осваивать новые востребованные технологии. С учетом влияния компании на технологическую повестку во всем мире заявление звучит серьезно: крупные игроки индустрии уже сейчас диктуют направление, в котором будет развиваться рынок труда в связи с масштабированием ИИ — это автоматизация большей части функций и появление новых. В таких условиях многим специалистам придется адаптироваться и прокачивать навыки, чтобы оставаться востребованными на рынке.
https://habr.com/ru/articles/882040/
#машинное_обучение #mlинженер #ai_talent_hub #mlops #разработка_вебсервисов #рынок_труда_it #pytorch #scikitlearn #apache_airflow #postgresql
-
#python #ai #machinelearning
#mlops #realtime #neuralnetwork #scikitlearnContinuous Machine Learning (CML): Basics & Best Practices for Adoption
The systematic way of learning continually from real-time data.
Plot: CML Confusion Matrix
#exploremore 👇
https://medium.com/@alexzap922/continuous-machine-learning-cml-basics-best-practices-for-adoption-257c19fbcbe9?sk=98bf072ddaccccd67ba83686261d8b15 -
#python #algorithm #scikitlearn
#machinelearning #artificialintelligence
#technology
#regression
#guide #tutorial
👉 A Comprehensive Guide to 85 Supervised Machine Learning Algorithms in Scikit-Learn — Part 1. Regressors👉 Best Practices in Building & Training ML Models with 51 Regressors (Codes, Plots, and More)
Master all-in-one AI concepts and develop hands-on ML skills with one of the most popular and powerful libraries for ML in Python!
-
Redressing #Bias: "Correlation Constraints for Regression Models":
Treder et al (2021) https://doi.org/10.3389/fpsyt.2021.615754#dataDev #linearRegression #modeling #probability #probabilities #statistics #stats #modelling #regression #correctionRatio #skLearn #scikitLearn #python #AIDev