#scikit-learn — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #scikit-learn, aggregated by home.social.
-
Best Python AI Frameworks in 2026
#Python #Pycharm #Datascience #Huggingface #Keras #Langchain #Pytorch #Scikitlearn #Tensorflowhttps://blog.jetbrains.com/pycharm/2026/06/best-python-ai-frameworks-in-2026/
-
One Open-source Project Daily
Genetic Programming in Python, with a scikit-learn inspired API
https://github.com/trevorstephens/gplearn
#1ospd #opensource #geneticprogramming #machinelearning #python #scikitlearn #symbolicregression -
One Open-source Project Daily
Genetic Programming in Python, with a scikit-learn inspired API
https://github.com/trevorstephens/gplearn
#1ospd #opensource #geneticprogramming #machinelearning #python #scikitlearn #symbolicregression -
Машинное обучение без боли: базовый гайд по scikit-learn на практическом примере
Осваиваем scikit-learn за 20 минут 🚀 Выкатил на Хабр гайд для тех, кто хочет понять классический ML на Python без воды. Внутри: — Главный секрет библиотеки (.fit, .predict, .transform) — Как не обмануть себя при оценке модели — Сборка правильного Pipeline, как у мидлов Залетайте читать и забирать шаблоны кода.
https://habr.com/ru/articles/1031044/
#python #scikitlearn #machine_learning #машинное_обучение #data_science #руководство #для_начинающих
-
Поиск аномалий: статистика или ML? Выбираем лучшее
Поиск аномалий под микроскопом: от базовой статистики до робастных моделей с нуля на NumPy В машинном обучении поиск аномалий (Anomaly Detection) часто остается в тени классического обучения с учителем. Однако именно эта «иммунная система» данных спасает миллионы долларов в финтехе, предотвращает катастрофы на производстве и находит критические ошибки в медицинских картах. В этой статье мы не просто импортируем готовые методы из sklearn. Мы разберем математическую логику трех мощных подходов, напишем их «примитивные» реализации на NumPy/Pandas, чтобы понять механику работы «под капотом», и проверим их в деле на реальном кейсе. Наш полигон: Credit Card Fraud Detection Для тестов мы возьмем классический датасет Credit Card Fraud Detection. Это идеальный пример «иголки в стоге сена»: здесь всего 0.17% мошеннических транзакций среди почти 300 тысяч записей. Смогут ли наши рукотворные алгоритмы их найти? Эволюция методов: от простого к сложному Мы пройдем путь от элементарной статистики до продвинутого геометрического анализа: IQR (Interquartile Range): Статистическая классика. Узнаем, как «усы» боксплота помогают находить грубые выбросы. Isolation Forest: Оригинальный подход, основанный на идее, что аномалию проще всего «изолировать» случайными разрезами пространства. Elliptic Envelope: Тяжелая артиллерия робастной статистики. Будем строить многомерный эллипс, который игнорирует попытки аномалий исказить его форму.
https://habr.com/ru/articles/996538/
#машинное+обучение #машинное_обучение #machinelearning #isolation_forest #anomaly_detection #поиск_аномалий #scikitlearn #mathematica #algorithms #python
-
Discover 7 practical scikit‑learn tricks that let you weave preprocessing pipelines directly into hyperparameter searches. Save time, avoid data leakage, and boost model reliability—all with clean, reusable code. Perfect for open‑source projects and reproducible research. Dive in to level up your ML workflow! #scikitlearn #pipeline #hyperparamtuning #mlresearch
🔗 https://aidailypost.com/news/7-scikit-learn-tricks-embed-preprocessing-pipelines-hyperparameter
-
Сравнил тоже! Нашел на Python разницу между «Бородино» и «Ледовым побоищем»
С помощью предобученной мультиязычной модели LaBSE и методов снижения размерности выяснил, что поэмы Лермонтова и Симонова, несмотря на столетнюю дистанцию, семантически близки. Подтвердил гипотезу, что русская патриотическая поэзия сохраняет устойчивое смысловое ядро, даже когда меняется стиль и идеология.
https://habr.com/ru/articles/979488/
#python #transformers #nlp #nltk #scikitlearn #нейросети #huggingface #torch #литература #поэзия
-
Curious how much performance you can squeeze out of decision-tree models when generating pure SQL?
With Orbital 0.3 we redesigned how tree-based models compile to SQL, cutting query size by ~7x and getting up to 300% speedups in real workloads.
If you ever hit limits with ML inference in databases, this blog post digs into what changed and why it matters.
👉 https://posit.co/blog/orbital-0-3-0/
#Python #DataEngineering #MachineLearning #SQL #ScikitLearn #opensource
-
Curious how much performance you can squeeze out of decision-tree models when generating pure SQL?
With Orbital 0.3 we redesigned how tree-based models compile to SQL, cutting query size by ~7x and getting up to 300% speedups in real workloads.
If you ever hit limits with ML inference in databases, this blog post digs into what changed and why it matters.
👉 https://posit.co/blog/orbital-0-3-0/
#Python #DataEngineering #MachineLearning #SQL #ScikitLearn #opensource
-
We're hiring an open-source #python developer focused on modeling APIs!
https://tidyverse.org/blog/2025/11/python-open-source-developer/
-
We're hiring an open-source #python developer focused on modeling APIs!
https://tidyverse.org/blog/2025/11/python-open-source-developer/
-
Ever wondered why dropping rows with NaNs can hurt your model? Our latest open‑source guide walks through a Pandas & Scikit‑learn workflow, showing how to spot missing target vs. predictor attributes, decide when to drop or impute, and keep your DataFrame clean for reliable machine‑learning results. Dive in to master the trade‑offs! #Pandas #ScikitLearn #MissingValues #Impute
🔗 https://aidailypost.com/news/first-pandas-scikitlearn-project-drops-rows-missing-values
-
Лучшие фреймворки для машинного обучения в 2025 году
Сегодня ни один крупный проект в области машинного обучения (ML) не обходится без фреймворков — готовых наборов библиотек, в которых базовые алгоритмы уже оптимизированы для различных архитектур. Выбор правильного фреймворка не только упрощает разработку, но и определяет успех проектов по внедрению искусственного интеллекта. В этой статье эксперты лаборатории искусственного интеллекта российской ИТ-компании «Криптонит» рассматривают самые актуальные фреймворки для машинного обучения, анализируют причины их популярности, ключевые области применения и тенденции развития. Аналитика строится как на собственном опыте, так и на данных специализированных источников, таких как GeeksforGeeks, Upgrad, Octal Software и других, чтобы предоставить аргументированный и непредвзятый обзор. Мы разделили обзор на две части. В первой рассматриваются фреймворки для глубокого обучения. Они ориентированы на построение и обучение нейронных сетей, в том числе сложных архитектур, таких как свёрточные модели и трансформеры. Вторая часть посвящена фреймворкам для классического машинного обучения. Они используются для работы с моделями, основанными на регрессии, решающих деревьях, методах ансамблирования (например, бустинг) и других алгоритмах без использования глубоких нейросетей.
https://habr.com/ru/companies/kryptonite/articles/950236/
#машинное+обучение #фреймворки #ML #pytorch #tensorflow #scikitlearn #xgboost #catboost #lightgbm #jax
-
nlock ML mastery with this Scikit-Learn tutorial! Step-by-step guidance to build & optimize models. Perfect for beginners! #MachineLearning #Python #ScikitLearn #Tutorial
-
nlock ML mastery with this Scikit-Learn tutorial! Step-by-step guidance to build & optimize models. Perfect for beginners! #MachineLearning #Python #ScikitLearn #Tutorial
-
Titanic + CatBoost (Первое решение, первый Jupyter Notebook)
Решение первого соревнования на kaggle титаник с помощью библиотеки от яндекса catboost. Два способа: обычная модель и второй: с перебором гиперпараметров с помощью randomizedsearch. Сравнение результатов.
https://habr.com/ru/articles/935540/
#kaggle #titanic #ml #машинноеобучение #machinelearning #scikitlearn #catboost #eda #соревнование #juniorml
-
Lazy-fedi-question... I have a "working"(?) code example of TF-IDF #tfidf using #scikitlearn and I know the main concepts, but all the tutorials I find are a bit — I don't want to be harsh but —crappy... Can someone point me to some nice open resource on it?
-
Lazy-fedi-question... I have a "working"(?) code example of TF-IDF #tfidf using #scikitlearn and I know the main concepts, but all the tutorials I find are a bit — I don't want to be harsh but —crappy... Can someone point me to some nice open resource on it?
-
Нейросеть приближается к опыту профессионального дерматолога
Наконец наступило лето, а с ним и пора отпусков. Уезжая на южные моря, не забывайте: большинство из нас имеет типичную для северянина кожу с пониженным содержанием меланина — пигмента, отвечающего за защиту от ультрафиолета. Если кожа отреагировала непонятным новообразованием, вызывающим опасения, теперь можно проконсультироваться с искусственным интеллектом. Он предварительно осмотрит кожу и посоветует, бежать ли ко врачу, за которым, конечно, всегда последнее слово. К слову, данная медицинская ИИ-технология, как и публикация, не является медицинской рекомендацией: диагноз ставит лечащий врач.
https://habr.com/ru/companies/leader-id/articles/924702/
#медицина #красота_и_здоровье #приложения #сверточные_сети #нейросети #поиск_по_изображениям #стартапы #разработка_приложений #scikitlearn #opencv
-
Главное по ML/DL, часть 2: Вопрос → Краткий ответ → Разбор → Пример кода. SVD/PCA. Bias-variance. Деревья. Бустинг
У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение. Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять , но так же не лишая полноты! 💻 Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу ! Это самое важное, оно происходит в секции с кодом. Поэтому попробуйте сами решить предложенную задачку и придумать свою! Будет здорово получить ваши задачи и в следующих выпусках разобрать! Мы продолжаем. Обязательно испытайте себя в предыдущей [1] части! В лес, так в лес!
https://habr.com/ru/articles/921190/
#machinelearning #ds #python #scikitlearn #svd #pca #Biasvariance_tradeoff #random_forest #gradient_boosting #алгоритмы
-
[Перевод] Линейная регрессия в ML для самых маленьких
В мире машинного обучения есть много всего интересного, но тем, кто только начинает свой путь в этой области часто бывает многое непонятно. В этой статье мы попробуем разобраться с линейной регрессией. Линейная регрессия — это статистический метод, используемый для моделирования взаимосвязи между зависимой переменной и одной или несколькими независимыми переменными. Проще говоря, он помогает понять, как изменение одного или нескольких предикторов (независимых переменных) влияет на результат (зависимую переменную). Подумайте об этом, как о проведении прямой линии через диаграмму рассеяния точек данных, которая наилучшим образом отражает связь между этими точками.
https://habr.com/ru/companies/otus/articles/919258/
#ml #linear_regression #линейная_регрессия #обучение_модели #scikitlearn #python #data_science
-
Фундаментальные вопросы по ML/DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация
У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение. Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять , но так же не лишая полноты! Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу ! Это самое важное, оно происходит в секции с кодом. Будет здорово получить ваши задачи и в следующих выпусках разобрать! Взглянуть на старое под новым углом
https://habr.com/ru/articles/918438/
#machine_learning #data_science #python #scikitlearn #mlинтервью #svm #naive_bayes #регуляризация #линейная_регрессия #алгоритмы
-
Scikit-learn теперь умеет в пайплайны: что изменилось и как работать с библиотекой в 2025 году
Scikit-learn — это одна из основных Python-библиотек для машинного обучения. Её подключают в прикладных проектах, AutoML-системах и учебных курсах — как базовый инструмент для работы с моделями. Даже если вы давно пишете на PyTorch или CatBoost, в задачах с табличными данными, скорее всего, всё ещё вызываете fit , predict , score — через sklearn. В 2025 году в библиотеку добавили несколько важных обновлений: доработали работу с пайплайнами, подключили полную поддержку pandas API, упростили контроль за экспериментами. Мы подготовили гайд, как работать со scikit-learn в 2025 году. Новичкам он поможет собрать первую ML-задачу — с данными, моделью и метриками. А тем, кто уже использует библиотеку, — освежить знания и понять, что изменилось в новых версиях. Почитать гайд →
https://habr.com/ru/companies/netologyru/articles/911216/
#scikitlearn #sklearn #пайплайн #python #pandas #машинное_обучение #machine_learning #ml #классификация #регрессия
-
Как из аналитики данных перейти в дата-сайентисты
Перевели и дополнили статью Марины Уисс, applied scientist (дата-сайентист со специализацией в прикладной статистике) в Twitch. Когда-то Марина перешла в IT из не связанной с технологиями сферы деятельности, а потом помогла с этим переходом многим людям без IT-бэкграунда. В этой статье она делится советами для дата-аналитиков, которым хотелось бы заниматься data science. А мы добавили мнение экспертов и рекомендации, актуальные для российских образовательных реалий.
https://habr.com/ru/companies/netologyru/articles/905206/
#профессия_дата_сайентист #стать_датасайентистом #data_science #прогнозы_на_будущее #математика_и_статистика #scikitlearn #tensorflow #pytorch #mlops #docker
-
Как я сделала свой первый AI-продукт с ChatGPT и капелькой любви
В этой статье я расскажу о моем опыте самостоятельного изучения основ Python и Machine Learning и создании первого проекта OneLove на базе собственной модели искусственного интеллекта (ИИ).
https://habr.com/ru/articles/901548/
#python3 #chatgpt4 #api #flask #AIProduct #machinelearning #logistic_regression #scikitlearn #ml #data_science
-
🚗 GPUs can now accelerate vehicle intrusion detection by up to 159x compared to CPUs.
That’s not a tweak—it’s a leap.A new study dives into how libraries like cuML outperform scikit-learn in real-time IoV security applications, all while maintaining accuracy.
Could this reshape how we secure connected vehicles at the edge?
🔗 Dive into the details: https://blueheadline.com/tech-news/gpu-faster-intrusion-detection-iov/
#Technology #CyberSecurity #IoV #MachineLearning #EdgeComputing #AI #GPUAcceleration #cuML #ScikitLearn #BlueHeadline
-
🚗 GPUs can now accelerate vehicle intrusion detection by up to 159x compared to CPUs.
That’s not a tweak—it’s a leap.A new study dives into how libraries like cuML outperform scikit-learn in real-time IoV security applications, all while maintaining accuracy.
Could this reshape how we secure connected vehicles at the edge?
🔗 Dive into the details: https://blueheadline.com/tech-news/gpu-faster-intrusion-detection-iov/
#Technology #CyberSecurity #IoV #MachineLearning #EdgeComputing #AI #GPUAcceleration #cuML #ScikitLearn #BlueHeadline
-
Discover 10 effective Python one-liners for Scikit-learn that simplify your #MachineLearning tasks. These short snippets handle key operations like data import, splitting datasets, standardising features, PCA dimensionality reduction, and training SVM classifiers. Perfect for rapid experiments and cleaner code. #Python #DataScience #SoftwareDevelopment #ScikitLearn #AI https://www.kdnuggets.com/10-python-one-liners-for-scikit-learn
-
Discover 10 effective Python one-liners for Scikit-learn that simplify your #MachineLearning tasks. These short snippets handle key operations like data import, splitting datasets, standardising features, PCA dimensionality reduction, and training SVM classifiers. Perfect for rapid experiments and cleaner code. #Python #DataScience #SoftwareDevelopment #ScikitLearn #AI https://www.kdnuggets.com/10-python-one-liners-for-scikit-learn
-
Рынок труда ML-специалистов в 2025 году: востребованные навыки и карьерные треки
В одном из недавних интервью Марк Цукерберг заявил , что к 2025 году искусственный интеллект (ИИ) сможет выполнять большинство задач Middle-разработчиков в Meta (запрещенная в РФ организация). По словам Цукерберга, ИИ уже помогает писать код и постепенно забирает на себя простые инженерные задачи, но хорошие Middle-инженеры все еще будут нужны. Правда при условии, что они будут осваивать новые востребованные технологии. С учетом влияния компании на технологическую повестку во всем мире заявление звучит серьезно: крупные игроки индустрии уже сейчас диктуют направление, в котором будет развиваться рынок труда в связи с масштабированием ИИ — это автоматизация большей части функций и появление новых. В таких условиях многим специалистам придется адаптироваться и прокачивать навыки, чтобы оставаться востребованными на рынке.
https://habr.com/ru/articles/882040/
#машинное_обучение #mlинженер #ai_talent_hub #mlops #разработка_вебсервисов #рынок_труда_it #pytorch #scikitlearn #apache_airflow #postgresql
-
#python #ai #machinelearning
#mlops #realtime #neuralnetwork #scikitlearnContinuous Machine Learning (CML): Basics & Best Practices for Adoption
The systematic way of learning continually from real-time data.
Plot: CML Confusion Matrix
#exploremore 👇
https://medium.com/@alexzap922/continuous-machine-learning-cml-basics-best-practices-for-adoption-257c19fbcbe9?sk=98bf072ddaccccd67ba83686261d8b15 -
#python #ai #machinelearning
#mlops #realtime #neuralnetwork #scikitlearnContinuous Machine Learning (CML): Basics & Best Practices for Adoption
The systematic way of learning continually from real-time data.
Plot: CML Confusion Matrix
#exploremore 👇
https://medium.com/@alexzap922/continuous-machine-learning-cml-basics-best-practices-for-adoption-257c19fbcbe9?sk=98bf072ddaccccd67ba83686261d8b15 -
#python #algorithm #scikitlearn
#machinelearning #artificialintelligence
#technology
#regression
#guide #tutorial
👉 A Comprehensive Guide to 85 Supervised Machine Learning Algorithms in Scikit-Learn — Part 1. Regressors👉 Best Practices in Building & Training ML Models with 51 Regressors (Codes, Plots, and More)
Master all-in-one AI concepts and develop hands-on ML skills with one of the most popular and powerful libraries for ML in Python!
-
#python #algorithm #scikitlearn
#machinelearning #artificialintelligence
#technology
#regression
#guide #tutorial
👉 A Comprehensive Guide to 85 Supervised Machine Learning Algorithms in Scikit-Learn — Part 1. Regressors👉 Best Practices in Building & Training ML Models with 51 Regressors (Codes, Plots, and More)
Master all-in-one AI concepts and develop hands-on ML skills with one of the most popular and powerful libraries for ML in Python!
-
🇫🇷 For the Francophones: Check out this overview of @swheritage + #Scikitlearn in Le Monde: https://archive.is/BRqAo
-
🇫🇷 For the Francophones: Check out this overview of @swheritage + #Scikitlearn in Le Monde: https://archive.is/BRqAo
-
Redressing #Bias: "Correlation Constraints for Regression Models":
Treder et al (2021) https://doi.org/10.3389/fpsyt.2021.615754#dataDev #linearRegression #modeling #probability #probabilities #statistics #stats #modelling #regression #correctionRatio #skLearn #scikitLearn #python #AIDev
-
Redressing #Bias: "Correlation Constraints for Regression Models":
Treder et al (2021) https://doi.org/10.3389/fpsyt.2021.615754#dataDev #linearRegression #modeling #probability #probabilities #statistics #stats #modelling #regression #correctionRatio #skLearn #scikitLearn #python #AIDev
-
https://www.docker.com/blog/supercharging-ai-ml-development-with-jupyterlab-and-docker/ - want to play with #DataScience and #AI? #Jupyter in a #Docker #container is a great way to go. Nice walk-through of #scikitlearn, #matplotlib, and #Python Masahito Zembutsu.
-
@sirber In the market that I am in, there are almost no postings for #php devs but a heck of a lot for #python. I've been exploring #scikitlearn in particular with python because that seems to be getting hot.
-
🔍 Dive into the world of #MachineLearning with our latest guide on scikit-learn's Display API! Say goodbye to complex Matplotlib code and hello to easy, insightful model visualizations. Perfect for beginners! 📊✨
Read more ➡️
https://www.dataleadsfuture.com/scikit-learn-visualization-guide-making-models-speak/ -
📚 My new post has just landed on the Nirpy Research website!
The post is about Robust PCA (Principal Component Analysis), which is an implementation of the PCA algorithm that is robust against outliers in the dataset.
📝 Here are the main takeaway points:
🔸 Outliers in the data can significantly distort the principal components calculated by the standard PCA algorithm.
🔸 The approach based on calculating the eigenvectors of the covariance matrix allows for a robust implementation of PCA by using a robust estimation of the covariance matrix that is less sensitive to outliers.
🔸 In #python and #ScikitLearn, the MinCovDet function can be used to make a robust estimate of the covariance matrix, which can then be used to calculate the principal components in a way that is not affected by outliers.
🔸 The standard deviation estimation itself is not robust to outliers. Therefore, for proper data scaling before #PCA, the robust standard deviation should be calculated using the covariance matrix estimated by the MinCovDet function.
🌐 Check out the post for more info and the Python code
-
anyone know of a FOSS lib equiv to Python's Scikit-learn (sklearn) but in/for Go?
(and to forestall an obvious suggestion which is likely a non-starter for my needs: yes I am aware of idea of wrapping it or otherwise linking out to it from Go, that is my worst case fallback, but avoiding it. ideal is a 100% pure Go source-to-binary solution)
#Golang
#Python
#sklearn
#ScikitLearn
#ML
#stats
#statistics
#math
#FOSS -
Ya está abierto el registro para nuestra reunión de febrero: 🔍 Eficiencia operacional con LLMs y pipelines de scikit-learn, este mes en las oficinas de Adyen
https://www.meetup.com/pydata-madrid/events/299189759/
¡Nos vemos el jueves 22 a las 19:00! Y después, networking 🍻
#PyDataMadrid #PyData #python #ai #llm #scikitlearn #sklearn
-
Ensuring Correct Use of Transformers in Scikit-learn Pipelines. 🧠💻 Streamline your data processing for better, faster results! 🚀 Read more: https://www.dataleadsfuture.com/ensuring-correct-use-of-transformers-in-scikit-learn-pipeline/
#DataScience #AI #ScikitLearn #DataPreprocessing #machinelearning #Python -
📝 "Decision tree"
👤 Jennifer HY Lin (@jhylin)
🔗 https://jhylin.github.io/Data_in_life_blog/posts/16_ML2-1_Decision_tree/3_model_build.html
#pyladies #python #machinelearningprojects #treemodels #pandas #scikitlearn #chembldatabase