home.social

#статистика — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #статистика, aggregated by home.social.

  1. Я спарсил 62 000 Python-вакансий с hh.ru и узнал страшное

    Привет, Хабр! (И тебе, HR, который ставит в вакансию «Python, SQL, Linux, Docker, K8s, Spark, Airflow, английский C1, опыт 1-3 года, зарплата 40-60К». Особенно тебе.) Сегодня будем препарировать рынок Python-разработки в России . По-настоящему. С графиками, цифрами и верой в светлое будущее. Здесь будет всё, зарплаты, актуальные стеки и то что уже никому не нужно, прогнозы, тренды, и многое другое, будет интересно... Поехали.

    habr.com/ru/articles/1036500/

    #python #hhru #анализ_данных #парсинг #рынок_труда #pandas #аналитика #зарплаты #sql #статистика

  2. Я спарсил 62 000 Python-вакансий с hh.ru и узнал страшное

    Привет, Хабр! (И тебе, HR, который ставит в вакансию «Python, SQL, Linux, Docker, K8s, Spark, Airflow, английский C1, опыт 1-3 года, зарплата 40-60К». Особенно тебе.) Сегодня будем препарировать рынок Python-разработки в России . По-настоящему. С графиками, цифрами и верой в светлое будущее. Здесь будет всё, зарплаты, актуальные стеки и то что уже никому не нужно, прогнозы, тренды, и многое другое, будет интересно... Поехали.

    habr.com/ru/articles/1036500/

    #python #hhru #анализ_данных #парсинг #рынок_труда #pandas #аналитика #зарплаты #sql #статистика

  3. Я спарсил 62 000 Python-вакансий с hh.ru и узнал страшное

    Привет, Хабр! (И тебе, HR, который ставит в вакансию «Python, SQL, Linux, Docker, K8s, Spark, Airflow, английский C1, опыт 1-3 года, зарплата 40-60К». Особенно тебе.) Сегодня будем препарировать рынок Python-разработки в России . По-настоящему. С графиками, цифрами и верой в светлое будущее. Здесь будет всё, зарплаты, актуальные стеки и то что уже никому не нужно, прогнозы, тренды, и многое другое, будет интересно... Поехали.

    habr.com/ru/articles/1036500/

    #python #hhru #анализ_данных #парсинг #рынок_труда #pandas #аналитика #зарплаты #sql #статистика

  4. Я спарсил 62 000 Python-вакансий с hh.ru и узнал страшное

    Привет, Хабр! (И тебе, HR, который ставит в вакансию «Python, SQL, Linux, Docker, K8s, Spark, Airflow, английский C1, опыт 1-3 года, зарплата 40-60К». Особенно тебе.) Сегодня будем препарировать рынок Python-разработки в России . По-настоящему. С графиками, цифрами и верой в светлое будущее. Здесь будет всё, зарплаты, актуальные стеки и то что уже никому не нужно, прогнозы, тренды, и многое другое, будет интересно... Поехали.

    habr.com/ru/articles/1036500/

    #python #hhru #анализ_данных #парсинг #рынок_труда #pandas #аналитика #зарплаты #sql #статистика

  5. Доступность товара в «Магните»: от эвристик до CUSUM и GEE-тестов

    Привет, Хабр! Меня зовут Ян Пиле, руковожу в MAGNIT TECH направлением развития алгоритмов доступности товаров. Задача моей команды: сделать так, чтобы в магазине, куда вы зашли за своим любимым майонезом, он с большей вероятностью оказался на полке. А если не оказался — чтобы сотруднику магазина как можно быстрее прилетело задание: «проверь, почему именно этой позиции сейчас нет, и, если возможно, верни её обратно». Мы уже дважды писали про OSA (On-Shelf Availability — уровень доступности товара на полке). В статье «Как OSA превращает пустые полки в полные корзины?» рассказывали про продуктовый контекст: зачем эта история нужна бизнесу и почему «товар числится в системе» и «товар реально лежит на полке» — это два совершенно разных утверждения. А в статье «Когда 0 в продажах — аномалия? CUSUM для поиска проблем в ритейле» мы подробно разбирали один из рабочих алгоритмов команды. В этот раз я хочу пройтись по всему стеку детекции целиком — от самых простых правил до А/Б-тестов, в которых приходится бороться с зависимыми наблюдениями.

    habr.com/ru/companies/magnit/a

    #osa #статистика #доступность #абтесты #cusum #машинное_обучение #магнит #ml #magnit_tech #ритейл

  6. SDET в деле: задачи автоматизаторов на проектах и в чем их отличие от QA Fullstack

    Привет, Хабр! Меня зовут Людмила и я SDET-специалист в компании SimbirSoft. На текущем проекте мне приходится выполнять достаточно большой пул обязанностей, связанных не только с автоматизированным, но и с ручным тестированием. Иногда у меня возникает интересный вопрос: действительно ли для этого проекта требуется роль SDET или же заказчику больше подошел бы QA Fullstack при выборе специалиста по автоматизации? А может быть нужны одновременно и SDET и QA Fullstack? В первую очередь эта статья будет полезна руководителям команд, которые стремятся интегрировать SDET в свой процесс работы, но нуждаются в рекомендациях по первым шагам. Также рекомендую к прочтению данный материал специалистам по тестированию и автоматизации, включая SDET, QAA и QA Fullstack. Читать далее ⚡

    habr.com/ru/companies/simbirso

    #автоматизация_тестирования #sdet #тестирование #qa #qa_automation #автоматизация #менеджмент #процессы #статистика

  7. Метрики упали в лужу

    Метрики могут «упасть» даже если вы ничего не меняли в модели. Разбираемся, как распознать distribution shift и что с ним делать в продакшене.

    habr.com/ru/articles/1024380/

    #eda #анализ_данных #мониторинг #статистика #предобработка_данных #pandas #data_science #machine_learning #data_analysis #production

  8. Доступность товара в «Магните»: от эвристик до CUSUM и GEE-тестов

    Привет, Хабр! Меня зовут Ян Пиле, руковожу в MAGNIT TECH направлением развития алгоритмов доступности товаров. Задача моей команды: сделать так, чтобы в магазине, куда вы зашли за своим любимым майонезом, он с большей вероятностью оказался на полке. А если не оказался — чтобы сотруднику магазина как можно быстрее прилетело задание: «проверь, почему именно этой позиции сейчас нет, и, если возможно, верни её обратно». Мы уже дважды писали про OSA (On-Shelf Availability — уровень доступности товара на полке). В статье «Как OSA превращает пустые полки в полные корзины?» рассказывали про продуктовый контекст: зачем эта история нужна бизнесу и почему «товар числится в системе» и «товар реально лежит на полке» — это два совершенно разных утверждения. А в статье «Когда 0 в продажах — аномалия? CUSUM для поиска проблем в ритейле» мы подробно разбирали один из рабочих алгоритмов команды. В этот раз я хочу пройтись по всему стеку детекции целиком — от самых простых правил до А/Б-тестов, в которых приходится бороться с зависимыми наблюдениями.

    habr.com/ru/companies/magnit/a

    #osa #статистика #доступность #абтесты #cusum #машинное_обучение #магнит #ml #magnit_tech #ритейл

  9. Доступность товара в «Магните»: от эвристик до CUSUM и GEE-тестов

    Привет, Хабр! Меня зовут Ян Пиле, руковожу в MAGNIT TECH направлением развития алгоритмов доступности товаров. Задача моей команды: сделать так, чтобы в магазине, куда вы зашли за своим любимым майонезом, он с большей вероятностью оказался на полке. А если не оказался — чтобы сотруднику магазина как можно быстрее прилетело задание: «проверь, почему именно этой позиции сейчас нет, и, если возможно, верни её обратно». Мы уже дважды писали про OSA (On-Shelf Availability — уровень доступности товара на полке). В статье «Как OSA превращает пустые полки в полные корзины?» рассказывали про продуктовый контекст: зачем эта история нужна бизнесу и почему «товар числится в системе» и «товар реально лежит на полке» — это два совершенно разных утверждения. А в статье «Когда 0 в продажах — аномалия? CUSUM для поиска проблем в ритейле» мы подробно разбирали один из рабочих алгоритмов команды. В этот раз я хочу пройтись по всему стеку детекции целиком — от самых простых правил до А/Б-тестов, в которых приходится бороться с зависимыми наблюдениями.

    habr.com/ru/companies/magnit/a

    #osa #статистика #доступность #абтесты #cusum #машинное_обучение #магнит #ml #magnit_tech #ритейл

  10. Доступность товара в «Магните»: от эвристик до CUSUM и GEE-тестов

    Привет, Хабр! Меня зовут Ян Пиле, руковожу в MAGNIT TECH направлением развития алгоритмов доступности товаров. Задача моей команды: сделать так, чтобы в магазине, куда вы зашли за своим любимым майонезом, он с большей вероятностью оказался на полке. А если не оказался — чтобы сотруднику магазина как можно быстрее прилетело задание: «проверь, почему именно этой позиции сейчас нет, и, если возможно, верни её обратно». Мы уже дважды писали про OSA (On-Shelf Availability — уровень доступности товара на полке). В статье «Как OSA превращает пустые полки в полные корзины?» рассказывали про продуктовый контекст: зачем эта история нужна бизнесу и почему «товар числится в системе» и «товар реально лежит на полке» — это два совершенно разных утверждения. А в статье «Когда 0 в продажах — аномалия? CUSUM для поиска проблем в ритейле» мы подробно разбирали один из рабочих алгоритмов команды. В этот раз я хочу пройтись по всему стеку детекции целиком — от самых простых правил до А/Б-тестов, в которых приходится бороться с зависимыми наблюдениями.

    habr.com/ru/companies/magnit/a

    #osa #статистика #доступность #абтесты #cusum #машинное_обучение #магнит #ml #magnit_tech #ритейл

  11. Как я в одиночку сделал систему аналитики для Clubs в EA FC, потому что нормальной статистики там просто нет

    Начну с контекста. Я играю в EA FC (ранее FIFA) в режиме Clubs (11×11), где каждым виртуальным игроком управляет человек. Сам по себе режим интересный, но мне, как человеку, который любит цифры и аналитику, довольно быстро стало не хватать доступной статистики. Я пришёл в лигу, у которой уже был свой сайт (я в этой статье опущу тему о том, что я администрировал проект порядка 3 лет). Там статистику собирали вручную: люди пересматривали записи матчей и заносили базовые показатели — голы, ассисты, перехваты, отборы и так далее. На основе этих данных считались различные рейтинги: лучшие игроки, бомбардиры, разрушители и прочее. Выглядело это примерно так: набор таблиц, где действия сгруппированы по категориям и амплуа.

    habr.com/ru/articles/1019286/

    #EA_FC #clubs #футбольная_аналитика #статистика #анализ_данны #метрики #nextjs #mysql #петпроект #system_design

  12. Ретроспектива взломов Web3 за 2024 год

    Прошлый год продемонстрировал впечатляющее разнообразие атак на блокчейн-проекты. Хакеры находили способы извлечь выгоду как из уязвимостей смарт-контрактов, так и из ошибок пользователей. Ландшафт угроз оказался чрезвычайно разнообразным. Векторы атак варьировались от относительно простых методов, таких как фишинг и использование вредоносного программного обеспечения для компрометации устройств владельцев кошельков, до более сложных атак, требующих глубокого понимания работы блокчейн-протоколов, например эксплуатации ошибок reentrancy, и знания особенностей некоторых версий контрактов. Меня зовут Елизавета, в настоящее время занимаюсь в Positive Technologies безопасностью блокчейна. В рамках этого обзора хочу познакомить вас с ключевыми трендами из мира безопасности web3 за 2024 год, расскажу про наиболее популярные методы и векторы атак, а также масштабы ущерба для индустрии. Подробнее

    habr.com/ru/companies/pt/artic

    #web3 #блокчейн #defi #кибератаки_в_2024 #криптокошельки #блокчейнпроект #статистика #взломы #evm #bitcoin

  13. Как я построила систему раннего обнаружения падений активности игровых провайдеров

    Стек: Python, Airflow, ClickHouse, Slack В iGaming падение активности игровых провайдеров почти никогда не выглядит как "обрыв". Чаще это медленное затухание: ставок становится меньше, затем еще меньше, игроки уходят постепенно. Формально провайдер продолжает работать, стандартный мониторинг молчит, а бизнес уже теряет деньги. Моя задача была не фиксировать факт полного падения активности, а поймать момент, когда траектория уже направлена вниз, но ситуацию ещё можно развернуть. Вся логика работает внутри DAG в Airflow. Он запускается каждые 6 минут и анализирует активность игровых провайдеров в реальном времени. При обнаружении начала падения или восстановления система отправляет уведомления в Slack.

    habr.com/ru/articles/989586/

    #аналитика_данных #временные_ряды #статистика #анализ_трендов #igaming

  14. Welch's test: он вам не замена Т-test'a

    Привет! С вами команда аналитиков «Пятёрочки» X5 Tech. В данной статье мы расскажем про один из классических тестов в статистике — тест Уэлча (Welch's Test). Постараемся максимально раскрыть, когда и где стоит его применять и является ли он, на самом деле, тестом по умолчанию вместо Т‑test-a.

    habr.com/ru/companies/X5Tech/a

    #abтестирование #abtest #abtesting #abtests #ttest #аналитика #аналитика_данных #аналитика_мобильных_приложений #статистика #статистика_в_it

  15. Welch's test: он вам не замена Т-test'a

    Привет! С вами команда аналитиков «Пятёрочки» X5 Tech. В данной статье мы расскажем про один из классических тестов в статистике — тест Уэлча (Welch's Test). Постараемся максимально раскрыть, когда и где стоит его применять и является ли он, на самом деле, тестом по умолчанию вместо Т‑test-a.

    habr.com/ru/companies/X5Tech/a

    #abтестирование #abtest #abtesting #abtests #ttest #аналитика #аналитика_данных #аналитика_мобильных_приложений #статистика #статистика_в_it

  16. Welch's test: он вам не замена Т-test'a

    Привет! С вами команда аналитиков «Пятёрочки» X5 Tech. В данной статье мы расскажем про один из классических тестов в статистике — тест Уэлча (Welch's Test). Постараемся максимально раскрыть, когда и где стоит его применять и является ли он, на самом деле, тестом по умолчанию вместо Т‑test-a.

    habr.com/ru/companies/X5Tech/a

    #abтестирование #abtest #abtesting #abtests #ttest #аналитика #аналитика_данных #аналитика_мобильных_приложений #статистика #статистика_в_it

  17. Welch's test: он вам не замена Т-test'a

    Привет! С вами команда аналитиков «Пятёрочки» X5 Tech. В данной статье мы расскажем про один из классических тестов в статистике — тест Уэлча (Welch's Test). Постараемся максимально раскрыть, когда и где стоит его применять и является ли он, на самом деле, тестом по умолчанию вместо Т‑test-a.

    habr.com/ru/companies/X5Tech/a

    #abтестирование #abtest #abtesting #abtests #ttest #аналитика #аналитика_данных #аналитика_мобильных_приложений #статистика #статистика_в_it

  18. Propensity Score Matching (PSM): как обойтись без A/B-теста и всё равно узнать правду

    Как определить, влияет ли то или иное событие на ключевые метрики, если полноценный A/B-тест недоступен? В этой статье мы разберём метод Propensity Score Matching (PSM ): узнаем, как компенсировать отсутствие рандомизации, выровнять группы по ключевым признакам и избежать ложных выводов при оценке эффекта.

    habr.com/ru/articles/887276/

    #psm #abtest #mashinelearning #mashine_learning #propensity_score_matching #statistics #машинное_обучение #абтесты #статистика #product

  19. Propensity Score Matching (PSM): как обойтись без A/B-теста и всё равно узнать правду

    Как определить, влияет ли то или иное событие на ключевые метрики, если полноценный A/B-тест недоступен? В этой статье мы разберём метод Propensity Score Matching (PSM ): узнаем, как компенсировать отсутствие рандомизации, выровнять группы по ключевым признакам и избежать ложных выводов при оценке эффекта.

    habr.com/ru/articles/887276/

    #psm #abtest #mashinelearning #mashine_learning #propensity_score_matching #statistics #машинное_обучение #абтесты #статистика #product

  20. Propensity Score Matching (PSM): как обойтись без A/B-теста и всё равно узнать правду

    Как определить, влияет ли то или иное событие на ключевые метрики, если полноценный A/B-тест недоступен? В этой статье мы разберём метод Propensity Score Matching (PSM ): узнаем, как компенсировать отсутствие рандомизации, выровнять группы по ключевым признакам и избежать ложных выводов при оценке эффекта.

    habr.com/ru/articles/887276/

    #psm #abtest #mashinelearning #mashine_learning #propensity_score_matching #statistics #машинное_обучение #абтесты #статистика #product

  21. Propensity Score Matching (PSM): как обойтись без A/B-теста и всё равно узнать правду

    Как определить, влияет ли то или иное событие на ключевые метрики, если полноценный A/B-тест недоступен? В этой статье мы разберём метод Propensity Score Matching (PSM ): узнаем, как компенсировать отсутствие рандомизации, выровнять группы по ключевым признакам и избежать ложных выводов при оценке эффекта.

    habr.com/ru/articles/887276/

    #psm #abtest #mashinelearning #mashine_learning #propensity_score_matching #statistics #машинное_обучение #абтесты #статистика #product

  22. Как делить пользователей на группы в АБ-тестах: ошибки и рекомендации

    В предыдущих статьях статья 1 , статья 2 , статья 3 мы рассмотрели основные подводные камни автоматизации и анализу АБ тестов, привели подробный обзор статей по этой теме, а так же рассмотрели типичные задачи аналитика данных. В контексте АБ-тестов одним из ключевых аспектов является механизм разделения на группы, который в терминологии специалистов часто называется сплитовалкой. Может показаться, что задача элементарная - сгенерировать случайное целое число каждому пользователю с вероятностью 1/n, где n - число групп в АБ тесте. Но на практике, особенно для высоконагруженных сервисов, таких как Ozon , возникает множество архитектурных и платформенных сложностей. В данной статье мы сконцентрируемся на основных принципах деления на группы, принятых в индустрии.

    habr.com/ru/articles/800809/

    #python #psi #сплит #абтесты #abtest #аналитика #статистика

  23. Как делить пользователей на группы в АБ-тестах: ошибки и рекомендации

    В предыдущих статьях статья 1 , статья 2 , статья 3 мы рассмотрели основные подводные камни автоматизации и анализу АБ тестов, привели подробный обзор статей по этой теме, а так же рассмотрели типичные задачи аналитика данных. В контексте АБ-тестов одним из ключевых аспектов является механизм разделения на группы, который в терминологии специалистов часто называется сплитовалкой. Может показаться, что задача элементарная - сгенерировать случайное целое число каждому пользователю с вероятностью 1/n, где n - число групп в АБ тесте. Но на практике, особенно для высоконагруженных сервисов, таких как Ozon , возникает множество архитектурных и платформенных сложностей. В данной статье мы сконцентрируемся на основных принципах деления на группы, принятых в индустрии.

    habr.com/ru/articles/800809/

    #python #psi #сплит #абтесты #abtest #аналитика #статистика

  24. Как делить пользователей на группы в АБ-тестах: ошибки и рекомендации

    В предыдущих статьях статья 1 , статья 2 , статья 3 мы рассмотрели основные подводные камни автоматизации и анализу АБ тестов, привели подробный обзор статей по этой теме, а так же рассмотрели типичные задачи аналитика данных. В контексте АБ-тестов одним из ключевых аспектов является механизм разделения на группы, который в терминологии специалистов часто называется сплитовалкой. Может показаться, что задача элементарная - сгенерировать случайное целое число каждому пользователю с вероятностью 1/n, где n - число групп в АБ тесте. Но на практике, особенно для высоконагруженных сервисов, таких как Ozon , возникает множество архитектурных и платформенных сложностей. В данной статье мы сконцентрируемся на основных принципах деления на группы, принятых в индустрии.

    habr.com/ru/articles/800809/

    #python #psi #сплит #абтесты #abtest #аналитика #статистика

  25. Как делить пользователей на группы в АБ-тестах: ошибки и рекомендации

    В предыдущих статьях статья 1 , статья 2 , статья 3 мы рассмотрели основные подводные камни автоматизации и анализу АБ тестов, привели подробный обзор статей по этой теме, а так же рассмотрели типичные задачи аналитика данных. В контексте АБ-тестов одним из ключевых аспектов является механизм разделения на группы, который в терминологии специалистов часто называется сплитовалкой. Может показаться, что задача элементарная - сгенерировать случайное целое число каждому пользователю с вероятностью 1/n, где n - число групп в АБ тесте. Но на практике, особенно для высоконагруженных сервисов, таких как Ozon , возникает множество архитектурных и платформенных сложностей. В данной статье мы сконцентрируемся на основных принципах деления на группы, принятых в индустрии.

    habr.com/ru/articles/800809/

    #python #psi #сплит #абтесты #abtest #аналитика #статистика

  26. Индекс Шивы: словесный винегрет на 1000 рублей. Встряхнем «рынок лимонов»?

    Новый индекс, свежий взгляд на тексты вакансий. Ничего инновационного: только количество символов и зарплата. Но что на самом деле расскажет загадочный Индекс Шивы ? Сможет ли он стать оружием в этой «игре лимонов»? Анализ почти 50 000 вакансий в неожиданном ракурсе. Возможно, это лишь средство от скуки и бесполезное число. А может — начало чего-то большего. Внутри — формула, графики и ответ на вопрос: имеет ли смысл вообще считать символы в вакансиях?

    habr.com/ru/articles/987274/

    #Индекс_Шивы #анализ_данных #рынок_труда #HRtech #статистика #зарплаты_в_IT #поиск_работы #анализ_вакансий #токсичность #управление_разработкой

  27. Почему в высшей лиге технологий и политики так много Евреев?

    OpenAI, Google, представители Конгресса США, миллиардеры. Как малочисленному народу удалось добиться высот и занимать львиный процент “верхушек мира” несмотря на 2000 лет гонений? Попробуем разобраться без теорий заговора: через историю и контекст методики еврейского обучения, а также вернемся в Россию 90-ых.

    habr.com/ru/articles/977556/

    #Социология #Экономика #Человеческий_капитал #Статистика #Финансы #Еврейский_феномен #История_экономики #александр_столыпин #iposharks #sp500

  28. Почему в высшей лиге технологий и политики так много Евреев?

    OpenAI, Google, представители Конгресса США, миллиардеры. Как малочисленному народу удалось добиться высот и занимать львиный процент “верхушек мира” несмотря на 2000 лет гонений? Попробуем разобраться без теорий заговора: через историю и контекст методики еврейского обучения, а также вернемся в Россию 90-ых.

    habr.com/ru/articles/977556/

    #Социология #Экономика #Человеческий_капитал #Статистика #Финансы #Еврейский_феномен #История_экономики #александр_столыпин #iposharks #sp500

  29. Почему в высшей лиге технологий и политики так много Евреев?

    OpenAI, Google, представители Конгресса США, миллиардеры. Как малочисленному народу удалось добиться высот и занимать львиный процент “верхушек мира” несмотря на 2000 лет гонений? Попробуем разобраться без теорий заговора: через историю и контекст методики еврейского обучения, а также вернемся в Россию 90-ых.

    habr.com/ru/articles/977556/

    #Социология #Экономика #Человеческий_капитал #Статистика #Финансы #Еврейский_феномен #История_экономики #александр_столыпин #iposharks #sp500

  30. Почему в высшей лиге технологий и политики так много Евреев?

    OpenAI, Google, представители Конгресса США, миллиардеры. Как малочисленному народу удалось добиться высот и занимать львиный процент “верхушек мира” несмотря на 2000 лет гонений? Попробуем разобраться без теорий заговора: через историю и контекст методики еврейского обучения, а также вернемся в Россию 90-ых.

    habr.com/ru/articles/977556/

    #Социология #Экономика #Человеческий_капитал #Статистика #Финансы #Еврейский_феномен #История_экономики #александр_столыпин #iposharks #sp500

  31. #клавиатуры #статистика #вопрос #опрос #длиннопост #лытдыбр #гаджеты

    Исторически сложилось, что, заполняя (не)нужным софтом память своего первого девайса на #Android (а я до последнего с Нокией ходил, та что сразу взял Highscreen Boost, аппарат 🔥 по тем временам), попалась на глаза клавиатура #MessagEase, да, необычно, да, нужно долго привыкать, но бонус в виде возможности печатать текст одним пальцем (5,5’’ помещается таки в одной руке) перевешивал все трудности; о скорости я не задумывался: в описании упоминали «рекорд 400 зн./мин.» 😉

    С переходом на лопаты 6,66’’ и #ThumbKey (потому что клавиатура по подписке¹ — это дичь, опенсорц рулез!) встал вопрос целесообразности. Потому что управляться с аппаратом одной рукой уже непросто, а глядя на деффачек (с 3-сантиметровыми ногтями), лихо что-то строчащих в чятике двумя пальчиками, возникает подозрение², что и не предусмотрено...

    На десктопной клавиатуре моя комфортная скорость ~ 275 зн./мин. слепым десятипальцевым методом. Да, не рекорд и даже «не много», но я и не тороплюсь никуда обычно. Сам факт слепого набора (не полностью, правда, освоенного) дает офигенные плюсы по удобству.

    А вот результаты на смартфоне прямо удручающие. Аппов именно для тестирования скорости не так много, вменяемых среди них еще меньше. И вот по результатам TypeGo максиум, который удалось получить, это ~130 зн./мин. (автокоррекцией/дополнением не пользуюсь, и есть подозрение, что слова с ошибками она не учитывает #НоЭтоНеточно). Груздь-печаль. Потому что в переводе в слова-в-минуту это всего 33, тогда как исследования показывают, что 38 — это среднее (для двухпальцевого набора на QWERTY.

    Лучшим предиктором производительности является тот факт, использует человек один палец или два больших пальца для ввода. Более 74% людей печатают двумя большими пальцами, и очень заметно увеличение скорости в таком случае. Исследование также показало, что включение автоматической коррекции слов даёт явное преимущество, в то время как предсказание слов или ручной выбор предложенных вариантов не даёт.

    🙁

    И уж совсем депрессивно звучит, что

    У подростков средняя скорость составила около 40 WPM, а у поколения 40- и 50-летних — 29 и 26 WPM, соответственно.

    Добро пожаловать клуб старпёров...

    P.S. У ThumbKey, кстати, есть весьма неприятная особенность: если печатать не [полу]слепым методом, т.е. смотреть на клаву, а не в текст, то промахнувшись мимо первой буквы с большой вероятностью запорешь последующие.

    ¹ Ага, разрабы MessagEase захотели денег, но не просто «заплати», а каждый месяц. При том, что в самой клавиатуре меняется только номер версии и то потому, что этого требует Play Market.

    ² Да, проезжая мимо станции, у меня иногда слетает шляпа 😆

    Собственно, опрос

    Вы печатаете на смартфоне:

    @rf
    @rur
    @Russia
    @russian_mastodon

  32. Что слепой знает о мире? Большие языковые модели и география

    Изображение выше принято рекомендовать как древнюю карту мира римского географа Помпония Мелы. Это не совсем так. Собственно оригинал вряд ли бы сохранился — Мела умер около 45 года нашей эры. До нас дошёл только древний трактат «Описательная география» ( De chorographia , также его называют De situ orbis ), то есть текстовое описание ойкумены без координат и без графической схемы. Карту выше в 1898 году реконструировал немецкий картограф Конрад Миллер. Картинка обрезана, там должен быть текст «Orbis habitabilis ad mentem Pomponii Melae» («Обитаемая часть мира по мысли Помпония Мелы»). Лист с картой вышел в шестом выпуске серии Миллера « Mappae mundi . Древнейшие карты мира» (Mappaemundi. Die ältesten Weltkarten) с подзаголовком «Реконструированные карты» (Rekonstruierte Karten), таблица 7. Карты как распространённый жанр родились в позднесредневековых и в ранненововременных изданиях благодаря появлению ксилографии и гравюр на меди. Мела же занимался описательной хорографией — писал рассказы про территории. Упомянутый трактат — это перипл про разные части света, без координатной сетки, меридианов и параллелей. Грубо говоря, Помпоний Мела составлял текстовый портрет территории, а не рисовал картинки. Как же из этого получился вот этот рисунок?

    habr.com/ru/articles/942718/

    #большие_языковые_модели #БЯМ #GPT4 #география #OpenAI #исследования #карты #Земля #статистика #бенчмарки

  33. Системы ценностей больших языковых моделей

    Каждый раз, когда человечество создаёт очередной инструмент на машинном обучении, оно сперва любуется пользой от его работы, а потом пугается своего отражения внутри. С большими языковыми моделями история повторилась с ускорением. От восторга перед ответами ChatGPT до шока от таблиц, где жизнь человека глубоко неравноценна, прошло меньше двух лет. Звучит странно, но языковые модели предвзяты. У них есть политические взгляды, любимые расы и даже люди, которыми они не прочь пожертвовать. Но обо всём по порядку.

    habr.com/ru/articles/932986/

    #большие_языковые_модели #БЯМ #этика #ценности #исследования #научные_исследования #машинное_обучение #ChatGPT #этические_ценности #статистика

  34. Leaderboard Illusion: что не так с Chatbot Arena

    Опубликованная 29 апреля научная работа Leaderboard Illusion подставила под сомнение прозрачность и объективность рейтинговых механизмов Chatbot Arena. Авторы демонстрируют, как неравный доступ к данным, скрытое тестирование множества анонимных моделей и разное отношение к участникам рейтинга могут систематически искажать позиции в рейтинге.

    habr.com/ru/articles/906326/

    #статистика #бенчмарки_ИИ #бенчмарки #Chatbot_Arena #большие_языковые_модели #БЯМ #научные_публикации #конфликты #пиар #завышенные_ожидания

  35. До 5 % новых статей «Википедии» содержат тексты от ИИ

    Исследователи Принстонского университета оценили новые статьи «Википедии» на «машинность». Сравнение до и после распространения больших языковых моделей показало, что почти 5 % материалов на английском языке содержат значительные объёмы текста, который писал искусственный интеллект. В других языковых разделах этот показатель ниже, но явление выражено и там.

    habr.com/ru/articles/883386/

    #Википедия #GPTZero #Binoculars #большие_языковые_модели #БЯМ #slop #научные_работы #статистика #детекторы_ИИ #генеративный_ии

  36. Исследование: генеративный ИИ повышает производительность труда разработчиков на 26,08 %

    Исследовательская работа утверждает , что использование инструментов с искусственным интеллектом помогает разработчикам выполнять на 26,08 % больше задач. На тысячах разработчиков из Microsoft, Accenture и некой анонимной компании проводили эксперимент: примерно половине сотрудников выдали доступ к Copilot, а другим пользоваться инструментом не разрешали. Сравнение данных двух групп говорит о положительном эффекте от написания кода с помощью искусственного интеллекта.

    habr.com/ru/articles/844850/

    #программирование #GitHub_Copilot #GPT35 #GPT4 #БЯМ #большие_языковые_модели #автодополнение_кода #исследования #статистика #Microsoft

  37. #Mastodon #MastodonTools #статистика

    О. ВНЕЗАПНО! заработал снова очень интересный сервис:

    mastometrics.com

    Анализирует ваш аккаунт, показывает наиболее «взлетевшие» посты, но это не самая нужная функция. Еще он умеет мониторить активность ваших подписчиков и выводит список людей, которые наиболее активно вас лайкают, бустят и комментируют. (Внимание, анализ происходит на основе списка уведомлений, так что если вы его чистите — может быть неточным!)

    Конечно, реальной практической пользы с этого примерно ноль, но посмотреть очень интересно :-)
    mastometrics.com

  38. #Mastodon #MastodonTools

    В общем, раз у нас нет алгоритмической ленты, то ее стоит придумать. Ибо советы типа «ищите интересное в глобалке» работают хреново без статистики. Поэтому, просматривая бота @rur, который на моем сервере и «делает» глобалку, ставил лайки всем подряд всем сколько-нибудь зацепившим постам.

    Потом сел думать, что с этим делать. Запросил архив, загрузил в MARL - Mastodon Archive Reader Lite, очень хороший просмотрщик слоноархива прямо в бравузере, помимо прочего показывает ваши лайки в пригодном для парсинга формате (в .json лежат тупо URL'ы постов). Правда, это касается только Mastodon-инстансов, посты с других площадок, к сожалению, остались безымянными, т.к. не включают username в URL (ну, #Pixelfed вроде можно разобрать, но попозже).

    Дальше интересно, кстати, было. Поскольку я не погромист, у меня были F12, #Notepad++, #Excel и подозрение, что придется виброкодить. #ChatGPT на запрос #REGEXP'а выродила нечто с виду рабочее, но не в Notepad++. Извинялась, потом пыталась брехать и менсплейнила настройки, но... Не судьба. #Grok справился с первой попытки и еще подсказал, что в Excel #статистика удобно подбвается через «сводную таблицу», буду знать.

    В общем, подписался на всех, кого лайкал 2+ раз и добавил их в отдельный список. И туда же — тех, кто часто лайкает/бустит меня, это можно посмотреть через сервис MastoMetrics, тоже полезная штука. Потом убрал лишних ботов вроде «лисичка каждый час», и вот смотрю, что получилось.

    На первый взгляд, много англоязычного (и мунспика), бустов (в списках их нельзя вырубить, в отличие от домашки) и в целом «кто все эти люди?», но вроде же так и должна выглядеть алгоритмическая лента, не? 😉

  39. Хостинг-панели с открытым и закрытым кодом. Какие решения выбирают клиенты?

    Какие панели управления хостингом действительно востребованы у клиентов? Мы проанализировали реальные заказы на серверы и сравнили популярные решения — от бесплатных FASTPANEL и CyberPanel до платных ispmanager, cPanel и Plesk. Подробная статистика, сравнение функционала и цен ждут вас в статье.

    habr.com/ru/companies/hostkey/

    #хостингпанель #статистика #FASTPANEL #cyberpanel #cpanel #plesk #ispmanager #opensourse #hostkey

  40. Хостинг-панели с открытым и закрытым кодом. Какие решения выбирают клиенты?

    Какие панели управления хостингом действительно востребованы у клиентов? Мы проанализировали реальные заказы на серверы и сравнили популярные решения — от бесплатных FASTPANEL и CyberPanel до платных ispmanager, cPanel и Plesk. Подробная статистика, сравнение функционала и цен ждут вас в статье.

    habr.com/ru/companies/hostkey/

    #хостингпанель #статистика #FASTPANEL #cyberpanel #cpanel #plesk #ispmanager #opensourse #hostkey

  41. Почему цена на рынке падает одной свечой

    ⛔ Почему цена на рынке падает одной свечой В 2026 году «купил и держал» это ставка на то, что выдержишь -40…-70% просадку без эмоционального или маржинального выхода. Рынок стал хрупким: каскады ликвидаций случаются несколько раз в год. Статичный холд больше не работает. Разбираю математику падения

    habr.com/ru/articles/996876/

    #криптовалюты #bitcoin #binance #опционы #акции #трейдинг #машинное_обучение #статистика #искусственный_интеллект

  42. Изучение статистических закономерностей на примере измерения фона космического излучения

    Цель работы : на примере статистики регистрации фоновых космических частиц изучить статистические закономерности однородного во времени случайного процесса; проверить возможность описания исследуемого процесса статистическими законами Пуассона и Гаусса; измерить среднее число регистрируемых космических лучей в секунду и определить погрешность результата. Оборудование : счётчик Гейгера—Мюллера, компьютер с интерфейсом для связи со счётчиком, расчётная программа.

    habr.com/ru/articles/847858/

    #физические_эксперименты #mipt #python #физика #статистика #распределение_пуассона #распределение_гаусса

  43. JavaScript: структуры данных и алгоритмы. Часть 11

    Привет, друзья! В этой серии статей мы разбираем структуры данных и алгоритмы, представленные в этом замечательном репозитории . Это одиннадцатая часть серии. Сегодня мы рассмотрим несколько простых, но интересных алгоритмов машинного обучения, а также один весьма любопытный статистический алгоритм. Код, представленный в этой и других статьях серии, можно найти в этом репозитории . Интересно? Тогда прошу под кат.

    habr.com/ru/companies/timeweb/

    #timeweb_статьи #javascript #algorithms #data_structures #алгоритмы #структуры_данных #machine_learning #statistics #машинное_обучение #статистика

  44. Аналитика кибератак от Google

    Компания Mandiant (дочка Google) подготовила довольно интересное исследование кибератак. Отчет основан на 500 тысячах часов расследований кибератак , проведенных Mandiant в 2025. Делимся с вами подробностями.

    habr.com/ru/companies/infowatc

    #mandiant #google #ИБ #инфобез #статистика #информационная_безопасность

  45. Как сделать интерактивную панель для отправки SMS

    Сегодня разработаем панель, через которую сможем отправлять SMS сразу нескольким адресатам, получать их ответы и видеть статистику по отправленным сообщениям через календарь и график. Будем использовать Next.js, Shadcn для интерфейса и

    habr.com/ru/companies/exolve/a

    #nextjs #shadcn/ui #smsсервис #sms_api #typescript #статистика #интерактивная_панель

  46. Планы по блокировке крупных VPN-сервисов в России

    В понедельник, глава Лиги безопасного интернета Екатерина Мизулина объявила о намерении заблокировать крупные VPN-сервисы в России, начиная с 1 марта. По ее мнению, VPN-сервисы, позволяющие обходить блокировки сайтов в России, представляют собой "портал в ад". Она выразила обеспокоенность тем, что использование таких приложений создает уязвимость, через которую личные данные могут попасть в руки мошенников и других злоумышленников.

    Мизулина подчеркнула, что полностью блокировать VPN, прокси и анонимайзеры в России технически невозможно, так как опытные пользователи могут легко создать свои собственные прокси-серверы. Она предостерегла от использования подобных приложений с точки зрения личной безопасности.

    Зампред Совета по развитию цифровой экономики при Совете Федерации, сенатор Артем Шейкин, предупреждал о предстоящей блокировке VPN-приложений еще в октябре. По его словам, с марта 2024 года Роскомнадзор начнет блокировку VPN-сервисов во всех маркетах. Особое внимание будет уделено блокировке доступа россиян к сервисам американской компании Meta, владеющей соцсетями Facebook и Instagram.

    Статистика показывает, что около 20% граждан России используют VPN, согласно опросу, проведенному компанией NORC при Чикагском университете. Кроме того, данные международной исследовательской компании data.ai указывают на рост популярности VPN-сервисов: при общем увеличении скачиваний приложений в России на 1%, категория VPN-сервисов выросла на 3%, достигнув 160 миллионов загрузок в Google Play и App Store.

    #Россия #Интернет #VPN #ЦифроваяБезопасность #Законодательство #Мизулина #Роскомнадзор #Meta #Facebook #Instagram #Блокировка #Приватность #ЛигаБезопасногоИнтернета #Сенатор #АртемШейкин #GooglePlay #AppStore #СоциальныеСети #МеждународноеИсследование #Статистика #Опрос #DataAI