home.social

#pandasprofiling — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #pandasprofiling, aggregated by home.social.

  1. Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками

    Привет! Если после заголовка вы решили, что это очередная статья в стиле «Топ-10 способов ускорить Pandas», то не торопитесь с выводами. Вместо топов и подборок предлагаю взглянуть на бенчмарки скорости и потребления памяти в зависимости от характеристик датафрейма и убедиться, что часть советов из статей по ускорению могут оказаться даже вредными. Разберём, какой из способов ускорения нужно пробовать в разных ситуациях, как это зависит от размера датафрейма и как ведёт себя в реальном проекте.

    habr.com/ru/companies/tochka/a

    #pandasprofiling #pandas #pandas_multiindex #dataprocessing #data_pipelines

  2. Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками

    Привет! Если после заголовка вы решили, что это очередная статья в стиле «Топ-10 способов ускорить Pandas», то не торопитесь с выводами. Вместо топов и подборок предлагаю взглянуть на бенчмарки скорости и потребления памяти в зависимости от характеристик датафрейма и убедиться, что часть советов из статей по ускорению могут оказаться даже вредными. Разберём, какой из способов ускорения нужно пробовать в разных ситуациях, как это зависит от размера датафрейма и как ведёт себя в реальном проекте.

    habr.com/ru/companies/tochka/a

    #pandasprofiling #pandas #pandas_multiindex #dataprocessing #data_pipelines

  3. Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками

    Привет! Если после заголовка вы решили, что это очередная статья в стиле «Топ-10 способов ускорить Pandas», то не торопитесь с выводами. Вместо топов и подборок предлагаю взглянуть на бенчмарки скорости и потребления памяти в зависимости от характеристик датафрейма и убедиться, что часть советов из статей по ускорению могут оказаться даже вредными. Разберём, какой из способов ускорения нужно пробовать в разных ситуациях, как это зависит от размера датафрейма и как ведёт себя в реальном проекте.

    habr.com/ru/companies/tochka/a

    #pandasprofiling #pandas #pandas_multiindex #dataprocessing #data_pipelines

  4. Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками

    Привет! Если после заголовка вы решили, что это очередная статья в стиле «Топ-10 способов ускорить Pandas», то не торопитесь с выводами. Вместо топов и подборок предлагаю взглянуть на бенчмарки скорости и потребления памяти в зависимости от характеристик датафрейма и убедиться, что часть советов из статей по ускорению могут оказаться даже вредными. Разберём, какой из способов ускорения нужно пробовать в разных ситуациях, как это зависит от размера датафрейма и как ведёт себя в реальном проекте.

    habr.com/ru/companies/tochka/a

    #pandasprofiling #pandas #pandas_multiindex #dataprocessing #data_pipelines

  5. Pandas profiling is a #Python module with which we can quickly do an #ExploratoryDataAnalysis with just a few lines of code:

    from pandas_profiling import ProfileReport
    report = ProfileReport(df_titanic)
    report. to_file(output_file='report.html')

    #EDA #DataScience #DataViz #DataMining #PandasProfiling

  6. Pandas profiling is a module with which we can quickly do an with just a few lines of code:

    from pandas_profiling import ProfileReport
    report = ProfileReport(df_titanic)
    report. to_file(output_file='report.html')