home.social

#dataframe — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #dataframe, aggregated by home.social.

  1. Oh look, another "groundbreaking" #blog post about #DuckDB from a self-proclaimed data wizard. 🙄 Apparently, the limitations of basic text queries are just too much for our hero, who bravely delves into the wild world of Full-Text Search. 🌟 Spoiler alert: it's as thrilling as watching paint dry on a data frame. 🥱
    peterdohertys.website/blog-pos #DataWizard #FullTextSearch #DataFrame #HackerNews #ngated

  2. Oh look, another "groundbreaking" #blog post about #DuckDB from a self-proclaimed data wizard. 🙄 Apparently, the limitations of basic text queries are just too much for our hero, who bravely delves into the wild world of Full-Text Search. 🌟 Spoiler alert: it's as thrilling as watching paint dry on a data frame. 🥱
    peterdohertys.website/blog-pos #DataWizard #FullTextSearch #DataFrame #HackerNews #ngated

  3. Oh look, another "groundbreaking" #blog post about #DuckDB from a self-proclaimed data wizard. 🙄 Apparently, the limitations of basic text queries are just too much for our hero, who bravely delves into the wild world of Full-Text Search. 🌟 Spoiler alert: it's as thrilling as watching paint dry on a data frame. 🥱
    peterdohertys.website/blog-pos #DataWizard #FullTextSearch #DataFrame #HackerNews #ngated

  4. Oh look, another "groundbreaking" #blog post about #DuckDB from a self-proclaimed data wizard. 🙄 Apparently, the limitations of basic text queries are just too much for our hero, who bravely delves into the wild world of Full-Text Search. 🌟 Spoiler alert: it's as thrilling as watching paint dry on a data frame. 🥱
    peterdohertys.website/blog-pos #DataWizard #FullTextSearch #DataFrame #HackerNews #ngated

  5. Oh look, another "groundbreaking" #blog post about #DuckDB from a self-proclaimed data wizard. 🙄 Apparently, the limitations of basic text queries are just too much for our hero, who bravely delves into the wild world of Full-Text Search. 🌟 Spoiler alert: it's as thrilling as watching paint dry on a data frame. 🥱
    peterdohertys.website/blog-pos #DataWizard #FullTextSearch #DataFrame #HackerNews #ngated

  6. Giới thiệu các tính năng độc đáo của thư viện C++ DataFrame dành cho phân tích dữ liệu hiệu năng cao. Đây là công cụ mã nguồn mở mạnh mẽ, hỗ trợ xử lý dữ liệu dạng bảng (table), chuỗi thời gian (time-series) với tốc độ vượt trội của C++. Thư viện cung cấp nhiều thuật toán thống kê, tài chính và khả năng thao tác dữ liệu linh hoạt tương tự như Pandas nhưng tối ưu hơn về bộ nhớ.

    #Cpp #DataFrame #OpenSource #Programming #DataAnalysis #LapTrinh #PhanTichDuLieu #MaNguonMo

    reddit.com/r/o

  7. Spark Connect. А нужны ли перемены?

    Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. Apache Spark давно и прочно занял место одного из ключевых инструментов в арсенале инженеров и дата-сайентистов, работающих с большими данными. Его способность быстро обрабатывать огромные объёмы информации, гибкость за счёт поддержки множества языков (Python, Scala, Java, SQL) и возможность решать самые разнообразные задачи — от сложных ETL до машинного обучения и стриминга — делают его незаменимым инструментом в мире анализа данных.

    habr.com/ru/companies/arenadat

    #spark_connect #apache #datalake #lakehouse #платформа_данных #bigdata #dataframe #интеграция_сервисов #apache_arrow #spark

  8. Spark Connect. А нужны ли перемены?

    Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. Apache Spark давно и прочно занял место одного из ключевых инструментов в арсенале инженеров и дата-сайентистов, работающих с большими данными. Его способность быстро обрабатывать огромные объёмы информации, гибкость за счёт поддержки множества языков (Python, Scala, Java, SQL) и возможность решать самые разнообразные задачи — от сложных ETL до машинного обучения и стриминга — делают его незаменимым инструментом в мире анализа данных.

    habr.com/ru/companies/arenadat

    #spark_connect #apache #datalake #lakehouse #платформа_данных #bigdata #dataframe #интеграция_сервисов #apache_arrow #spark

  9. Spark Connect. А нужны ли перемены?

    Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. Apache Spark давно и прочно занял место одного из ключевых инструментов в арсенале инженеров и дата-сайентистов, работающих с большими данными. Его способность быстро обрабатывать огромные объёмы информации, гибкость за счёт поддержки множества языков (Python, Scala, Java, SQL) и возможность решать самые разнообразные задачи — от сложных ETL до машинного обучения и стриминга — делают его незаменимым инструментом в мире анализа данных.

    habr.com/ru/companies/arenadat

    #spark_connect #apache #datalake #lakehouse #платформа_данных #bigdata #dataframe #интеграция_сервисов #apache_arrow #spark

  10. Spark Connect. А нужны ли перемены?

    Привет, Хабр! Я Станислав Габдулгазиев, архитектор департамента поддержки продаж Arenadata. Apache Spark давно и прочно занял место одного из ключевых инструментов в арсенале инженеров и дата-сайентистов, работающих с большими данными. Его способность быстро обрабатывать огромные объёмы информации, гибкость за счёт поддержки множества языков (Python, Scala, Java, SQL) и возможность решать самые разнообразные задачи — от сложных ETL до машинного обучения и стриминга — делают его незаменимым инструментом в мире анализа данных.

    habr.com/ru/companies/arenadat

    #spark_connect #apache #datalake #lakehouse #платформа_данных #bigdata #dataframe #интеграция_сервисов #apache_arrow #spark

  11. Polars — «убийца Pandas» на максималках

    Всем привет! Меня зовут Александр Андреев, я инженер данных. Сегодня я хочу рассказать вам о библиотеке Polars - потенциальной замене Pandas, любимой у большинства дата-инженеров и дата-саентистов библиотеки для работы с данными. В своей статье я последовательно пройдусь от истории библиотеки Polars до примеров кода, технических аспектов ее производительности и в конце дам ссылки на все бенчмарки, обучающие материалы и дополнительные статьи, которые использовались для написания данного обзора-туториала по этой замечательной библиотеке.

    habr.com/ru/articles/946788/

    #polars #pandas #data_engineering #data_science #data_analysis #dataframe #library #python #rust #dataset

  12. Polars — «убийца Pandas» на максималках

    Всем привет! Меня зовут Александр Андреев, я инженер данных. Сегодня я хочу рассказать вам о библиотеке Polars - потенциальной замене Pandas, любимой у большинства дата-инженеров и дата-саентистов библиотеки для работы с данными. В своей статье я последовательно пройдусь от истории библиотеки Polars до примеров кода, технических аспектов ее производительности и в конце дам ссылки на все бенчмарки, обучающие материалы и дополнительные статьи, которые использовались для написания данного обзора-туториала по этой замечательной библиотеке.

    habr.com/ru/articles/946788/

    #polars #pandas #data_engineering #data_science #data_analysis #dataframe #library #python #rust #dataset

  13. Polars — «убийца Pandas» на максималках

    Всем привет! Меня зовут Александр Андреев, я инженер данных. Сегодня я хочу рассказать вам о библиотеке Polars - потенциальной замене Pandas, любимой у большинства дата-инженеров и дата-саентистов библиотеки для работы с данными. В своей статье я последовательно пройдусь от истории библиотеки Polars до примеров кода, технических аспектов ее производительности и в конце дам ссылки на все бенчмарки, обучающие материалы и дополнительные статьи, которые использовались для написания данного обзора-туториала по этой замечательной библиотеке.

    habr.com/ru/articles/946788/

    #polars #pandas #data_engineering #data_science #data_analysis #dataframe #library #python #rust #dataset

  14. Polars — «убийца Pandas» на максималках

    Всем привет! Меня зовут Александр Андреев, я инженер данных. Сегодня я хочу рассказать вам о библиотеке Polars - потенциальной замене Pandas, любимой у большинства дата-инженеров и дата-саентистов библиотеки для работы с данными. В своей статье я последовательно пройдусь от истории библиотеки Polars до примеров кода, технических аспектов ее производительности и в конце дам ссылки на все бенчмарки, обучающие материалы и дополнительные статьи, которые использовались для написания данного обзора-туториала по этой замечательной библиотеке.

    habr.com/ru/articles/946788/

    #polars #pandas #data_engineering #data_science #data_analysis #dataframe #library #python #rust #dataset

  15. I was annoyed that there is no "expand_grid()" function in :python: #Python as in :rstats: #RStats #tidyverse

    So I just published a small package on #PyPI !

    Introducing polarsgrid
    pypi.org/project/polarsgrid/

    Using the excellent #polars 🐻‍❄️ package, easily create a table with product of factors:

    from polarsgrid import expand_grid
    expand_grid(a=[1, 2, 3], b=["x", "y"])

    Yields all combinations of its inputs as a #DataFrame

    It can also produce a #LazyFrame for streaming extra-big tables to disk

  16. I was annoyed that there is no "expand_grid()" function in :python: as in :rstats:

    So I just published a small package on !

    Introducing polarsgrid
    pypi.org/project/polarsgrid/

    Using the excellent 🐻‍❄️ package, easily create a table with product of factors:

    from polarsgrid import expand_grid
    expand_grid(a=[1, 2, 3], b=["x", "y"])

    Yields all combinations of its inputs as a

    It can also produce a for streaming extra-big tables to disk

  17. I was annoyed that there is no "expand_grid()" function in :python: #Python as in :rstats: #RStats #tidyverse

    So I just published a small package on #PyPI !

    Introducing polarsgrid
    pypi.org/project/polarsgrid/

    Using the excellent #polars 🐻‍❄️ package, easily create a table with product of factors:

    from polarsgrid import expand_grid
    expand_grid(a=[1, 2, 3], b=["x", "y"])

    Yields all combinations of its inputs as a #DataFrame

    It can also produce a #LazyFrame for streaming extra-big tables to disk

  18. I was annoyed that there is no "expand_grid()" function in :python: #Python as in :rstats: #RStats #tidyverse

    So I just published a small package on #PyPI !

    Introducing polarsgrid
    pypi.org/project/polarsgrid/

    Using the excellent #polars 🐻‍❄️ package, easily create a table with product of factors:

    from polarsgrid import expand_grid
    expand_grid(a=[1, 2, 3], b=["x", "y"])

    Yields all combinations of its inputs as a #DataFrame

    It can also produce a #LazyFrame for streaming extra-big tables to disk

  19. I was annoyed that there is no "expand_grid()" function in :python: #Python as in :rstats: #RStats #tidyverse

    So I just published a small package on #PyPI !

    Introducing polarsgrid
    pypi.org/project/polarsgrid/

    Using the excellent #polars 🐻‍❄️ package, easily create a table with product of factors:

    from polarsgrid import expand_grid
    expand_grid(a=[1, 2, 3], b=["x", "y"])

    Yields all combinations of its inputs as a #DataFrame

    It can also produce a #LazyFrame for streaming extra-big tables to disk

  20. Nuevo post en el blog de #juncotic! 💪

    Seguimos con #python de la mano de @andrea_navarro

    ¿Han usado #Pandas para trabajar con datos?

    Hoy Andrea nos explica cómo usarlo para ordenar columnas de un DataFrame, con ejemplos prácticos, y un CSV descargable para jugar con los datos 😃

    Pueden leerlo acá: 👇

    juncotic.com/ordenamiento-de-c

    Espero que les guste y sirva! 🙂

    #python #pandas #dataframe #datascience #data

  21. Nuevo post en el blog de #juncotic! 💪

    Seguimos con #python de la mano de @andrea_navarro

    ¿Han usado #Pandas para trabajar con datos?

    Hoy Andrea nos explica cómo usarlo para ordenar columnas de un DataFrame, con ejemplos prácticos, y un CSV descargable para jugar con los datos 😃

    Pueden leerlo acá: 👇

    juncotic.com/ordenamiento-de-c

    Espero que les guste y sirva! 🙂

    #python #pandas #dataframe #datascience #data

  22. Nuevo post en el blog de #juncotic! 💪

    Seguimos con #python de la mano de @andrea_navarro

    ¿Han usado #Pandas para trabajar con datos?

    Hoy Andrea nos explica cómo usarlo para ordenar columnas de un DataFrame, con ejemplos prácticos, y un CSV descargable para jugar con los datos 😃

    Pueden leerlo acá: 👇

    juncotic.com/ordenamiento-de-c

    Espero que les guste y sirva! 🙂

    #python #pandas #dataframe #datascience #data

  23. Nuevo post en el blog de #juncotic! 💪

    Seguimos con #python de la mano de @andrea_navarro

    ¿Han usado #Pandas para trabajar con datos?

    Hoy Andrea nos explica cómo usarlo para ordenar columnas de un DataFrame, con ejemplos prácticos, y un CSV descargable para jugar con los datos 😃

    Pueden leerlo acá: 👇

    juncotic.com/ordenamiento-de-c

    Espero que les guste y sirva! 🙂

    #python #pandas #dataframe #datascience #data

  24. Nuevo post en el blog de #juncotic! 💪

    Seguimos con #python de la mano de @andrea_navarro

    ¿Han usado #Pandas para trabajar con datos?

    Hoy Andrea nos explica cómo usarlo para ordenar columnas de un DataFrame, con ejemplos prácticos, y un CSV descargable para jugar con los datos 😃

    Pueden leerlo acá: 👇

    juncotic.com/ordenamiento-de-c

    Espero que les guste y sirva! 🙂

    #python #pandas #dataframe #datascience #data

  25. I've talked about creating data.frames and tibbles before, but it is an important topic so I have covered it again. This time specifically from the perspective of creating them from vectors. Post: www.spsanderson.com/steveondata/... #R #RStats #tibble #dplyr #tidyverse #dataframe #baseR #blog

  26. I've talked about creating data.frames and tibbles before, but it is an important topic so I have covered it again. This time specifically from the perspective of creating them from vectors. Post: www.spsanderson.com/steveondata/... #R #RStats #tibble #dplyr #tidyverse #dataframe #baseR #blog

  27. I've talked about creating data.frames and tibbles before, but it is an important topic so I have covered it again. This time specifically from the perspective of creating them from vectors. Post: www.spsanderson.com/steveondata/... #R #RStats #tibble #dplyr #tidyverse #dataframe #baseR #blog

  28. I've talked about creating data.frames and tibbles before, but it is an important topic so I have covered it again. This time specifically from the perspective of creating them from vectors. Post: www.spsanderson.com/steveondata/... #R #RStats #tibble #dplyr #tidyverse #dataframe #baseR #blog

  29. I've talked about creating data.frames and tibbles before, but it is an important topic so I have covered it again. This time specifically from the perspective of creating them from vectors. Post: www.spsanderson.com/steveondata/... #R #RStats #tibble #dplyr #tidyverse #dataframe #baseR #blog

  30. Computing travel time matrices in r⁵py from @geopandas #DataFrame is two lines of code:

    (1) create an r5py.TransportNetwork from @openstreetmap and #GTFS data

    (2) turn it into an r5py.TravelTimeMatrix()

    Try it out in #binder: r5py.readthedocs.io/stable/use

  31. Computing travel time matrices in r⁵py from @geopandas #DataFrame is two lines of code:

    (1) create an r5py.TransportNetwork from @openstreetmap and #GTFS data

    (2) turn it into an r5py.TravelTimeMatrix()

    Try it out in #binder: r5py.readthedocs.io/stable/use