home.social

#fuzzywuzzy — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #fuzzywuzzy, aggregated by home.social.

  1. Python и нечеткое сопоставление: решение проблемы разнобоя в адресах

    Иногда приходится заниматься сравнением больших списков адресов, в которых адреса записаны совершенно по разному без внятных идентификаторов вроде номера объекта - есть только адрес. Один и тот же адрес может фигурировать в различных списках следующим образом: 📍 "д. Малое Шилово, ул. Березовая, д. 7" и "Березовая 7_М Шилово". 📍 "п. Ласьва, ул. Весенняя, д. 5" и "Весенняя 5_Ласьва". 📍 "Луговой пер 5, Краснокамск г" и "г. Краснокамск, пер. Луговой, 5". 📍 "д. Новая Ивановка, ул. Солнечная, 18" и "д.Новая Ивановка, ул.Солнечная, 18". Уже выделенные отдельно адреса могут выглядеть как на скриншоте Экселя. А пример поставленной задачи может звучать так: « В реестре поданных объектов отметить все согласованные объекты (из общего списка согласованных) ». Если отбросить вариант ручного исполнения и обратиться к скриптам, то мне видится всего два решения: ✅ Использовать алгоритмы нечёткого сопоставления. ✅ Использовать геокодинг адресов. Ищем приемлемый вариант сопоставления

    habr.com/ru/articles/873242/

    #алгоритм #Алгоритм_нечёткого_сопоставления #карта #fuzzywuzzy

  2. Python и нечеткое сопоставление: решение проблемы разнобоя в адресах

    Иногда приходится заниматься сравнением больших списков адресов, в которых адреса записаны совершенно по разному без внятных идентификаторов вроде номера объекта - есть только адрес. Один и тот же адрес может фигурировать в различных списках следующим образом: 📍 "д. Малое Шилово, ул. Березовая, д. 7" и "Березовая 7_М Шилово". 📍 "п. Ласьва, ул. Весенняя, д. 5" и "Весенняя 5_Ласьва". 📍 "Луговой пер 5, Краснокамск г" и "г. Краснокамск, пер. Луговой, 5". 📍 "д. Новая Ивановка, ул. Солнечная, 18" и "д.Новая Ивановка, ул.Солнечная, 18". Уже выделенные отдельно адреса могут выглядеть как на скриншоте Экселя. А пример поставленной задачи может звучать так: « В реестре поданных объектов отметить все согласованные объекты (из общего списка согласованных) ». Если отбросить вариант ручного исполнения и обратиться к скриптам, то мне видится всего два решения: ✅ Использовать алгоритмы нечёткого сопоставления. ✅ Использовать геокодинг адресов. Ищем приемлемый вариант сопоставления

    habr.com/ru/articles/873242/

    #алгоритм #Алгоритм_нечёткого_сопоставления #карта #fuzzywuzzy

  3. Python и нечеткое сопоставление: решение проблемы разнобоя в адресах

    Иногда приходится заниматься сравнением больших списков адресов, в которых адреса записаны совершенно по разному без внятных идентификаторов вроде номера объекта - есть только адрес. Один и тот же адрес может фигурировать в различных списках следующим образом: 📍 "д. Малое Шилово, ул. Березовая, д. 7" и "Березовая 7_М Шилово". 📍 "п. Ласьва, ул. Весенняя, д. 5" и "Весенняя 5_Ласьва". 📍 "Луговой пер 5, Краснокамск г" и "г. Краснокамск, пер. Луговой, 5". 📍 "д. Новая Ивановка, ул. Солнечная, 18" и "д.Новая Ивановка, ул.Солнечная, 18". Уже выделенные отдельно адреса могут выглядеть как на скриншоте Экселя. А пример поставленной задачи может звучать так: « В реестре поданных объектов отметить все согласованные объекты (из общего списка согласованных) ». Если отбросить вариант ручного исполнения и обратиться к скриптам, то мне видится всего два решения: ✅ Использовать алгоритмы нечёткого сопоставления. ✅ Использовать геокодинг адресов. Ищем приемлемый вариант сопоставления

    habr.com/ru/articles/873242/

    #алгоритм #Алгоритм_нечёткого_сопоставления #карта #fuzzywuzzy

  4. Python и нечеткое сопоставление: решение проблемы разнобоя в адресах

    Иногда приходится заниматься сравнением больших списков адресов, в которых адреса записаны совершенно по разному без внятных идентификаторов вроде номера объекта - есть только адрес. Один и тот же адрес может фигурировать в различных списках следующим образом: 📍 "д. Малое Шилово, ул. Березовая, д. 7" и "Березовая 7_М Шилово". 📍 "п. Ласьва, ул. Весенняя, д. 5" и "Весенняя 5_Ласьва". 📍 "Луговой пер 5, Краснокамск г" и "г. Краснокамск, пер. Луговой, 5". 📍 "д. Новая Ивановка, ул. Солнечная, 18" и "д.Новая Ивановка, ул.Солнечная, 18". Уже выделенные отдельно адреса могут выглядеть как на скриншоте Экселя. А пример поставленной задачи может звучать так: « В реестре поданных объектов отметить все согласованные объекты (из общего списка согласованных) ». Если отбросить вариант ручного исполнения и обратиться к скриптам, то мне видится всего два решения: ✅ Использовать алгоритмы нечёткого сопоставления. ✅ Использовать геокодинг адресов. Ищем приемлемый вариант сопоставления

    habr.com/ru/articles/873242/

    #алгоритм #Алгоритм_нечёткого_сопоставления #карта #fuzzywuzzy

  5. I thought this #bumblebee was dead at first - it wasn't moving for over a minute. It started moving, shortly after I started videoing. It was taking a rest break & did some grooming before flying back to #comfrey #flowers to feed on.

    I'm uploading the video now.

    #Nature #pollinators #Bees #TiredBumblebee #FuzzyWuzzy #insects #BackyardGuests #Saanich #YYJ #VictoriaBC #VancouverIsland #PNW #PollinatorGarden

  6. heise+ | DB-Management: Datendubletten mit Python entfernen

    Die Beseitigung von Datendubletten erfordert viel Handarbeit. Python bietet einige Bibliotheken und Tools, die helfen, dieses Ärgernis aus Listen zu entfernen.
    DB-Management: Datendubletten mit Python entfernen