home.social

#парсинг_xml — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #парсинг_xml, aggregated by home.social.

  1. [Перевод] Парсить XML при помощи регулярных выражений нельзя… но давайте попробуем

    Парсинг HTML при помощи регулярных выражений — популярная ошибка и отличный пример использования неподходящего под задачу инструмента. Общепризнанно, что это плохая идея по множеству причин. Существует знаменитый ответ на Stack Overflow о том, почему этого ни в коем случае не следует делать. На самом деле, этот ответ стал настолько популярным, что в определённых кругах используется, как копипаста. Каждый раз, когда я натыкаюсь на него, то думаю что он во многом справедлив... но в то же время, не могу согласиться с ним полностью...

    habr.com/ru/articles/954632/

    #парсинг_xml #парсинг_контента #парсинг_html #regex

  2. Агрегация и парсинг XML RSS ленты на Python

    В этой статье рассмотрим, как с помощью Python собирать и обрабатывать новости с сайта, имеющего RSS. В нашей статье мы создадим скрипт на Python, который за заданный период (например, за последние 4 часа) соберёт все записи из нескольких лент сайта BBC, отфильтрует их по ключевому слову « Трамп » и опубликует итоговый подбор в наш Telegram-канал. Далее рассмотрим код, вы легко сможете адаптировать его под любую другую ленту или ключевое слово.

    habr.com/ru/companies/amvera/a

    #парсинг_xml #парсинг_xml_python #парсинг_rss #rss_https #rss_xml #python_xml #python_rss