home.social

#markitdown — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #markitdown, aggregated by home.social.

  1. Open Source-джентльмены 2026: Обзор самых ярких GitHub-проектов, определивших начало года

    2025 год стал переломным для open-source-сообщества. Согласно ежегодной статистике GitHub, количество публичных репозиториев перевалило за 395 миллионов, а аудитория платформы выросла до 180 миллионов разработчиков. Но главная интрига развернулась на пьедестале языков программирования: TypeScript впервые сместил Python и JavaScript , став самым быстрорастущим языком с годовым приростом в 1 миллион новых разработчиков. Мы вступили в 2026 год, и тренд на «агентность» и «интеграцию с ИИ» перестал быть просто хайпом. Теперь это архитектурный стандарт. В этой статье я собрал проекты, которые буквально «взорвали» GitHub в конце 2025 и начале 2026 года. Это не просто игрушки, а реальные инструменты, меняющие ландшафт разработки.

    habr.com/ru/articles/1003526/

    #GitHub_2026 #open_source #AI #Python_libraries #agentic_workflows #vibe_coding #GitHub_Spark #PydanticAI #Smolagents #MarkItDown

  2. Open Source-джентльмены 2026: Обзор самых ярких GitHub-проектов, определивших начало года

    2025 год стал переломным для open-source-сообщества. Согласно ежегодной статистике GitHub, количество публичных репозиториев перевалило за 395 миллионов, а аудитория платформы выросла до 180 миллионов разработчиков. Но главная интрига развернулась на пьедестале языков программирования: TypeScript впервые сместил Python и JavaScript , став самым быстрорастущим языком с годовым приростом в 1 миллион новых разработчиков. Мы вступили в 2026 год, и тренд на «агентность» и «интеграцию с ИИ» перестал быть просто хайпом. Теперь это архитектурный стандарт. В этой статье я собрал проекты, которые буквально «взорвали» GitHub в конце 2025 и начале 2026 года. Это не просто игрушки, а реальные инструменты, меняющие ландшафт разработки.

    habr.com/ru/articles/1003526/

    #GitHub_2026 #open_source #AI #Python_libraries #agentic_workflows #vibe_coding #GitHub_Spark #PydanticAI #Smolagents #MarkItDown

  3. Open Source-джентльмены 2026: Обзор самых ярких GitHub-проектов, определивших начало года

    2025 год стал переломным для open-source-сообщества. Согласно ежегодной статистике GitHub, количество публичных репозиториев перевалило за 395 миллионов, а аудитория платформы выросла до 180 миллионов разработчиков. Но главная интрига развернулась на пьедестале языков программирования: TypeScript впервые сместил Python и JavaScript , став самым быстрорастущим языком с годовым приростом в 1 миллион новых разработчиков. Мы вступили в 2026 год, и тренд на «агентность» и «интеграцию с ИИ» перестал быть просто хайпом. Теперь это архитектурный стандарт. В этой статье я собрал проекты, которые буквально «взорвали» GitHub в конце 2025 и начале 2026 года. Это не просто игрушки, а реальные инструменты, меняющие ландшафт разработки.

    habr.com/ru/articles/1003526/

    #GitHub_2026 #open_source #AI #Python_libraries #agentic_workflows #vibe_coding #GitHub_Spark #PydanticAI #Smolagents #MarkItDown

  4. Open Source-джентльмены 2026: Обзор самых ярких GitHub-проектов, определивших начало года

    2025 год стал переломным для open-source-сообщества. Согласно ежегодной статистике GitHub, количество публичных репозиториев перевалило за 395 миллионов, а аудитория платформы выросла до 180 миллионов разработчиков. Но главная интрига развернулась на пьедестале языков программирования: TypeScript впервые сместил Python и JavaScript , став самым быстрорастущим языком с годовым приростом в 1 миллион новых разработчиков. Мы вступили в 2026 год, и тренд на «агентность» и «интеграцию с ИИ» перестал быть просто хайпом. Теперь это архитектурный стандарт. В этой статье я собрал проекты, которые буквально «взорвали» GitHub в конце 2025 и начале 2026 года. Это не просто игрушки, а реальные инструменты, меняющие ландшафт разработки.

    habr.com/ru/articles/1003526/

    #GitHub_2026 #open_source #AI #Python_libraries #agentic_workflows #vibe_coding #GitHub_Spark #PydanticAI #Smolagents #MarkItDown

  5. Microsoft just released the open‑source MarkItDown library – it can unpack ZIP archives, read CSVs and render them as clean Markdown, all powered by LLMs via LangChain. A handy tool for developers building AI‑augmented docs and data pipelines. Dive in to see how it simplifies content handling! #MarkItDown #ZIP #LangChain #AI

    🔗 aidailypost.com/news/microsoft

  6. 🧠 [RISORSA UTILE + COLAB]
    #Microsoft ha pubblicato #MarkItDown, uno strumento in Python che converte file in Markdown.
    👉 Ho creato un Colab pronto all’uso, con un’ulteriore integrazione: linkedin.com/posts/alessiopoma

    ___
    ✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: bit.ly/newsletter-alessiopomaro

    #AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM

  7. 🧠 [RISORSA UTILE + COLAB]
    #Microsoft ha pubblicato #MarkItDown, uno strumento in Python che converte file in Markdown.
    👉 Ho creato un Colab pronto all’uso, con un’ulteriore integrazione: linkedin.com/posts/alessiopoma

    ___
    ✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: bit.ly/newsletter-alessiopomaro

    #AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM

  8. 🧠 [RISORSA UTILE + COLAB]
    #Microsoft ha pubblicato #MarkItDown, uno strumento in Python che converte file in Markdown.
    👉 Ho creato un Colab pronto all’uso, con un’ulteriore integrazione: linkedin.com/posts/alessiopoma

    ___
    ✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: bit.ly/newsletter-alessiopomaro

    #AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM

  9. 🧠 [RISORSA UTILE + COLAB]
    #Microsoft ha pubblicato #MarkItDown, uno strumento in Python che converte file in Markdown.
    👉 Ho creato un Colab pronto all’uso, con un’ulteriore integrazione: linkedin.com/posts/alessiopoma

    ___
    ✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: bit.ly/newsletter-alessiopomaro

    #AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM

  10. 🧠 [RISORSA UTILE + COLAB]
    #Microsoft ha pubblicato #MarkItDown, uno strumento in Python che converte file in Markdown.
    👉 Ho creato un Colab pronto all’uso, con un’ulteriore integrazione: linkedin.com/posts/alessiopoma

    ___
    ✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: bit.ly/newsletter-alessiopomaro

    #AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM

  11. Добавление OCR-слоя и другие преобразования PDF

    При сканировании и сохранении в формате PDF зачастую документы сохраняются в виде графических изображений. Это неудобно, потому что делает невозможным полнотекстовый поиск по содержанию. Утилита OCRmyPDF решает эту проблему: она одной командой из консоли добавляет к PDF-документу слой OCR с распознанным текстом. Ниже упомянуты ещё несколько полезных инструментов для парсинга PDF, в том числе для преобразования сложных математических PDF-документов в текстовый формат Markdown.

    habr.com/ru/companies/globalsi

    #pdf #syntax #markitdown #конвертация #ocrmypdf #ocr

  12. Добавление OCR-слоя и другие преобразования PDF

    При сканировании и сохранении в формате PDF зачастую документы сохраняются в виде графических изображений. Это неудобно, потому что делает невозможным полнотекстовый поиск по содержанию. Утилита OCRmyPDF решает эту проблему: она одной командой из консоли добавляет к PDF-документу слой OCR с распознанным текстом. Ниже упомянуты ещё несколько полезных инструментов для парсинга PDF, в том числе для преобразования сложных математических PDF-документов в текстовый формат Markdown.

    habr.com/ru/companies/globalsi

    #pdf #syntax #markitdown #конвертация #ocrmypdf #ocr

  13. Добавление OCR-слоя и другие преобразования PDF

    При сканировании и сохранении в формате PDF зачастую документы сохраняются в виде графических изображений. Это неудобно, потому что делает невозможным полнотекстовый поиск по содержанию. Утилита OCRmyPDF решает эту проблему: она одной командой из консоли добавляет к PDF-документу слой OCR с распознанным текстом. Ниже упомянуты ещё несколько полезных инструментов для парсинга PDF, в том числе для преобразования сложных математических PDF-документов в текстовый формат Markdown.

    habr.com/ru/companies/globalsi

    #pdf #syntax #markitdown #конвертация #ocrmypdf #ocr

  14. Добавление OCR-слоя и другие преобразования PDF

    При сканировании и сохранении в формате PDF зачастую документы сохраняются в виде графических изображений. Это неудобно, потому что делает невозможным полнотекстовый поиск по содержанию. Утилита OCRmyPDF решает эту проблему: она одной командой из консоли добавляет к PDF-документу слой OCR с распознанным текстом. Ниже упомянуты ещё несколько полезных инструментов для парсинга PDF, в том числе для преобразования сложных математических PDF-документов в текстовый формат Markdown.

    habr.com/ru/companies/globalsi

    #pdf #syntax #markitdown #конвертация #ocrmypdf #ocr

  15. #開源分享 微軟髮布了一個文件轉換MCP:markitdown-mcp,用於將網頁連結(http/https)、本地文件以及數據轉換為Markdown格式!

    主要是調用MarkItDown進行格式轉換。可以通過Docker運行或直接安裝,也可以與Claude等AI工具集成使用

    專案地址: github.com/microsoft/markitdown/tree/main/packages/markitdown-mcp

    #MCP #markitdown

  16. 將各種檔案轉成 Markdown 的 markitdown

    在「MarkItDown: Python tool for converting files and office documents to Markdown (github.com/microsoft)」這邊看到微軟的 MarkItDown 工具,可以把一堆檔案格式轉成 Markdown。

    看 GitHub 分析的程式語言的比例中,HTML 居然最高,Python 次之?發現主要的

    blog.gslin.org/archives/2024/1

    #Computer #Library #Murmuring #Programming #Software #markdown #markitdown #microsoft #pypi #python

  17. 將各種檔案轉成 Markdown 的 markitdown

    在「MarkItDown: Python tool for converting files and office documents to Markdown (github.com/microsoft)」這邊看到微軟的 MarkItDown 工具,可以把一堆檔案格式轉成 Markdown。

    看 GitHub 分析的程式語言的比例中,HTML 居然最高,Python 次之?發現主要的

    blog.gslin.org/archives/2024/1

    #Computer #Library #Murmuring #Programming #Software #markdown #markitdown #microsoft #pypi #python

  18. 將各種檔案轉成 Markdown 的 markitdown

    在「MarkItDown: Python tool for converting files and office documents to Markdown (github.com/microsoft)」這邊看到微軟的 MarkItDown 工具,可以把一堆檔案格式轉成 Markdown。

    看 GitHub 分析的程式語言的比例中,HTML 居然最高,Python 次之?發現主要的

    blog.gslin.org/archives/2024/1

    #Computer #Library #Murmuring #Programming #Software #markdown #markitdown #microsoft #pypi #python

  19. 將各種檔案轉成 Markdown 的 markitdown

    在「MarkItDown: Python tool for converting files and office documents to Markdown (github.com/microsoft)」這邊看到微軟的 MarkItDown 工具,可以把一堆檔案格式轉成 Markdown。

    看 GitHub 分析的程式語言的比例中,HTML 居然最高,Python 次之?發現主要的

    blog.gslin.org/archives/2024/1

    #Computer #Library #Murmuring #Programming #Software #markdown #markitdown #microsoft #pypi #python

  20. 將各種檔案轉成 Markdown 的 markitdown

    在「MarkItDown: Python tool for converting files and office documents to Markdown (github.com/microsoft)」這邊看到微軟的 MarkItDown 工具,可以把一堆檔案格式轉成 Markdown。

    看 GitHub 分析的程式語言的比例中,HTML 居然最高,Python 次之?發現主要的

    blog.gslin.org/archives/2024/1

    #Computer #Library #Murmuring #Programming #Software #markdown #markitdown #microsoft #pypi #python

  21. Microsoftの“なんでもMarkdownにしてくれるライブラリ”が話題、手軽なWebアプリもさっそく登場/PDF、Word、Excel、PowerPoint、音声・画像までカバー【やじうまの杜】
    forest.watch.impress.co.jp/doc

    #forest_watch_impress #Markdown #MarkItDown

  22. Microsoftの“なんでもMarkdownにしてくれるライブラリ”が話題、手軽なWebアプリもさっそく登場/PDF、Word、Excel、PowerPoint、音声・画像までカバー【やじうまの杜】
    forest.watch.impress.co.jp/doc

    #forest_watch_impress #Markdown #MarkItDown