home.social

#docx — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #docx, aggregated by home.social.

  1. Как я парсил банковские платёжки всех российских банков на Python: история боли, костылей и XML-матрёшек

    Привет, Хабр! (И тебе, случайный бухгалтер, который думает, что «выгрузить из банка» - это нажать одну кнопку. И тебе, 1С-разработчик, который слышит «парсинг PDF» и сразу уходит на больничный. И тебе, Python-разработчик, который уверен, что pip install magic_solution решит любую проблему.) Сегодня расскажу, как мне поставили задачу, от которой у SAP-а ушло, видимо, несколько команд и много времени, а мне дали на это… ну, скажем так, поменьше. Задача звучала элегантно, но всегда есть но, и не одно)) (Спойлер для тех, кому лень читать: я узнал, что Сбербанк формирует WORD-документы с такой XML-вложенностью, что в ней можно заблудиться, ВТБ зачем-то маскирует WORD под RTF, а файл на 10 000 платёжек из 37 мегабайт разворачивается в 1 гигабайт XML. И да, всё по итогу заработало.)

    habr.com/ru/articles/1025626/

    #python #flask # #парсинг #pdf #docx #rtf #банки #интеграции #оптимизация

  2. Open Document Format

    Voor wie zijn hele digitale bestaan zich afspeelt binnen het ecosysteem van Microsoft Windows is dit waarschijnlijk hogere wiskunde. Maar voor Linuxgebruikers is het een subtiele triomf. LibreOffice opent .odf, .docx, .doc, en desnoods iets wat in 1997 op een floppy is opgeslagen.

    Lees de gehele #column >> morpurgomedia.nl/columns-blogs

    #linux #mint #kernel #update #changelogs #laptop #LibreOffice #Microsoft #office #odf #docx #MorpurgoMedia

  3. #LibreOffice 26.2.1 bringt über 70 Korrekturen - #fosstopia:

    #LibreOffice26.2.1 steht bereit und liefert viele Korrekturen für alle drei großen Desktop Systeme. Die Aktualisierung konzentriert sich stark auf eine bessere Zusammenarbeit mit #Microsoft #Office und behebt zahlreiche Fehler, die beim Austausch von Dokumenten auftraten. Besonders betroffen waren beschädigte #DOCX Dateien und fehlerhafte Formatierungen in komplexen Texten.

    fosstopia.de/libreoffice-26-2-

  4. Книга в Markdown: Автоматическая сборка статического сайта mdBook и файла DOCX с оформлением по ГОСТ

    Текст книг, учебных пособий, научно-технических статей, документации, дипломных и курсовых работ часто набирается и редактируется в WYSIWYG-редакторе, таком как Microsoft Word, в том числе вследствие того, что издательства и организации требуют от авторов оформленный по ГОСТ или внутренним стандартам docx-документ. Процесс работы в Microsoft Word и аналогичных редакторах не лишён недостатков: docx-файлы трудно версионировать в git, а для объединения нескольких документов в один придётся перенумеровывать источники, рисунки, таблицы, формулы. Альтернативой docx является LaTeX. Однако работа со стилями в LaTeX простотой и минималистичным синтаксисом не отличается , причём издательства от использования формата docx отказываться не торопятся. А инструменты в духе typst отличаются нестандартным синтаксисом языка для описания документов, причём возможность генерации сайтов в typst имеет пометку «in preview». Markdown — популярный и удобный язык разметки, но это также и очень ограниченный формат. Поэтому задача написания в Markdown сложной технической документации по ГОСТ, научной статьи с автоматической настройкой оформления для заданного издательства или хорошо оформленного онлайн-учебника может показаться неосуществимой. В этой статье рассмотрим способ работы над научно-техническими статьями и книгами в формате Markdown на основе подхода Docs as Code с учётом строгих ограничений на оформление, используемый Петром Советовым @true-grue и мной при подготовке учебных материалов в РТУ МИРЭА. Способ заключается в применении утилиты pandoc для построения дерева абстрактного синтаксиса (AST) Markdown-документа с последующим переписыванием AST набором фильтров на Lua и трансляцией AST в форматы docx и pdf, соответствующие ГОСТ, а также в диалект markdown, совместимый с mdBook , для генерации онлайн-учебника в виде статического сайта. Исходный код книги , написанной с использованием описанного в статье подхода, опубликован на GitHub.

    habr.com/ru/articles/987982/

    #pandoc #markdown #lua #python #документирование #гост #docx #graphviz #mdbook #github

  5. Interesting.. When I download the official HICSS paper template from google docs in #ODF format, #OnlyOffice and #LibreOffice both use Calibri font. But when I download it in #docx format, the fonts are preserved. The paper says it is in "Times" font.

    Can this have something to do with font fallback feature that ODF lacks? (Times to Times New Roman).

    Maybe it is just Google Docs not converting to ODF correctly.

  6. Quelqu'un sait s'il y a un document plus récent qui indique les formats de fichiers acceptés par la #dinum ?
    Je n'ai trouvé que ça et ça a 10 ans...

    numerique.gouv.fr/offre-accomp

    #RGI #formats_ouverts #docx #odt #odf #LibreOffice #servicepublic

  7. Quelqu'un sait s'il y a un document plus récent qui indique les formats de fichiers acceptés par la #dinum ?
    Je n'ai trouvé que ça et ça a 10 ans...

    numerique.gouv.fr/offre-accomp

    #RGI #formats_ouverts #docx #odt #odf #LibreOffice #servicepublic

  8. "Mark (up) my #WORD!" - #Pandoc #Templates für ' #docx' u.a. -

    Mechanismen, mit denen wir – mittels Pandoc über „Templates“ oder wahlweise über geeignet formatierte „Referenzdokumente“ – (halbwegs) automatisiert Office-Dokumente wie Texte oder Folien erzeugen.

    gnulinux.ch/mark-up-my-word-pa

  9. 📢 Χρησιμοποιείτε ακόμα Windows 7, 8 ή 8.1; Δεν είστε μόνοι! 🖥️

    Ανακαλύψτε γιατί το @ONLYOFFICE Desktop Editors είναι η ιδανική, μοντέρνα και ασφαλής επιλογή για εσάς! ✨

    👉 Διαβάστε το πλήρες άρθρο εδώ: onlyoffice.com/blog/el/2025/11

  10. 📢 :ruby: New gem & CLI tool: yaml-converter converts your yaml to markdown, html, or pdf in native Ruby, and docx via pandoc (and any other format Pandoc supports). Can *stream* conversion of yaml to markdown! Many other options.
    You may be thinking - no one asked for this!
    But I did. And I'm building something with it right now. I'd love to know your thoughts about the gem.
    github.com/galtzo-floss/yaml-c #ruby #yaml #markdown #html #pdf #docx

  11. Format-specific output can be passed through from input to output via “raw blocks” and “raw inlines”. E.g., inserting a pagebreak in docx would work via “raw_attributes” in Markdown:

    ```{=openxml}
    <w:p>
    <w:r><w:br w:type="page"/></w:r>
    </w:p>
    ```

    Or to insert HTML from org mode:

    @@html:<var>x</var>@@

  12. Convertir varios archivos de Word #docx o #doc al mismo tiempo a PDF.
    Muy fácil si tienes #LibreOffice en Ubuntu.

  13. Good morning, after research, collecting a PDF to a book to be published digitally works hopelessly.

    So I have to bundle my.odf to #doc #docx #RTF or #formatted-EPUB files in a way that also creates a table of contents.

    Is there a @libreoffice template for this?

    #Book #books #digitally @draft2digital

  14. Goedemorgen na onderzoek werkt het verzamelen van pdf naar digitaal uit te geven boekwerkje hopeloos.

    Ik moet dus mijn .odf naar #doc #docx #RTF of #geformatteerde-EPUB bestanden zien te bundelen op een manier dat er ook een inhoudsopgave ontstaat.

    Is hier een @libreoffice sjabloon voor?

    #boek #boeken #digitaal @draft2digital

  15. Article by @alefunguju on how to use pandoc to produce nice-looking diffs for docx and odt with , and even how to provide that functionality with .

    spiffyk.cz/blog/git-pandoc/

  16. Контейнерная стеганография: Прячем гигабайты в DOCX, PDF и еще десятке форматов

    Привет, Хабр! С момента публикации наших прошлых статей о создании программы для стеганографии ChameleonLab прошло немало времени. Мы получили огромное количество фидбэка и поняли, что тема сокрытия данных интересна сообществу не только в контексте классических картинок (LSB), но и в более сложных, повседневных файлах — документах.

    habr.com/ru/articles/944808/

    #стеганография #стегоанализ #pdf #docx #chameleonlab #epub #защита_данных

  17. - github.com/bgreenwell/doxx

    doxx : A fast, terminal-native document viewer for Word files. View, search, and export .docx documents without leaving your command line.

    # View a document
    doxx report.docx

    # Start with outline view
    doxx document.docx --outline

    doxx report.docx --export markdown > report.md

    # Export to different formats
    doxx data.docx --export csv > data.csv

    # View with images (supported terminals)
    doxx presentation.docx --images --export text

    #cli #docx #doxx #markdown

  18. Невидимые чернила в цифровом мире: технология сокрытия данных в DOCX/XLSX

    Привет, Хабр! Стеганография — искусство сокрытия информации — чаще всего ассоциируется с изображениями и аудиофайлами. Но что если нам нужно спрятать данные не в медиафайле, а в обычном офисном документе, например, в .docx или .xlsx ? На первый взгляд, задача кажется сложной. Документы имеют строгую структуру, и любое неосторожное изменение может повредить файл. Однако современные форматы Office, основанные на Open XML, предоставляют удивительно элегантные и надежные способы для встраивания сторонних данных.

    habr.com/ru/articles/939980/

    #стеганография #python #docx #open_xml #информационная_безопасность #сокрытие_данных #ChameleonLab #стеганоанализ #xlsx

  19. 🤔 Ah, finally, a way to peer into your .docx files from the terminal—because who wants to use a tool made for the job? 🙄 GitHub's latest: reinventing the wheel, but make it ✨ #terminal #chic ✨.
    github.com/bgreenwell/doxx #docx #GitHub #innovation #tech #tools #programming #HackerNews #ngated

  20. #OpenDocument #Reader.
    View
    #OpenOffice and #LibreOffice #documents on the go. Now available for #Android and #iOS!

    In addition to that, OpenDocument Reader aims to support various other file formats as well as possible:
    - Portable Document Format (
    #PDF)
    - Archives:
    #ZIP
    - Images:
    #JPG, #JPEG, #GIF, #PNG, #WEBP, #TIFF, #BMP, #SVG, etc
    - Videos:
    #MP4, #WEBM, etc
    - Audio:
    #MP3, #OGG, etc
    - Text files:
    #CSV, #TXT, #HTML, #RTF
    - Microsoft Office (
    #OOXML): Word (#DOC, #DOCX), Excel (#XLS, #XLSX), PowerPoint (#PPT, #PPTX)
    - Apple iWork: Pages, Numbers, Keynote
    - Libre Office and Open Office OpenDocument Format:
    #ODF* (#ODT, #ODS, #ODP, #ODG)
    - PostScript (
    #EPS)
    - AutoCAD (
    #DXF)
    - Photoshop (
    #PSD)

    https://opendocument.app/

  21. Um exemplo mínimo de como usar #Python para ler dados de uma planilha #Excel com a biblioteca #openpyxl e como modificar um arquivo #Word com a biblioteca #docx

    gist.github.com/villares/560e2

  22. LibreOffice Viewer.
    You may know
    #LibreOffice from the desktop - the free and open source office suite (successor to OpenOffice) with over 200 million users worldwide. It's secure and respects your privacy, not sharing your documents with anyone else. It's also available for Android in a simplified form, to view documents in these formats:

    * Open Document Format (odt, ods, odp, odg)
    * Microsoft Office 2007–365 (
    #docx, xlsx and pptx)
    * Microsoft Office 97–2003 (
    #doc, xls and ppt)

    https://f-droid.org/ru/packages/org.documentfoundation.libreoffice/
    #android

  23. Article by R. N. West on how to use in an advanced way in order to generate corporate-styled Word documents.
    The post explains custom styles, shows how templates can be used, and includes a short primer on important aspects of the -format.
    rnwest.engineer/auto-generate-

  24. Convert Microsoft Office Files to Markdown | Obsidian-Ready
    Free tool to convert Word, PowerPoint & Excel files to clean Markdown. Perfect for Obsidian notes and documentation.
    getmarkdown.com/
    #csv #docx #excel #json #markdown #pdf #pptx #sergio-bernardino #tools #word #xlsx #xml

  25. Vous aviez des soucis pour afficher vos présentations et autres documents .docx .pptx sur LibreOffice ou autres suites bureautiques ?

    Ne vous inquiétez pas, vous aurez aussi ces soucis dès 2025 avec Office 24 et Microsoft 365.
    next.ink/brief_article/office-

    [Suggestion]
    Peut-être que le mieux serait d'abandonner ces formats de fichiers...

    #Microsoft365 #Office2024 #LibreOffice #Docx #Pptx #Microsoft #ActiveX

  26. Welche app ist nextcloud fähig (darin installierbar) und kann gut Excel und Word Dateien öffnen und bearbeiten? Ich würde gerne von verschiedenen Geräten auf das Fahrtenbuch zugreifen und Daten darin ablegen können...
    #nextcloud #xlsx #docx #dateiformate

  27. 🆕 release: 3.2.1
    Possibly the most notable change: templates can now be used with output.
    The release comes with many other small improvements and bugfixes, as usual. See the changelog for details.
    github.com/jgm/pandoc/releases

  28. I am really impressed by Onlyoffice. While otherwise living in #emacs, every once in a while I still need to edit .docx and .xlsx files. Onlyoffice has a modern look similar to the MS original, is fast, free, and has all the functionality I need, including a good pdf reader (bye, Adobe!). The best part is that all file types can be handled in one app with browser-like tabs to switch between files. MS Office thinks it is so important that it has an item in the Alt+Tab queue for every single file. #office #foss #docx #xlsx #pdf #msoffice #onlyoffice
    https://www.onlyoffice.com/download-desktop.aspx#desktop

  29. This looks promising

    writage.com/?cmdf=markdown+wor

    could this replace pandoc?

    My current workflow is sublime -> pandoc, or obsidian -> pandoc (if it is part of my projects)

    Obviously the need for sublime -> pandoc -> powerpoint remains

    #SublimeText #Pandoc #Obsidian #docx #pptx #writage

  30. Happy to announce Collabora Office 6.4-15 🌻

    This update of our #privacy supportive and #freedom respecting (install it local ;) ) #productivity tool, offers you improvements in #PPTX presentations and #DOCX fields 👌

    Read all collaboraoffice.com/collabora-

    #digitalsovereignty #gdpr

  31. #DeepL permet maintenant de téléverser des fichiers à traduire !

    ...malheureusement, seuls les #docx et #pptx sont pris en charge. 😖 Pourquoi, mais pourquoi pas les #odt et #odp qui sont de vrais #FormatsOuverts !!?

    deepl.com/translator