Konverzia dokumentov z jedného formátu do druhého sa môže zdať jednoduchá, ale môže sa stať problémom, ak nástroje majú obmedzené funkcie alebo vyžadujú platené predplatné po prvom použití. Vďaka tomu sú nástroje s otvoreným zdrojovým kódom ideálnou voľbou pre tých, ktorí hľadajú slobodu a rýchlosť pri zachovaní súkromia. Jeden takýto nástroj sa osvedčil pri konverzii textových súborov a zložitých dokumentov bez straty formátovania alebo kvality a stojí za vyskúšanie každému, kto pracuje so súbormi Word, PDF alebo dokonca Markdown.

Existuje nespočetné množstvo možností na prevod dokumentov z jedného formátu do druhého, napríklad funkcia „Uložiť ako“ v textových editoroch alebo množstvo online konverzných programov. Na túto úlohu existuje aj nástroj s otvoreným zdrojovým kódom, ktorý pravidelne používam: Pandoc.
Pandoc sa označuje za „komplexný prevodník dokumentov“ a podporuje desiatky formátov kódovania a typov dokumentov. Dokáže spracovať súbory Microsoft Word, viacero formátov Markdown, PDF, súbory OpenDocument (používané predovšetkým v LibreOffice), poznámkové bloky Jupyter, kodeky MediaWiki, EPUB, prezentácie v PowerPointe, LaTeX a mnoho ďalších formátov. Niektoré formáty súborov je možné použiť iba na import alebo export, nie na oboje.
Pandoc je dostupný v správcoch balíkov mnohých distribúcií Linuxu a používatelia Macu, ktorí ho majú nainštalovaný, môžu: Domáce brúsenie Získajte ho cez toto úložisko. Ak používate systém Windows, inštalačný balík si môžete stiahnuť z Webová stránka Pandocualebo ho nainštalujte pomocou správcov balíkov ako Chocolatey a Winget.
Základné použitie
Pandoc je aplikácia príkazového riadka, ale pre väčšinu konverzií dokumentov sú potrebné dva parametre. Zadáte cestu k vstupnému súboru a pomocou parametra -o určíte, kam sa má konvertovaný súbor uložiť. Tu je jednoduchý príklad konverzie súboru Markdown do HTML:
pandoc „readme.md“ -o „readme.html“
Celkom jednoduché, však? Pandoc sa snaží automaticky rozpoznať vstupné a výstupné formáty súborov, takže ich nemusíte zakaždým definovať.
Sú však prípady, keď táto automatická kontrola nefunguje – možno má váš súbor Markdown príponu .TXT, výstupný súbor by nemal mať príponu súboru alebo z nejakého iného dôvodu. V týchto prípadoch môžete zadať vstupný formát pomocou -f a výstupný formát pomocou -t takto:
pandoc „readme.md“ -f markdown -t html -o „readme.html“
Možno chcete previesť dlhý textový súbor do formátu EPUB, aby ste ho mohli otvoriť v elektronickej čítačke? Pandoc to dokáže:
pandoc „readme.txt“ -o „readme_converted.epub“
Možno budete musieť niektoré dokumenty programu Word previesť do formátu HTML, aby si ich používatelia, ktorí nemajú nainštalovaný program Word, mohli zobraziť v prehliadači. Žiadny problém, Pandoc to dokáže:
pandoc „manual.docx“ -o „manual.html“
Tento príkaz generuje základné HTML značky pre text bez akéhokoľvek štylistického formátovania. Ak chcete, aby exportovaný súbor HTML bol plne samostatný dokument s responzívnymi okrajmi stránky a ďalšími vylepšeniami čitateľnosti, môžete použiť parameter -s takto:
pandoc „manual.docx“ -s -o „manual.html“
Pandoc poskytuje mnoho ďalších možností, ako napríklad použitie špecifického štýlu CSS pre exportované súbory HTML, formátovanie blokov kódu v dokumentoch, zmenu spôsobu prevodu výpočtov zo súborov LaTeX a mnoho ďalšieho. Ukážkovú stránku si môžete pozrieť na adrese Webová stránka Pandocu Aby sme lepšie pochopili možnosti nástroja.
Pandoc nemá vstavanú možnosť dávkovej konverzie súborov, ale môžete ju zahrnúť do svojhoMalý Bash skript Alebo PowerShell duplikuje každý súbor v priečinku. Toto by bol oveľa rýchlejší spôsob, ako previesť stovky dokumentov programu Word, ako otvárať každý dokument jednotlivo vo Worde.
Zrýchlite moju prácu
Pandoc som prvýkrát objavil, keď som sa snažil písať články v editore pre systém MS-DOS. Je to editor obyčajného textu, ale mohol som písať aj pomocou jazyka Markdown na pridávanie odkazov, hlavičiek a ďalšieho formátovania do svojich dokumentov. Stále som však potreboval rýchly spôsob, ako previesť uložený text v jazyku Markdown do formátu HTML, ktorý používa môj systém na správu obsahu (CMS).
Pandoc to urobil perfektne, aj keď som musel pridať parameter –ascii=true, aby sa časť kódu zobrazila správne. Namiesto výstupu textu do súboru som ho presmeroval do príkazu macOS pbcopy, ktorý vloží HTML text do schránky.
pandoc „/Používatelia/corbin/Dokumenty/DOS/MAIN.TXT“ -f markdown -t html -ascii=true | pbcopy
Celú túto vec som integroval do skratky na svojom Macu, takže som musel len uložiť dokument, spustiť skratku a potom vložiť HTML do zdrojového kódu môjho systému na správu obsahu. Táto skúsenosť s editorom MS-DOS netrvala dlho, ale vrátim sa k nej, keď vyskúšam iný starý textový editor.
Teraz som sa vrátil k písaniu článkov pomocou programu Microsoft Word. Keď kopírujem text priamo z Wordu a vkladám ho do systému na správu obsahu mojej práce alebo do iného editora formátovaného textu, obsahuje všetko formátovanie. Chcem zachovať nadpisy, odkazy a ďalšie dôležité formátovanie, ale nie presné písmo a veľkosť v desiatkach náhodných značiek.
Našťastie Pandoc na túto úlohu funguje perfektne. Vytvoril som krátky skript, ktorý konvertuje dokument Scratchpad do HTML, odstráni zalomenia riadkov z pôvodného súboru a potom uloží výsledok do schránky:
pandoc -f docx -t html –ascii=true –extract-media=”$HOME/Plocha/” “$HOME/Dokumenty/Zápisník.docx” –wrap=none | pbcopy
Jediný problém je, že tento skript je pevne zakódovaný v mojom dokumente skriptu. Zvyčajne si vytvorím nový dokument programu Word v priečinku Koncepty pre dlhšie manuály a recenzie. Mohol som ho jednoducho otvoriť v terminálovom okne a previesť ho, keď to bolo potrebné, ale program Skratky problém opäť vyriešil.
Vytvoril som novú skratku, ktorá po kliknutí pravým tlačidlom myši na dokumenty vo Finderi pridá možnosť „Kopírovať ako HTML“. Po spustení skratka odovzdá cestu k súboru Pandocu, ktorý potom vloží prevedený súbor HTML do schránky. Keďže Pandoc dokáže automaticky rozpoznať formáty súborov, platí to nielen pre dokumenty programu Word.

Stručne povedané, Pandoc mi výrazne uľahčil a zrýchlil písanie v textových editoroch, ktoré som chcel, bez akýchkoľvek chýb formátovania alebo problémov. Je tiež užitočný na mnoho ďalších publikačných a archivačných účelov. Nabudúce, keď budete potrebovať previesť nejaké dokumenty, vyskúšajte to.
Vyskúšanie nástrojov s otvoreným zdrojovým kódom vám poskytne väčšiu kontrolu nad vašimi dátami a kvalitou vašej práce bez potreby predplatného alebo technických obmedzení. Tento bezplatný prevodník dokazuje, že jednoduchosť a efektívnosť sa dajú spojiť v jednom programe. Ak často pracujete so súbormi PDF a Word, tento malý objav by mohol byť jedným z najväčších spôsobov, ako si uľahčiť každodennú prácu.

