Slepecká hůl - Kam s ním?

Důležité upozornění!

Policie České republiky a šéfcensor Ústavu pro studium totalitních režimů Jaroslav Čvančara varují: citovat jakékoli texty z tohoto blogu způsobuje vážné risiko trestního stíhání! Četba na vlastní nebezpečí!

Ten problém patrně nemá dobré řešení. Když jsem před třemi lety dokončil webový program právnických výpočtů, řešil jsem ho prvně. Jde o to, jakým způsobem vložit zdrojový soubor do souboru PDF, v případě právnických výpočtů tedy příkladmo do přehledu o vývoji peněžité pohledávky.

Problém je to velice praktický, protože vyplníte-li webový formulář spoustou dat, potřebujete mít možnost nějak si tato data uložit, abyste v případě změny nemuseli vyplňovat vše znovu. K tomu se hodí soubor XML, který aplikace umí ukládat i načítat (zde), avšak přemýšlel jsem, zda by nebylo praktičtější data uložit přímo do souboru PDF.

První, naivní přístup, bylo vytvoření PDF streamu, který, pokud není filtrovaný, způsobí, že XML parser dokáže soubor PDF zpracovat, jako by to byl soubor XML. Tak to fungovalo k mé plné spokojenosti více než rok, než se vyskytl jeden soubor, u kterého parsování selhalo – nevím, zda vinou novější verse některé knihovny nebo nahodilého datového obsahu.

V další iteraci jsem se rozhodl uložit data do položky /Metadata, která má tu výhodu, že na ni vede odkaz z katalogu a lze ji proto vždy najít a extrahovat. Tak to fungovalo cca další dva roky. Než jsem se rozhodl uplatnit tentýž postup i pro jiné soubory vytvářené z TeXu. Tam sice zdroják vždy ukládám, ale může se stát, že ho v mezidobí změním a chtěl bych mít možnost podívat se, z jakého přesně kodu byl ten-který PDF výstup generován.

Když jsem takový soubor opatřil elektronickým podpisem (což přirozeně nedělám v produktu Adobe, ale vlastní utilitou v Javě), ukázalo se, že javová knihovna při ukládání metadat – s XML obalem a v sekci CDATA – tato vymaže a nahradí vlastním obsahem. Důvodem je, že pro metadata by se měl používat formát XMP a moje data v něm nejsou.

Nyní jsem měl na vybranou z různých možností. Rozumným by se jevilo přizpůsobit se XMP a obalit zdroják do některé vlastnosti. Jenže jsou zdrojové soubory podání skutečně metadata? To je poměrně hluboká filosofická otázka, na niž jsem si po několika dnech kontemplace odpověděl záporně. To také znamená, že bych neměl data do položky metadat ukládat vůbec (problém s podepisováním jsem technicky dokázal překonat a knihovnu donutit metadata ponechat, byť za cenu dvojího subclassování a nutnosti použít reflexi, neboť použít vlastní methodu pro zápis metadat knihovna zakazuje).

Další možností bylo připojit soubor jako řádný /EmbeddedFile. Tím se všechny předchozí problémy odstraňují, avšak tato příloha se stává veřejnou a mohlo by se stát, že ji na podatelně např. u soudu vytisknou a přiloží k podání. To nechci. Proto jsem se rozhodl vrátit ke kořenům a ponechat zdrojová data v obyčejném streamu, jen jsem ho připojil jako zvláštní odkaz do katalogu.

Norma PDF je v tomto smyslu nepříliš velkorysá, dovoluje sice do katalogu, resp. do každého slovníku, přidávat libovolné položky, ale jejich PDF název musí být registrován; podobná omezení platí i pro pole /Type a /Subtype. Myšlenka registrace arci zůstala na papíře, Adobe žádné názvy nezaregistrovala, tudíž by zbývala volně používaná jména s prefixem XX.

To mi přišlo mého softwaru nedůstojné, proto jsem místo toho sáhl po logických popisných klíčích /Source a /Data, a těmi své PDF soubory vybavil. Uvidíme, zda toto řešení konečně vydrží, případně zda čtenáři přijdou s nějakým jiným nápadem.

: Autor: Tomáš Pecina; Kategorie: Počítače; Zveřejněno: 16. června 2015; Počet zobrazení: 2320

počítače

Komentovat články mohou pouze registrovaní uživatelé; prosím, zaregistrujte se (v pravém sloupci dole)

JComments

Hledání

Komentáře

Nový hardware do rodiny
Petra 02.03.2023 10:57

Pokud nakonec skončíš u kombinace tabletu a telefonu, můžu za mě jen doporučit Lenovo ...
Číst dále...
Domácí škola
b.o.y 20.06.2020 10:10

No, zajímalo by mě, jak byste si představoval výuku matematiky nějakou lepší formou. Maje doma žáčka ...
Číst dále...
Domácí škola
Tomáš Pecina 07.05.2020 11:54

To je problém vašeho browseru, který by měl podle normy řešit jak dělení slov, tak rozdělování textu ...
Číst dále...
Domácí škola
Daniel Trojan 07.05.2020 11:43

Ach, jednoznakové předložky na koncích řádků. V článku o školství! :(
Číst dále...
Smrt idiota
Filip 16.04.2020 11:18

Kdyby o tom nemluvil důstojný pán, ani bych nepostřehl, že ta osoba zmřela. Proč bych to měl postřehnout?
Číst dále...
Talisman
Filip 16.04.2020 11:01

Vždyť jsou, jako malé děti. Cca 100,000 lidí u nás onemocní nemocniční infekcí, cca 10,000 lidí na ...
Číst dále...
Talisman
Jiří 20.03.2020 17:40

Velmi výstižné a jeden z mála rozumných názorů v této věci. Doporučuji také článek: Zástupce WHO ...
Číst dále...
Talisman
Tomáš Krystlík 18.03.2020 13:27

Cz-vláda si v únoru vyhradila centrální nákup roušek, respirátorů, dezinfekce, dýchacích přístrojů, intubátorů ...
Číst dále...

Statistika

Počet uživatelů: 19
Počet článků: 376
Počet zobrazení: 2216946

O blogu

O autorovi

Kategorie

Archiv

Štítky

Nejčtenější/měsíc

Nejčtenější/rok

Nejčtenější/celkově

Mapa stránek

WebArchiv

RSS kanál

Kam s ním?

Hledání

Komentáře

Nový hardware do rodiny

Domácí škola

Domácí škola

Domácí škola

Smrt idiota

Talisman

Talisman

Talisman

Statistika

Uživatel