Slepecká hůl - Jak je to s kompatibilitou formátu PDF

Důležité upozornění!

Policie České republiky a šéfcensor Ústavu pro studium totalitních režimů Jaroslav Čvančara varují: citovat jakékoli texty z tohoto blogu způsobuje vážné risiko trestního stíhání! Četba na vlastní nebezpečí!

V článku o magickém formuláři, který se v každém prohlížeči zobrazí zcela jinak, jsem se dopustil jedné nepřesnosti, když jsem autora tohoto svěžího softwarového dílka obvinil z neodůvodněného používání kodu CP1250.

Protože shodou okolností právě něco sám programuji v ReportLabu, přišel jsem na to, jak se nesprávně kodované znaky s diakritikou do výstupu dostaly: Formát PDF, dnes již informatický stařík, předpokládá, že prohlížeč zná 14 standardních fontů a umí tyto fonty správně vyrenderovat, aniž by musely být v PDF souboru vnořeny (embedded); v době, kdy byl tento formát mlád, na počátku 90. let, to mělo smysl, neboť bylo třeba šetřit každým kilobytem, dnes se všechny použité fonty vnořují pravidelně a u formátu PDF/A je to dokonce povinné.

Potíž je v tom, že tyto povinné fonty mají pouze 256 glyfů, a to v kodu Latin-1 (West European Character Set). Jestliže tedy někdo použije jeden z těchto standardních fontů pro text obsahující české znaky, aniž by font do PDF souboru dodal, výsledkem bude nesprávná representace dat.

V daném případě autor předepsal pro své texty font Arial (jenž mezi standardní čtrnáctku nepatří). Adobe Acrobat ve Windows tento font našel a použil (což nelze hodnotit z hlediska kompatibility jako právě košer řešení, ale je v souladu s filosofií Windows zatěžovat uživatele systémovými problémy co nejméně), Adobe Reader v Linuxu ho nahradil tečkami a prohlížeč Evince vyřešil situaci tak, že místo Arialu použil standardní typeface Helvetica, což ale způsobilo, že text v UTF-8 renderoval chybně, pomocí 256 znaků z Latin-1.

Tolik tedy na upřesnění.

: Autor: Tomáš Pecina; Kategorie: Počítače; Zveřejněno: 20. listopadu 2009; Počet zobrazení: 1891

Komentovat články mohou pouze registrovaní uživatelé; prosím, zaregistrujte se (v pravém sloupci dole)

JComments

Hledání

Komentáře

Nový hardware do rodiny
Petra 02.03.2023 10:57

Pokud nakonec skončíš u kombinace tabletu a telefonu, můžu za mě jen doporučit Lenovo ...
Číst dále...
Domácí škola
b.o.y 20.06.2020 10:10

No, zajímalo by mě, jak byste si představoval výuku matematiky nějakou lepší formou. Maje doma žáčka ...
Číst dále...
Domácí škola
Tomáš Pecina 07.05.2020 11:54

To je problém vašeho browseru, který by měl podle normy řešit jak dělení slov, tak rozdělování textu ...
Číst dále...
Domácí škola
Daniel Trojan 07.05.2020 11:43

Ach, jednoznakové předložky na koncích řádků. V článku o školství! :(
Číst dále...
Smrt idiota
Filip 16.04.2020 11:18

Kdyby o tom nemluvil důstojný pán, ani bych nepostřehl, že ta osoba zmřela. Proč bych to měl postřehnout?
Číst dále...
Talisman
Filip 16.04.2020 11:01

Vždyť jsou, jako malé děti. Cca 100,000 lidí u nás onemocní nemocniční infekcí, cca 10,000 lidí na ...
Číst dále...
Talisman
Jiří 20.03.2020 17:40

Velmi výstižné a jeden z mála rozumných názorů v této věci. Doporučuji také článek: Zástupce WHO ...
Číst dále...
Talisman
Tomáš Krystlík 18.03.2020 13:27

Cz-vláda si v únoru vyhradila centrální nákup roušek, respirátorů, dezinfekce, dýchacích přístrojů, intubátorů ...
Číst dále...

Statistika

Počet uživatelů: 18
Počet článků: 376
Počet zobrazení: 2216800

O blogu

O autorovi

Kategorie

Archiv

Štítky

Nejčtenější/měsíc

Nejčtenější/rok

Nejčtenější/celkově

Mapa stránek

WebArchiv

RSS kanál

Jak je to s kompatibilitou formátu PDF

Hledání

Komentáře

Nový hardware do rodiny

Domácí škola

Domácí škola

Domácí škola

Smrt idiota

Talisman

Talisman

Talisman

Statistika

Uživatel