03.12.2012 Views

Formaty hybrydowe w bibliotekach cyfrowych (kontekst i ... - E-LIS

Formaty hybrydowe w bibliotekach cyfrowych (kontekst i ... - E-LIS

Formaty hybrydowe w bibliotekach cyfrowych (kontekst i ... - E-LIS

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Formaty</strong> <strong>hybrydowe</strong><br />

Konferencja „Praktyczne aspekty<br />

tworzenia bibliotek <strong>cyfrowych</strong>”.<br />

Wojewódzka Biblioteka Publiczna<br />

w Krakowie, 12.09.2008<br />

w <strong>bibliotekach</strong> <strong>cyfrowych</strong><br />

(<strong>kontekst</strong> i praktyka)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Plan wyk�adu wyk�adu – cz. 1 z 3<br />

1. Dokument elektroniczny i jego <strong>kontekst</strong>y<br />

Kontekst normatywny<br />

Kontekst praktyczny<br />

2. Typologia formatów<br />

<strong>Formaty</strong> w cyklu tworzenia publikacji cyfrowej<br />

<strong>Formaty</strong> archiwalne<br />

<strong>Formaty</strong> prezencyjne<br />

3. <strong>Formaty</strong> <strong>hybrydowe</strong><br />

Portable Document Format<br />

DJVu, inne<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Dokument elektroniczny<br />

w sensie normatywnym<br />

Definicje prawne<br />

Normy<br />

Cechy DE<br />

Struktura DE<br />

Co to jest format?<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DE – prawo i normy<br />

- ISO 15489 (mi�dzynarodowe)<br />

- Model of Requirements for Records<br />

Management (UE)<br />

Polska:<br />

- PN-ISO 15489-1:2006 i in.<br />

- Ustawa o informatyzacji ... (Dz.U. 2005 nr 64, poz. 565),<br />

- Ustawa o �wiadczeniu us�ug drog� elektroniczn�<br />

- Ustawa o podpisie elektronicznym<br />

- Kodeks Karny<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

(Dz.U. 2002 nr 144, poz. 1204)<br />

(Dz.U. 2001 nr 130, poz. 1450)


Definicje DE (1)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

DE (komputerowy, cyfrowy) - dokument z sygna�em<br />

utrwalonym na no�niku elektronicznym. Mog� to by�<br />

komunikaty ró�nych j�zyków naturalnych w subkodach<br />

akustycznych i graficznych, inne komunikaty graficzne<br />

jak obrazy, wykresy, animacje, filmy, komunikaty<br />

d�wi�kowe, np. muzyka<br />

(S�ownik encyklopedyczny informacji, j�zyków i systemów... Warszawa 2002)<br />

DE - zbiór danych wprowadzonych lub przechowywanych<br />

na dowolnym no�niku przez system informatyczny lub<br />

podobny uk�ad, które mog� by� odczytane lub<br />

wy�wietlone przez osob� lub przez tego rodzaju system<br />

lub uk�ad, a tak�e wszelkiego rodzaju prezentacja i<br />

wszelkiego rodzaju przedstawienie tych danych w formie<br />

drukowanej lub innej (Decyzja KE, 2004/563/WE)<br />

W. M. Kolasa


Definicje DE (2)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

DE - „dokument istniej�cy w postaci elektronicznej,<br />

dost�pny za po�rednictwem techniki komputerowej”<br />

(PN-ISO 690-2)<br />

DE - „stanowi�cy odr�bn� ca�o�� znaczeniow� zbiór<br />

danych uporz�dkowanych w okre�lonej strukturze<br />

wewn�trznej i zapisany na informatycznym no�niku<br />

danych<br />

(Ustawa o informatyzacji... 2005)<br />

DE - „ka�dy przedmiot lub zapis na komputerowym<br />

no�niku informacji, z którym jest wi�zane okre�lone<br />

prawo albo który ze wzgl�du na zawart� w nim tre��<br />

stanowi dowód prawa, stosunku prawnego lub<br />

okoliczno�ci maj�cej znaczenie prawne”<br />

(Kodeks Karny)<br />

W. M. Kolasa


Prace nad terminologi�<br />

terminologi�<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Ustawa o zmianie ustaw w celu ujednolicenia terminologii<br />

informatycznej (w toku – skier. do podpisu Prezydenta - 5.09.2008)<br />

W. M. Kolasa


W �wietle �wietle PN-ISO PN ISO 690-2 690<br />

DE – [...] dokument istniej�cy w postaci<br />

elektronicznej, dost�pny za po�rednictwem<br />

techniki komputerowej [...]<br />

posta�<br />

medium<br />

PN-ISO 690-2 Informacja i dokumentacja<br />

-Zarz�dzanie dokumentami<br />

Wojewódzka Biblioteka Publiczna w Krakowie


DE - cechy<br />

1. Utrwalone na materialnym no�niku;<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

2. Mo�na je odtwarza� w formie umo�liwiaj�cej ich<br />

percepcj�;<br />

- Nie jest istotny rodzaj no�nika i sposób transmisji;<br />

- istotne za� jest, aby dane mog�y by� wielokrotnie<br />

odtwarzane.


DE - wyró�niki wyró�niki<br />

1. Zawarto�� – tekst, obraz, d�wi�k i in.;<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

2. Struktura logiczna, która nie musi by� to�sama ze<br />

struktur� fizyczn�, gdy� mo�e by� zawarta<br />

bezpo�rednio w dokumencie, w bazie danych lub<br />

pliku zewn�trznym;<br />

3. Kontekst, czyli metadane techniczne okre�laj�ce w<br />

jakiej postaci dokument b�dzie prezentowany.<br />

W. M. Kolasa


Struktura DE<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Struktura logiczna dokumentu elektronicznego - sposób<br />

u�o�enia informacji w dokumencie elektronicznym<br />

zdefiniowany poprzez okre�lenie elementów<br />

informacyjnych oraz powi�za� mi�dzy nimi;<br />

Struktura fizyczna dokumentu elektronicznego – wynik<br />

przetworzenia, w tym kodowania i szyfrowania,<br />

informacji zawartych w dokumencie elektronicznym<br />

na dane w uk�adzie bitowym (czyli format danych); danych<br />

Rozporz�dzenie Prezesa Rady Ministrów z dnia 29 wrze�nia 2005 r. w sprawie warunków organizacyjnotechnicznych<br />

dor�czania dokumentów elektronicznych podmiotom publicznym (Dz.U. 2005, nr 200, poz. 1651)<br />

W. M. Kolasa


Dokument elektroniczny<br />

w sensie praktycznym<br />

Rozumienie DE w bibliotece cyfrowej<br />

Oczekiwania wobec publikacji w bibliotece cyfrowej<br />

Porównanie procesu tworzenia publikacji tradycyjnej<br />

i elektronicznej<br />

Konsekwencje dla bibliotek<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DE w sensie praktycznym<br />

Z punktu widzenia bibliotek <strong>cyfrowych</strong> obecnej generacji<br />

w�a�ciwsze jest operowanie poj�ciem publikacji cyfrowej,<br />

któr� nale�y traktowa� w�sko:<br />

... to ksi��ka tradycyjna na<br />

no�niku elektronicznym<br />

Podobny lub identyczny:<br />

� proces tworzenia<br />

� proces redakcji, recenzowania<br />

� proces sk�adu<br />

Wojewódzka Biblioteka Publiczna w Krakowie


Oczekiwania czytelników<br />

Format zapisu e-ksi��ki winien oferowa� takie parametry,<br />

aby higiena jej czytania by�a nie gorsza ni� ksi��ki<br />

tradycyjnej.<br />

600 DPI<br />

24 BPP<br />

djvu<br />

6283x9094 pikseli<br />

280 kB<br />

Wojewódzka Biblioteka Publiczna w Krakowie


Warto�� Warto�� dodana - ZOOM<br />

Wojewódzka Biblioteka Publiczna w Krakowie


Z my�l� my�l� o przysz�o�ci<br />

przysz�o�ci<br />

Ile cali<br />

b�dzie mia�<br />

monitor<br />

przysz�o�ci?<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Warto�� Warto�� dodana - OCR<br />

Wojewódzka Biblioteka Publiczna w Krakowie


Ksi��ka Ksi��ka tradycyjna a e-ksi��ka e ksi��ka<br />

Ksi��ka wspó�czesna (druk cyfrowy)<br />

Autor<br />

Recenzent<br />

Redakcja<br />

DTP<br />

PDF<br />

Przygotowanie<br />

Przygotowanie<br />

Ksi��ka tradycyjna<br />

e-Ksi��ka<br />

+ metadane<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Maszyny<br />

drukarskie<br />

Biblioteka<br />

cyfrowa


Ksi��ka Ksi��ka tradycyjna a e-ksi��ka e ksi��ka<br />

Ksi��ka dawna lub drukowana z u�yciem klisz<br />

Autor<br />

Recenzent?<br />

Redakcja?<br />

DTP?<br />

Skanowanie TIFF<br />

Przygotowanie<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

+ metadane<br />

Biblioteka<br />

cyfrowa


Biblioteka cyfr. – nowe zadania<br />

Funkcje typowe dla drukarni:<br />

przetwarzanie sk�adu;<br />

montowanie publikacji;<br />

skanowanie, konwersja;<br />

Funkcje typowe dla wydawców:<br />

umowy licencyjne;<br />

regulacja praw autorskich;<br />

dora�na redakcja i sk�ad DTP;<br />

Funkcje typowe dla firm hostingowych:<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

utrzymanie w ruchu infrastruktury serwerów i ��czy.


Plan wyk�adu wyk�adu – cz. 2 z 3<br />

1. Dokument elektroniczny i jego <strong>kontekst</strong>y<br />

Kontekst normatywny<br />

Kontekst praktyczny<br />

2. Typologia formatów<br />

<strong>Formaty</strong> w cyklu tworzenia publikacji cyfrowej<br />

<strong>Formaty</strong> archiwalne<br />

<strong>Formaty</strong> prezencyjne<br />

3. <strong>Formaty</strong> <strong>hybrydowe</strong><br />

Portable Document Format<br />

DJVu, inne<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


<strong>Formaty</strong> dokumentów<br />

<strong>Formaty</strong> w cyklu tworzenia publikacji cyfrowej<br />

O etapach cyklu<br />

Ogólna typologia formatów<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Cykl tworzenia PC a formaty<br />

1. Przygotowanie materia�ów do digitalizacji<br />

2. Digitalizacja<br />

<strong>Formaty</strong><br />

po�rednie<br />

3. Obróbka plików, porz�dkowanie<br />

4. Przechowywanie<br />

5. Udost�pnianie<br />

* PC - publikacja cyfrowa<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Format<br />

archiwalny<br />

Format<br />

prezencyjny<br />

W. M. Kolasa


1. Przygotowanie materia�u materia�u<br />

Strategie:<br />

Digitalizacja;<br />

Digitalizacja wraz z konserwacj�;<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Digitalizacja po��czona z mikrofilmowaniem.<br />

Konwersja z formatów stosowanych w DTP do PDF<br />

W. M. Kolasa


Przygotowanie – podzia� podzia� mat.<br />

Typ orygina�u:<br />

czarno-bia�e (druk, rysunek itp.);<br />

kolorowe i pó�tonowe (fotografie, grafika itp.);<br />

Format orygina�u<br />

Ma�e (do A4);<br />

�rednie (A3-A2);<br />

Du�e (A1 i wi�ksze);<br />

Obiekty cenne<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


2. Digitalizacja<br />

Metody:<br />

Skanowanie lub filmowanie orygina�u;<br />

Skanowanie z mikroform;<br />

Skanowanie z filmów negatywowych;<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Konwersja z formatów po�rednich „paradigitalizacja”<br />

W. M. Kolasa


3. Obróbka plików<br />

<strong>Formaty</strong> plików (standardy i dobór);<br />

Wersjonowanie (f. archiwalny i prezencyjny);<br />

Retusz (f. prezencyjny);<br />

Konwersja (f. prezencyjny);<br />

OCR (f. prezencyjny);<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

��czenie i indeksowanie (f. archiwalny i prezencyjny).<br />

W. M. Kolasa


4. Utrwalenie, archiwizacja<br />

No�niki:<br />

CD/DVD/BD;<br />

Dyski;<br />

System oznacze�<br />

Notacja;<br />

Obs�uga wersjonowania;<br />

Zabezpieczenia:<br />

1 kopia (macierz archiwalna) – f. archiwalny;<br />

2 kopia (macierz u�ytkowa) – f. archiwalny;<br />

3 kopia (egz. u�ytkowy) – f. prezencyjny.<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


<strong>Formaty</strong> po�rednie po�rednie<br />

Zagadnienia:<br />

Automatyzacja zapisu skanów<br />

System notacji (nazwa, _,-, Aa, cyfry)<br />

gazeta_polska_1867_nr_078_s_0001<br />

No�nik<br />

Problemy:<br />

Pliki jedno- i wielostronicowe<br />

Skanowanie stron nieparzystych<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Skanowanie mat. w ró�nych trybach (bitonal, gray)<br />

W. M. Kolasa


5. Przechowywanie i udost�pnianie<br />

udost�pnianie<br />

Problem trwa�o�ci no�nika:<br />

CD/DVD/BD, HDD, Internet<br />

mikroformy<br />

Udost�pnianie:<br />

Offline (f. prezencyjny, f. archiwalny);<br />

intranet;<br />

no�niki CD/DVD/BD;<br />

Online (f. prezencyjny);<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Us�ugi: wydruki, wyp. miedzybibliot., us�ugi komercyjne<br />

W. M. Kolasa


<strong>Formaty</strong> archiwalne i prezencyjne<br />

Cechy formatu archiwalnego (FA):<br />

1. wysoka jako��;<br />

2. wierne odwzorowanie orygina�u.<br />

Cechy formatu prezencyjnego (FP):<br />

1. ma�e rozmiary;<br />

2. akceptowalna jako��;<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

3. wysoki poziom zorganizowania (indeksowania).<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

<strong>Formaty</strong> archiwalne i prezencyjne<br />

W. M. Kolasa


Zalecane formaty archiwalne<br />

TIF – bezstratna kompresja, obs�uga przestrzeni<br />

barwnej (RGB, CMYK) i wszystkich trybów g��bi<br />

bitowej; standard mi�dzyplatformowy (win/mac/unix)<br />

w wersji master - raczej bez kompresji<br />

raczej nie stosowa� plików wielostronicowych.<br />

PDF/A - ISO 19005:2005<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

zasadniczo chodzi tu o zaimportowanie do PDF<br />

dowolnych plików pierwotnych.<br />

bezpo�rednio nie s�u�y do odtwarzania danych<br />

– ma jedynie umo�liwi� ich bezstratny eksport.<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Zalecane parametry dla FA<br />

Dokumenty tekstowe: rozdzielczo�� (600 DPI); g��bia<br />

bitowa (24 lub 36 BPP)<br />

R�kopisy: rozdzielczo�� (600-800 DPI); g��bia bitowa<br />

(36 lub 48 BPP)<br />

Ikonografia: rozdzielczo�� (300-600 DPI); g��bia bitowa<br />

(24 lub 36 BPP);<br />

Fotografie: rozdzielczo�� (3200-6400 DPI); g��bia<br />

bitowa (16, 36, 48 BPP);<br />

Mikrofilmy: rozdzielczo�� (3200 DPI); g��bia bitowa<br />

(16 BPP);<br />

Szerzej - Decyzja NDAP (2005)<br />

W. M. Kolasa


Obj�to�� Obj�to�� a g��bia g��bia i rozdzielczo��<br />

rozdzielczo��<br />

Obj�to�� przyk�adowego skanu A4 (TIF, bez kompresji)<br />

800<br />

700<br />

600<br />

500<br />

400<br />

300<br />

200<br />

100<br />

0<br />

Skala<br />

szaro�ci 8<br />

bit<br />

Skala<br />

szaro�ci<br />

16 bit<br />

Kolor 36<br />

bit<br />

Kolor 48<br />

bit<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

300 dpi<br />

400 dpi<br />

600 dpi<br />

1200 dpi<br />

W. M. Kolasa


Obj�to�� Obj�to�� a g��bia g��bia i rozdzielczo��<br />

rozdzielczo��<br />

Obj�to�� przyk�adowego skanu A4 (TIF, bez kompresji)<br />

Rozdzielczo��<br />

Gray<br />

8 bit<br />

Gray<br />

16 bit<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Kolor<br />

36 bit<br />

Kolor<br />

48 bit<br />

300 dpi 8 16 33 50<br />

400 dpi 16 32 60 100<br />

600 dpi 33 66 133 200<br />

1200 dpi 133 266 533 800<br />

W. M. Kolasa


TIF – kompresja<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

�ród�o: A. Trembowiecki, Digitalizacja zbiorów bibliotecznych. Teoria i praktyka, Warszawa 2006


<strong>Formaty</strong> prezencyjne<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


<strong>Formaty</strong> prezencyjne - typologia<br />

� Tekstowe<br />

nieadnotowane (np. TXT) ***<br />

adnotowane (np. RTF)<br />

� Graficzne<br />

rastrowe (TIF, BMP, JPG, GIF, PNG) ***<br />

wektorowe (np. CorelDraw, AutoCAD)<br />

inne natywne (np. Photoshop, CorelPhoto-Paint)<br />

� Hybrydowe (PDF, djVu) ***<br />

� Specjalne: audio, wideo, aplikacyjne...<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

*** <strong>Formaty</strong> stosowane w <strong>bibliotekach</strong> <strong>cyfrowych</strong> W. M. Kolasa


<strong>Formaty</strong> a generacje bibliotek<br />

Biblioteki I generacji (1971-1995):<br />

- tekstowe (ASCI, HTML, RTF itp.) lub<br />

- grafika rastrowa (GIF, JPG, TIF, PNG).<br />

Biblioteki II generacji:<br />

- formaty <strong>hybrydowe</strong>: DJVu, PDF;<br />

- formaty graficzne: JPG, JPG2000, PNG, GIF + java;<br />

- formaty specjalne: mapy, nuty (zoomity, sibelius);<br />

- formaty multimedialne: mp3, mpeg, flash;<br />

- formaty aplikacyjne: np. java.<br />

Wojewódzka Biblioteka Publiczna w Krakowie


Wojewódzka Biblioteka Publiczna w Krakowie<br />

<strong>Formaty</strong> tekstowe - nieadnotowane<br />

TXT – plik tekstowy pozbawiony elementów<br />

typograficznych (formatowania). Zakodowany<br />

w standardzie ANSI lub UTF.<br />

Przyk�ad: Ala ma kota (11 znaków – 11 bajtów)<br />

W. M. Kolasa


<strong>Formaty</strong> tekstowe - adnotowane<br />

Np. RTF - (Rich Text Format). W odró�nieniu od TXT<br />

pozwala na zapis formatowania.<br />

Od wersji 1.6 obs�uguje UTF.<br />

Przyk�ad: Ala ma kota<br />

(11 znaków – 189 b)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


<strong>Formaty</strong> tekstowe - zalety i wady<br />

Zalety:<br />

Wady:<br />

Ma�y rozmiar pliku;<br />

Mo�liwo�� wyszukiwania tekstowego;<br />

Niski wspó�czynnik bezpiecze�stwa;<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Liczne standardy kodowania (ANSI, ISO, UTF...);<br />

<strong>Formaty</strong> i aplikacje natywne (np. Word);<br />

Brak mo�liwo�ci wiernego odwzorowania oryg.;<br />

Mo�liwe problemy z czcionkami (typy, kroje);<br />

Du�y nak�ad pracy podczas konwersji (OCR). W. M. Kolasa


Grafika rastrowa - wybór<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

JPEG –pe�na paleta barw, wysoki wspó�czynnik<br />

kompresji (tylko stratna), mo�liwa progresja, brak<br />

kana�u przezroczysto�ci. Dobre efekty i wierne odwzor<br />

dla obrazów z du�a liczb� szczegó�ów.<br />

GIF – 256 kolorów, kana� przezroczysto�ci, wysoki<br />

wspó�czynnik kompresji (tylko stratna). Dobre efekty<br />

dla obrazów z du�ymi jednorodnymi przestrzeniami.<br />

PNG –nast�pca GIFa, pe�na paleta barw, mo�liwa<br />

kompresja bezstratna. Sprawdza si� tylko dla<br />

niektórych kategorii obrazów (zrzuty, mapy).<br />

TIF – jako format prezencyjny sprawdza si� tylko dla<br />

obrazów bitonalnych, mo�liwa kompresja bezstratna.<br />

W. M. Kolasa


Obraz – kompresja stratna<br />

Bez kompresji (196 kB)<br />

�ród�o: Wikipedia<br />

Kompresja 25% (4 kB)<br />

Kompresja 5% (1,7 kB)<br />

Wojewódzka Biblioteka Publiczna w Krakowie


Tekst – kompresja tekstu<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Bez kompresji (5 kB)<br />

Kompresja 25% (2 kB)<br />

Kompresja 5% (1,2 kB)<br />

W. M. Kolasa


G��bia G��bia a jako�� jako��<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

24 BPP 8 BPP 4 BPP<br />

8 BPP 4 BPP 1 BPP<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Dla wi�kszo�ci wi�kszo�ci skanowanych druków<br />

Bitonal<br />

Kolor 4-8 BPP 1 BPP<br />

Gray 4 BPP<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Dla wspó�czesnych wspó�czesnych wyd. ilustrowanych<br />

RGB<br />

Kolor<br />

24 BP<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Problem prezentacji rastra<br />

Raster - bitonalny obraz sk�adaj�cy si� z drobnych<br />

kropek (lub linii), daj�cy podczas ogl�dania z<br />

normalnej odleg�o�ci wra�enie istnienia pó�tonów<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Raster w gazecie z lat 60.<br />

W. M. Kolasa


Z�udzenia Z�udzenia optyczne (raster, 1BPP)<br />

wyg�adzony brak wyg�adzenia<br />

Programowe renderowanie obrazów<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

FastStone<br />

ImageViewer<br />

FastStone<br />

MaxView<br />

xnView<br />

W. M. Kolasa


Korekty<br />

�ród�o: L. Buczy�ski: Skanery i skanowanie. Warszawa 2005<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Przetwarzanie wsadowe (win)<br />

W. M. Kolasa


Przetwarzanie wsadowe (unix ( unix)<br />

ImageMagick/DJVulibre/bash (przyk�ady):<br />

Wszystkie djvu do tiff [1 strona] (ddjvu):<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

find . -name '*.djvu' -exec ddjvu -v -format=tiff -<br />

page=1 {} {}.tiff ';’<br />

Miniatury 200 pix z wszystkich tiff (ImageMagick):<br />

find . -name '*.tiff' -exec mogrify -format jpg -quality<br />

82 -thumbnail 200 {} ';’<br />

W. M. Kolasa


Narz�dzia Narz�dzia do grafiki rastrowej<br />

Edytory:<br />

Adobe Photoshop – komercyjny (win, mac) – GUI;<br />

Gimp – bezp�atny (unix, win, mac) – GUI;<br />

ImageMagic – bezp�atny (unix, win, mac) – konsola.<br />

Przegl�darki i konwertery (bezp�atne):<br />

FastStone Viewer (win);<br />

xnView (win);<br />

irfanView (win);<br />

liczne narz�dzia (linux, mac)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


<strong>Formaty</strong> rastrowe - zalety i wady<br />

Zalety:<br />

Wady:<br />

Wierne odwzorowanie orygina�u;<br />

Ma�y nak�ad pracy podczas tworzenia;<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Standardy mi�dzyplatformowe (jpeg, gif, tif, png);<br />

�atwo�� u�ytkowania, du�a popularno�� na www.<br />

Du�a obj�to�� pliku (w stosunku do jako�ci);<br />

Brak mo�liwo�ci osadzania warstwy tekstowej;<br />

Zwykle poddane kompresji stratnej (prezencyjne);<br />

Niski poziom zorganizowania (obrazy jednostr.).<br />

W. M. Kolasa


Dylemat: tekst czy grafika<br />

Kazania �wi�tokrzyskie<br />

czytelne,<br />

nieautentyczne<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

nieczytelne,<br />

autentyczne<br />

W. M. Kolasa


Plan wyk�adu wyk�adu – cz. 3 z 3<br />

1. Dokument elektroniczny i jego <strong>kontekst</strong>y<br />

Kontekst normatywny<br />

Kontekst praktyczny<br />

2. Typologia formatów<br />

<strong>Formaty</strong> w cyklu tworzenia publikacji cyfrowej<br />

<strong>Formaty</strong> archiwalne<br />

<strong>Formaty</strong> prezencyjne<br />

3. <strong>Formaty</strong> <strong>hybrydowe</strong><br />

Portable Document Format<br />

DJVu, inne<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Format hybrydowy<br />

Cechy:<br />

Mo�e ��czy� cechy formatów tekstowych i<br />

graficznych;<br />

Oferuje wysoki poziom zorganizowania<br />

–mo�liwa obs�uga struktury logicznej dokumentu;<br />

Inne nowe mo�liwo�ci<br />

Wybrane specyfikacje:<br />

PDF<br />

DJVu<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Portable Document Format<br />

PDF (Portable Document Format) - jest formatem plików<br />

s�u��cym do prezentacji, przenoszenia, drukowania<br />

i przechowywania tre�ci tekstowo-graficznych.<br />

J�zykiem opisu PDF jest okrojona wersja j�zyka<br />

PostScript wzbogacona o elementy hipertekstowe<br />

i aplikacyjne.<br />

Twórca: Adobe Systems<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Portable Document Format<br />

PDF w zale�no�ci od wersji mo�e pe�ni� okre�lone<br />

funkcje:<br />

1. Zastosowanie do celów poligraficznych –PDF/X<br />

(ISO 15930; ISO TC130)<br />

2. Kontenera danych – PDF/A (ISO 19005; ISO TC171)<br />

3. Zastosowanie do wymiany obiektów graficznych i<br />

dokumentacji technicznej – PDF/E (ISO TC171)<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Portable Document Format<br />

W plikach PDF mo�e by� zawarty tekst, grafika<br />

(rastrowa, wektorowa), a tak�e elementy aktywne.<br />

W styczniu 2007 Adobe ca�kowicie otwar�a format<br />

PDF i przekaza�a jego specyfikacj� organizacji AIIM.<br />

2 lipca 2008 og�oszono norm� ISO 32000-1:2008<br />

W. M. Kolasa


Czym jest PDF?<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

1. PDF – podstawa nowoczesnej poligrafii<br />

(du�e pliki wysoka jako�� – np. PDF/X).<br />

2. Mo�e pe�ni� funkcj� kontenera (PDF/A; PDF/E).<br />

3. PDF – jako format prezencyjny<br />

- ale po wyrafinowanych zabiegach adaptacyjnych.<br />

4. PDF – w pe�ni poprawnie funkcjonuje tylko na<br />

oprogramowaniu Adobe.<br />

5. Mog� istnie� problemy prawne (por. licencje EULA).<br />

6. PDF – format bardzo z�o�ony, ��czy: tekst, grafik�<br />

rastrowa i wektorow� oraz elementy aplikacyjne.


Wojewódzka Biblioteka Publiczna w Krakowie<br />

PDF (w poligrafii i nie tylko)<br />

W. M. Kolasa


PDF - narz�dzia narz�dzia<br />

1. Adobe Acrobat - edytor (komercyjny)*<br />

2. Brak godnych polecenia edytorów bezp�atnych;<br />

3. Liczne przegl�darki (na czele z Adobe Reader);<br />

4. Liczne drukarki wirtualne (z regu�y bezp�atne) lub<br />

wbudowane w aplikacje (np. MS Office, AutoCad);<br />

5. Liczne narz�dzia do manipulacji na plikach PDF;<br />

6. Poza Adobe Acrobatem wszystkie narz�dza oferuj�<br />

tylko pewien poziom obs�ugi formatu PDF (skutkuje<br />

to z�� jako�ci�, rozmiarem, niepoprawnymi<br />

parametrami).<br />

* Nadto inne specjalistyczne stosowane w poligrafii<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Adobe Acrobat 8.0 Prof. (9.0)<br />

W. M. Kolasa


Adobe Acrobat – wybrane funkcje<br />

- mo�liwo�� manipulacji na danych (uk�ad, grafika,<br />

tekst, czcionki, parametry obiektów itp.);<br />

- mo�liwo�� importu dowolnych danych;<br />

- mo�liwo�� dodania warstwy OCR*;<br />

- zabezpieczenia; metadane;<br />

- narz�dza do edycji i optymalizacji;<br />

optymalizacji<br />

- formularze, komentarze,<br />

- liczne opcje eksportu;<br />

- narz�dzia kontroli i inspekcji.<br />

* Niska jako�� wbudowanego engine OCR<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

PDF – (zaimportowany TIF)<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

PDF – obiekt tekstowo-graficzny<br />

tekstowo graficzny<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

PDF – osadzone matadane<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

PDF – osadzony DublinCore<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Optymalizacja – zawsze potrzebna<br />

W. M. Kolasa


PDF – wirtualne drukarki<br />

Mimo szerokiej oferty programów – tylko nieliczne<br />

dzia�aj� w pe�ni poprawnie:<br />

1. Narz�dzia oparte na silniku Adobe:<br />

Acrobat Distiller i kontrolki Adobe (InDesign i in.)<br />

Wtyczki do popularnych programów (Word, Corel,<br />

AutoCad)<br />

2. Niektóre programy oparte na GPL/AFPL GhostScript:<br />

PDF Creator*;<br />

Wtyczki do OpenOffice i GoogleDoc.<br />

3. Uniksowe narz�dzia do PostScriptu.<br />

* Drobne b��dy<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Adobe Distiller<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


PDF – eksport z InDesign<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


PDF Creator<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


PDF Creator – b��dy b��dy<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


PDF – edycja<br />

Nieliczne dzia�aj�ce poprawnie bezp�atne programy,<br />

które s�u�ba do ��czenia, dzielenia, naprawy,<br />

nak�adania znaków wodnych; ustawiania<br />

zabezpiecze�; manipulacji na PDF.<br />

- PDF Tools (win)<br />

- PDFTK (win, unix)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


PDFTools<br />

http://www.sheelapps.com/<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


PDF TK (unix ( unix)<br />

Wybrane polecenia:<br />

rozdziel na pojedyncze strony:<br />

pdftk nazwa.pdf burst<br />

sklej wszystkie pliki pdf):<br />

pdftk cat *.pdf output nowy.pdf<br />

napraw plik:<br />

pdftk stary.pdf output nowy.pdf<br />

zmie� wersj� PDF (do 1.2):<br />

ps2pdf12 stary.pdf nowy.pdf<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


PDF TK (win)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


PDF – eksport<br />

Funkcj� kontrolera eksportu do tif/jpg mo�e pe�ni� :<br />

Ghostscript/Ghostview lub jego klony:<br />

PDFill PDF Tools lub<br />

PDF-XChange<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Narz�dzia te nie oferuj� dost�pu do opcji zaawansowanych<br />

Brak jednak sprawnych bezp�atnych programów do<br />

optymalizacji PDF i edycji metadanych.<br />

W. M. Kolasa


PDFill<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

AFPL GhostScript+GSview<br />

GhostScript GSview<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Nowe horyzonty AdobeDigital<br />

W. M. Kolasa


AdobeDigital<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


AdobeDigital<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Spo�eczno��: Spo�eczno��: Adobe<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Adobe DC: http://www<br />

http:// www.adobe adobe.com com/devnet devnet/acrobat acrobat/<br />

W. M. Kolasa


Spo�eczno��: Spo�eczno��: PDF<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

PDF Zone: Zone:<br />

http://www<br />

http:// www.pdfzone pdfzone.com com/<br />

W. M. Kolasa


Spo�eczno��: Planet PDF http://www<br />

http:// www.planetpdf planetpdf.com com/<br />

Spo�eczno��:<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Zalety i wady PDF (jako formatu prezencyjnego)<br />

Zalety<br />

Popularno��, �atwo�� u�ytkowania;<br />

Idealny dla ma�ych tekstowych dokumentów;<br />

Umo�liwia popr. wy�wietlanie skomplikowanych<br />

znaków (np. mat., chem.) tworzonych LaTeXem.<br />

Wady:<br />

Du�e rozmiary plików dla dokumentów innych ni�<br />

tekstowe;<br />

Problem z sekwencyjnym serwowaniem i<br />

wy�wietlaniem stron;<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Potencjalne problemy z osadzonymi fontami.<br />

W. M. Kolasa


DjVu<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

DjVu - technologia rozwijana od 1996 r. przez koncern<br />

AT&T do kompresji skanowanych dokumentów.<br />

Oprogramowanie oparte na tej technologii stworzy�a i<br />

opatentowa�a firma LizardTech Inc.<br />

Od 2008 roku – technologia rozwijana pod szyldem<br />

Celartem Technology Inc. (spó�ki matki, która jest<br />

w�a�cicielem LizardTecha).<br />

W. M. Kolasa


Czym jest DjVu<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Format DJVu w przeciwie�stwie do PDF ma charakter<br />

czysto graficzny.<br />

Algorytm DJVu opiera si� na metodzie segmentacji<br />

obrazu i wydzieleniu warstw (por. Photoshop)<br />

Wynikowe pliki - najmniejsze z mo�liwych (por. JPG)<br />

Mo�e mie� zakotwiczona warstw� tekstow� OCR.<br />

Jasny status prawny – brak ogranicze� licencyjnych<br />

zarówno do celów nie komercyjnych jak i niekomerc.<br />

Istniej� zarówno komercyjne (Cartlem/LizardTech),<br />

jak i bezp�atne aplikacje (DJVuLibre)


Wojewódzka Biblioteka Publiczna w Krakowie<br />

DjVu – w�a�ciwo�ci w�a�ciwo�ci dokumentu<br />

W. M. Kolasa


Warstwy<br />

Kolor<br />

Tre��<br />

T�o<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Trzy warstwy t�a<br />

W. M. Kolasa


Warstwy djvu<br />

�ród�o: Léon Bottou: Efficient Conversion of Digital Documents to Raster Formats Multilayer (2001)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DjVu – ma�e ma�e rozmiary<br />

Ma�e rozmiary<br />

Dokumenty DjVu<br />

s� nieedytowalne<br />

daj� wi�c gwarancj�<br />

wiarygodno�ci<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Morfologia pliku djvu


Wojewódzka Biblioteka Publiczna w Krakowie<br />

DjVu – kompresja (zestawienie)<br />

W. M. Kolasa


DjVu – pejza� pejza�<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DJVu – dokumenty matematyczne


DJVU - akwarele


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Dokumentacja techniczna<br />

�ród�o – GB Soft


DJVu – portret<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DJVu – rysunek<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

DJVu – jako�� jako�� poligraficzna


Wojewódzka Biblioteka Publiczna w Krakowie<br />

DJVu – jako�� jako�� poligraficzna


DJVu – zoom 1000% (600 dpi) dpi<br />

Jako��<br />

poligraficzna<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DjVu - oprogramowanie<br />

Edytory:<br />

Document Express – edytor, komercyjny (win, unix)<br />

DJVU Virtual Printer – drukarka, komercyjna (win)<br />

DjVu Solo – prosty bezp�atny edytor (win)<br />

DjVuLibre – bezp�atny pakiet narz�dziowy (unix, win)<br />

Przegl�darki (bezp�.):<br />

- DjVu Browser (LizardTech) 6.1<br />

- DJView 4.3 (DjVuLibre)<br />

- Inne (unix, win i inne) – wyra�nie s�absze<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Document Express Editor<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Document Express Editor Prof.<br />

Funkcje*:<br />

- import plików (TIF, BMP, inne)<br />

- manipulacje stronami dokumentu;<br />

- dodawanie adnotacji, etykiet, linków;<br />

- OCR<br />

- eksport do formatów graficznych;<br />

- wydruk do DjVu z dowolnej aplikacji (drukarka)<br />

- obs�uga skanowania<br />

* W wersji Enterprise znacznie wi�cej opcji i funkcji<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DjVu Solo (bezp�atny)<br />

(bezp�atny)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DjVu Virtual Printer<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DjVuLibre (unix unix) - przyk�ady przyk�ady<br />

Wszystkie PDF do djvu (bez OCR) [pe�ny kolor]<br />

Wstaw adnotacj� do wszystkich djvu<br />

find . -name 'e*.djvu' -exec djvused -f<br />

nasz.txt nasz.txt {} -s {} -v -s ';’ -v ';’<br />

Osad� miniaturki we wszystkich djvu<br />

find . -name '*.djvu' -exec djvused {} {}<br />

-e 'set-thumbnails' -e 'set-thumbnails' -s -v -s ';' -v ';'<br />

Zapisz jako rozdzielony:<br />

.../djvmcvt ...\ djvmcvt-i-iinput.djvu input.djvu . . index.djvu<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

find . -name '*.pdf' -exec djvudigital -dpi=600<br />

-exact-color {} ';'<br />

W. M. Kolasa


pdf2djvu (unix ( unix) - przyk�ady przyk�ady<br />

Konwersja pdf do djvu (wraz z OCR)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

root@helios:~/pdfx/$ pdf2djvu --words --dpi=600<br />

pismo.pdf > pismo.djvu:<br />

- page #1 -> #1<br />

...<br />

0.227 bits/pixel; 1.656:1, 39.62% saved, 1275423<br />

bytes in, 770040 bytes out<br />

Niestabilna wersja<br />

windows/cygwin<br />

W. M. Kolasa


DjVu Browser – szybki, sprawny<br />

Tre��<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

DJView 4.3 – nowe mo�liwo�ci<br />

mo�liwo�ci<br />

W. M. Kolasa


Najwi�ksze Najwi�ksze biblioteki (z DJVu) DJVu<br />

Internet Archive: http://www.archive.org/<br />

Open Library: http://openlibrary.org/<br />

Gutenberg Consortia Center: http://gutenberg.cc/<br />

Nadto liczne o zasi�gu narodowym:<br />

USA<br />

Japonia<br />

Rosja<br />

Polska<br />

Islandia<br />

W�ochy i in.<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Wiele formatów: IA/OL<br />

Tre��<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DJVu z IA<br />

Tre��<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Zalety i wady DJVu<br />

Zalety<br />

Wady<br />

Bardzo ma�e rozmiary;<br />

Sekwencyjne wy�wietlanie (str. fizycznie rozdzielone);<br />

Idealny dla d�ugich dokumentów;<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Du�y wybór aplikacji komercyjnych i bezp�atnych;<br />

Jasna sytuacja prawna, wsparcie w Polsce (GB Soft).<br />

Nieco trudny w obs�udze w fazie tworzenia, konwersji;<br />

Ma�o skuteczny engine OCR wbudowany w DE.<br />

W. M. Kolasa


Kilka wskazówek<br />

Jak w djvu poprawi� OCR?<br />

Jak wykona� djvu i OCR przy 72 dpi?<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Jak zaprojektowa� rozwi�zanie serwerowe<br />

W. M. Kolasa


Poprawa OCR<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

1. Eksport DJVu do TIFF wielostronicowy (najlepiej 1BPP)<br />

W. M. Kolasa


Poprawa OCR<br />

2. OCR w Abbyy Fine Reader i zapis do wi�zki wi�zki<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Poprawa OCR – osadzanie wi�zki wi�zki<br />

W. M. Kolasa


DJVuOCR – inne opcje<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


DJVuLibre – djvused [edytor]<br />

Fragment strony pomocy:<br />

Parametr:<br />

-- set-txt set txt [djvusedtxtfile]<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Insert hidden text information into the selected pages. The optional<br />

argument djvusedtxtfile names a file containing the hidden text information.<br />

This file must contain data similar to what is produced by command printtxt.<br />

When the optional argument is omitted, the program reads the hidden<br />

text information from the djvused script until reaching an end-of-file or a<br />

line containing a single period.<br />

....<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Jak wykona� wykona� djvu i OCR z 72 dpi? dpi<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Jak wykona� wykona� djvu i OCR z 72 dpi? dpi<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

DJVu – rozwi�zanie rozwi�zanie serwerowe<br />

1. Infrastruktura oparta na Document Express Enterprise<br />

wraz z elementami dedykowanymi – komercyjne<br />

2. Infrastruktura wykorzystuj�ca równolegle Document<br />

Express Prof. i komponenty bezp�atne na platform�<br />

linuksa (DJVuLibre, Tesseract, ImageMagick, pdftk).<br />

3. Jak 2. – ale zamiast Tesseracta u�ywany jest Abbyy<br />

FineReader (komercyjny).<br />

W. M. Kolasa


DJVu – serw. rozwi�zanie rozwi�zanie 2-3 2<br />

1. Dwie metody tworzenia djvu:<br />

na platformie linuksa – wówczas jedynie kopiujemy<br />

pdf lub tif na serwer (DJVuLibre lub pdf2djvu);<br />

wykonane w aplikacjach windows – w tym<br />

przypadku kopiujemy na serwer pliki djvu do<br />

dalszej obróbki;<br />

2. Przed OCR. eksport djvu do TIFF (ddjvu);<br />

3. OCR (Tesseract lub FineReader);<br />

4. Osadzanie tekstu z djvu (djvused)<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

5. Czynno�ci ko�cowe: miniatury jpg, thumb, rozdzielnie<br />

6. Kopiowanie gotowych katalogów z serwera na udzia�y samby.<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

DJVu – rozwi�zanie rozwi�zanie serwerowe<br />

PDF/X<br />

maj� du��<br />

obj�to��<br />

FTP 4 Mb/s<br />

PDF-djvu –<br />

konwersja<br />

formatu A2<br />

trwa d�ugo<br />

(30 sek./str.)<br />

Obróbka<br />

grafiki<br />

potrzebuje<br />

du�ej mocy<br />

W. M. Kolasa


Abbyy FineReader – skuteczny, inteligentny<br />

�ród�o: AutoID<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

API (rozwi�zania dedykowane) wersja pude�kowa<br />

W. M. Kolasa


Tesseract - bezp�atny bezp�atny<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Kto tak pracuje?<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Google Books - tekst<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Any2DjVu Server<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Spo�eczno�ci<br />

Spo�eczno�ci<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Spo�eczno�ci<br />

Spo�eczno�ci<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Spo�eczno�ci<br />

Spo�eczno�ci<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Inne formaty: TeX<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

Natywne formaty prezencyjne TeX, Latex – popularne w<br />

kr�gach matematyków, fizyków i in�ynierów (*.dvi)<br />

W. M. Kolasa


Inne formaty: postscript<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

PostScript - niezale�nym od urz�dzenia wyj�ciowego<br />

j�zykiem programowania, który opisuje tekst<br />

i grafik� na stronie.<br />

Jego polecenia steruj� drukark� laserow� (lub dowolnym<br />

innym urz�dzeniem postscriptowym), umieszczaj�c w<br />

odpowiednim miejscu lini�, okr�g, tekst czy te� map�<br />

bitow�.<br />

Do odczytu plików Postscriptowych (*.ps) mo�na u�y�<br />

programu GhostScript (GSview)<br />

W. M. Kolasa


Wojewódzka Biblioteka Publiczna w Krakowie<br />

Zoomify EZ, Google Maps<br />

Inteligentna forma prezentacji jpg (ci�cie, scalanie)


Zoomify (z Photoshopem)<br />

Photoshopem<br />

Wojewódzka Biblioteka Publiczna w Krakowie


Sibelius<br />

Inteligentna forma ��czenia obrazu i d�wi�ku<br />

Wtyczka<br />

W. M. Kolasa


Sibelius<br />

W. M. Kolasa


Technologia czy sztuka?<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Technologia<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Sztuka<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Profesja<br />

Wojewódzka Biblioteka Publiczna w Krakowie<br />

W. M. Kolasa


Dzi�kuj�<br />

Dzi�kuj�

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!