Digitalizacja piśmiennictwa - Biblioteka Narodowa

EN

Digitalizacja piśmiennictwa

DIGITALIZACJA PIŚMIENNICTWA. AKTUALIZACJA

Prezentowane opracowanie, aktualizujące wybrane rozdziały poprzedniego wydania Digitalizacji piśmiennictwa, jest wynikiem usystematyzowania nowych zaleceń dotyczących kwestii związanych ze standardami metadanych oraz analizy zmian technologicznych zachodzących w digitalizacji. Praktyczna weryfikacja dotychczasowej wiedzy dokonana w czasie realizacji dużych projektów digitalizacyjnych pozwala na przedstawienie skutecznych, racjonalnych sposobów działania, które będą przydatne dla instytucji planujących i prowadzących digitalizację obiektów dziedzictwa kulturowego, zwłaszcza materiałów bibliotecznych.

Digitalizacja jest na tyle młodą dziedziną działalności, że osoby zaangażowane w projekty digitalizacyjne muszą wciąż nabywać nowych umiejętności, zarówno poprzez lekturę, jak też przez praktyczne uczenie się i weryfikowanie błędów. Niezwykle istotny może być na pewno także udział w szkoleniach i warsztatach prowadzonych przez bardziej doświadczone koleżanki i kolegów oraz korzystanie z zasobów internetowych, takich jak materiały dostępne na stronie Centrum Kompetencji BN (https://bn.org.pl/usługi/centrum-kompetencji/edukacja).

Zapraszamy do kontaktu: potrzeby i sugestie można przekazywać pod adresem e-mailowym – centrum.kompetencji@bn.org.pl.

Digitalizacja piśmiennictwa. Podręcznik pod redakcją Dariusza Paradowskiego

Zespół pracowników Biblioteki Narodowej, złożony z informatyków, bibliotekarzy i redaktorów cyfrowych oraz skanerzystów i pracowników komórek merytorycznych opracował modelową ścieżkę digitalizacji zbiorów w bibliotece. Wszystkie elementy procesu i udostępniania zeskanowanych obiektów od momentu zdjęcia przez magazyniera książki z półki, poprzez określenie warunków skanowania przez konserwatora, wykonanie kopii cyfrowej, kontrolę skanów, sprawdzenie czy obiekt może zostać udostępniony w otwartym internecie, czy może można go udostępnić tylko na komputerach wewnątrz biblioteki, ustawienie kolejności stron, opublikowanie – aż do momentu odstawienia przez magazyniera książki na półkę – zostały opisane i oprogramowane. Ścieżka digitalizacji została podzielona na moduły, a program przygotowany tak, żeby był przydatny także dla mniejszych instytucji.

Opracowano mapowania opisów z systemu MARC 21, w którym przygotowywane są opisy bibliograficzne w bibliotekach do schematu metadanych, który zostanie wykorzystany w nowej bibliotece cyfrowej. Duży nacisk położono na wykorzystanie Języka Haseł Przedmiotowych w wyszukiwaniu obiektów w POLONIE. Prace te są wstępnym etapem budowy sieci semantycznej dla zbiorów bibliotecznych.

Opracowano zalecenia dotyczące sposobu digitalizacji książek i czasopism, określające sposób digitalizacji druków o walorach historycznych (starych druków, druków opublikowanych przed 1945 r.) oraz publikacji współczesnych, mających na celu ułatwienie automatyzacji procesów optycznego rozpoznawania tekstu w skali masowej. Przygotowano katalog praktyk w zakresie standardów digitalizacji. Katalog ten dotyczy technologii skanowania, zalecanych formatów i rozdzielczości oraz metadanych opisowych. Określono minimalny zestaw metadanych dla poszczególnych kategorii zbiorów bibliotecznych taki, który pozwoli zidentyfikować obiekt bez zbędnych wątpliwości.

Szegółowo określono zestaw niezbędnych zabiegów konserwacyjnych i regeneracyjnych, jakim muszą zostać poddane obiekty kierowane do skanowania, w szczególności mikrofilmy zwojowe, które będą poddawane masowej digitalizacji na automatycznym skanerze do mikrofilmów. Wypracowano także zalecenia dotyczące obróbki graficznej skanów mikrofilmów, które są często słabej jakości i wymagają poprawy poprzez np. zmianę kolorystyki, co ułatwia zarówno czytanie materiałów jak i przygotowanie ich wersji pełnotekstowych.

Dobrą praktyką stosowaną w BN odwzorowywanie rzeczywistego skanu obiektu – w tym jednak wypadku podjęto decyzję o ingerencji na rzecz zwiększenia czytelności skanów. 

Opracowano wytyczne skanowania obiektów, które mają być poddane procesowi optycznego rozpoznawania tekstu, czyli zabiegowi, który umożliwia przeszukiwanie treści książek, czasopism, ulotek po słowie. Wersje pełnotekstowe wytwarzane są w sposób automatyczny dzięki zakupionemu przez BN systemowi ABBY Recognition Server oraz przy użyciu programu ADOBE Acrobat. W szczególnych wypadkach obiekty poddawane są ręcznej korekcie wykonywanej przez pracowników POLONY.