Digitalizace

Pro digitalizaci periodik a knih používáme různé skenery v závislosti na kvalitě a velikosti svazků.

Robotický skener pro cenné a unikátní exempláře

Zvláště cenné, unikátní výtisky se digitalizují pomocí tzv. robotického skeneru, který umožňuje otevřít knihu pouze o 90 stupňů, čímž se zabrání poškození vazby. Robotický skener používá 2 kamery s vysokým rozlišením, které vytvářejí velmi kvalitní snímky v rozlišení až 400 DPI ve formátu TIFF nebo JPG. Těsnicí hranol je velmi jemný a listování se obvykle provádí v poloautomatickém režimu.

Robotický skener pro cenné a unikátní exempláře

Skener pro knihy pro velkoformátové kopie

Velké dokumenty (větší než A3) se digitalizují pomocí tzv. skeneru pro knihy, kde velikost stránky může být až A2. Skenovací osvětlení a skenování vytvářejí velmi kvalitní snímky a verze, která nevyžaduje otevření svazků o 180 stupňů, je stále běžnější.

Skener pro knihy pro velkoformátové kopie

Skener pro dokumenty pro rychlost a kvalitu

Nejefektivnější, nejrychlejší a nejkvalitnější digitalizace se dosahuje pomocí skenerů pro dokumenty, pokud zpracovávaný soubor pozůstává z listů nebo jej lze zploštit. Skenery dokáží skenovat obě strany dokumentů formátu A3+ (až do šířky 30,7 cm) vysokou rychlostí a zároveň vytvářet vysoce kvalitní obrázky. Válečkový systém skenerů a technika podávání listů jsou velmi šetrné, takže lze bezpečně zpracovávat i nekvalitní, roztřepené, potrhané nebo dokonce vysoce kyselé listy, a skenování papíru s tenkou blánou také není žádný problém. Výstupní formáty jsou také flexibilní, od černobílého skenování v rozlišení 200 DPI až po nekomprimovaný formát TIFF v rozlišení 600 DPI. Délka dokumentů také není omezena a může dosahovat až 1 metru.

Skener pro dokumenty pro rychlost a kvalitu

Často se nám stává, že jsou nám zaslány dokumenty velmi velkého rozměru (mapy, grafy, umělecké reprodukce). Tyto dokumenty vyžadují velkoformátový skener s velmi jemným válečkovým systémem a šetrným osvětlovacím systémem.

Zpracování pomocí rozpoznávání textu (OCR)

Dalším krokem při zpracování tištěných dokumentů je tzv. rozpoznávání textu (OCR), při kterém se obrázek převede na text. Účinnost a přesnost dnes používaného softwaru je velmi dobrá, dokonce i v případě tisků z 19. století dokážou rozpoznat text s přesností 98-99% a v případě vysoce kvalitních tisků to může být až 99,5%. Výsledkem automatického rozpoznávání textu je tzv. dvouvrstvé PDF, přičemž horní vrstvu tvoří naskenovaný obrázek a spodní vrstvu text. Uživatel tak vidí autentický obrázek, zatímco vyhledávání probíhá v textu.

Příklad rozpoznávání textu pomocí OCR.

Dvouvrstvé soubory PDF pro rychlé a podrobné vyhledávání

V dvouvrstvých PDF souborech se nacházejí záložky, které mohou obsahovat název článku, autora, datum vydání, rok nebo dokonce název kapitoly knihy. Výsledný standardní dvouvrstvý soubor PDF je vhodný pro publikování na internetu.

Pro publikování dvouvrstvých souborů PDF používáme vlastní software, který umožňuje sofistikované, vysokorychlostní vyhledávání v celém textu, procházení mezi hledanými výrazy, a také zobrazování a zvýrazňování výsledků. Kromě logických operátorů (AND, OR, NOT) můžete během vyhledávání použít také operátory blízkosti (dvě nebo více slov vedle sebe) nebo zkrátit hledané výrazy, a to zprava, zleva nebo uvnitř slova. K zobrazení stránek PDF používáme program, který jsme vyvinuli my. Tento program dokáže rychle a efektivně prezentovat stránky PDF, zvýrazňovat výsledky, měnit měřítko stránek, a tyto stahovat.

Výrobní technologie a nástroje, které jsme vyvinuli, dokáží digitalizovat jakýkoli typ, velikost a kvalitu dokumentu, rozpoznat text a publikovat výsledné dvouvrstvé soubory PDF online pomocí rychlého a sofistikovaného systému vyhledávání a zobrazování.

Vyzkoušejte zde

Stovky vědeckých časopisů, úředních věstníků, deníků, týdeníků a knih v maďarštině, rumunštině, češtině a slovenštině s přibližně 10 miliony nových stran ročně.

Vyzkoušet
Vyzkoušejte zde

Stovky vědeckých časopisů, úředních věstníků, deníků, týdeníků a knih v maďarštině, s přibližně 4-5 miliony nových stran ročně.

Vyzkoušet

Arcanum logo

Arcanum Adatbázis Kft. je předním poskytovatelem obsahu v Maďarsku, které zahájilo svou činnost 1. ledna 1989. Společnost se zabývá rozsáhlou digitalizací, správou databází a vydáváním kulturního obsahu.

O nás Kontakt Tisková místnost

Languages