Digitalizácia

Na digitalizáciu periodík a kníh používame rôzne skenery v závislosti od kvality a veľkosti zväzkov.

Robotický skener pre cenné a jedinečné tlače

Obzvlášť cenné, unikátne výtlačky sa digitalizujú pomocou tzv. robotického skenera, ktorý umožňuje otvoriť knihu len o 90 stupňov, čím sa zabráni poškodeniu väzby. Robotický skener používa 2 kamery s vysokým rozlíšením na vytváranie veľmi kvalitných obrázkov s rozlíšením až 400 DPI vo formáte TIFF alebo JPG. Upevňovací hranol je veľmi šetrný a vyrovnávanie sa zvyčajne vykonáva v poloautomatickom režime.

Robotický skener pre cenné a jedinečné tlače

Skener kníh pre veľkoformátové tlače

Veľké dokumenty (väčšie ako rozmery A3) sa digitalizujú pomocou tzv. skenera kníh, kde veľkosť strany môže siahať až do rozmeru A2. Skenovacie osvetlenie a skenovanie vytvárajú veľmi kvalitné obrazy; verzia, ktorá nevyžaduje otvorenie zväzkov o 180 stupňov, je čoraz obľúbenejšia.

Skener kníh pre veľkoformátové tlače

Skener dokumentov pre rýchle a kvalitné spracovanie

Najefektívnejšia, najrýchlejšia a najkvalitnejšia digitalizácia sa dosahuje pomocou skenerov dokumentov, ak je súbor, ktorý sa má spracovať, v hárkoch alebo sa dá vyrovnať na hárky. Skenery dokážu naskenovať obe strany dokumentov formátu A3+ (do šírky 30,7 cm) vysokou rýchlosťou a zároveň vytvárať vysokokvalitné obrázky. Systém valcov skenera a technika podávania listov sú mimoriadne šetrné, takže aj nekvalitné, roztrhané, natrhnuté alebo dokonca silno zožltnuté listy možno spracovať veľmi bezpečne; skenovanie papiera s tenkou membránou taktiež nepredstavuje žiadny problém. Výstupné formáty sú tiež flexibilné, od čiernobieleho skenovania s rozlíšením 200 DPI až po nekomprimovaný formát TIFF s rozlíšením 600 DPI. Dĺžka dokumentov taktiež nie je obmedzená, môžu dosiahnuť dĺžku až 1 metra.

Skener dokumentov pre rýchle a kvalitné spracovanie

Často sa nám stáva, že v prílohách dostávame veľmi rozsiahle dokumenty (mapy, grafy, umelecké reprodukcie). Tieto dokumenty si vyžadujú veľkoformátový skener s veľmi jemným valčekovým systémom a šetrným systémom osvetlenia.

Spracúvanie pomocou rozpoznávania textu (OCR)

Ďalším krokom pri spracúvaní tlačených dokumentov je tzv. rozpoznávanie textu (skratka po anglicky: OCR), pri ktorom sa obrázok prevedie na text. Účinnosť a presnosť dnes používaného softvéru je veľmi vysoká, dokonca aj tlače z 19. storočia dokážu rozpoznať text s presnosťou 98-99 % a v prípade kvalitných tlačí to môže byť až 99,5 %. Výsledkom automatického rozpoznávania textu je takzvaný dvojvrstvový súbor PDF, ktorého vrchnú vrstvu tvorí naskenovaný obrázok a spodnú vrstvu text. Takto používateľ vidí autentický obrázok, zatiaľ čo vyhľadávanie sa vykonáva v texte.

Príklad rozpoznávania textu (OCR).

Dvojvrstvové súbory PDF pre rýchle a podrobné vyhľadávanie

Dvojvrstvové súbory PDF obsahujú záložky, ktoré môžu obsahovať názov článku, meno autora, dátum vydania, rok alebo dokonca názov kapitoly knihy. Výsledný štandardný dvojvrstvový súbor PDF je vhodný na publikovanie na internete.

Na publikovanie dvojvrstvových súborov PDF používame vlastný softvér, ktorý umožňuje sofistikované, vysokorýchlostné celotextové vyhľadávanie, prechádzanie medzi vyhľadávanými výrazmi, zobrazovanie a zvýrazňovanie výsledkov. Okrem logických operátorov (AND, OR, NOT) môžete počas vyhľadávania použiť aj operátory blízkosti (dve alebo viac slov, ktoré sa nachádzajú vedľa seba) alebo skrátiť hľadané slovo buď sprava, zľava alebo vnútri výrazu. Na zobrazenie stránok PDF používame vlastný program. Tento program dokáže rýchlo a efektívne prezentovať stránky PDF, zvýrazňovať výsledky, škálovať a sťahovať stránky.

Technológia výroby a nástroje, ktoré sme vyvinuli, dokážu digitalizovať dokumenty akéhokoľvek typu, akejkoľvek veľkosti a kvality, rozpoznať text a publikovať výsledné dvojvrstvové súbory PDF na internete pomocou rýchleho a sofistikovaného systému vyhľadávania a zobrazovania.

Vyskúšajte tu

Stovky vedeckých časopisov, úradných časopisov, dennej tlače, týždenníkov a kníh v maďarskom jazyku s približne 4-5 miliónmi nových strán pridaných ročne.

Vyskúšam
Vyskúšajte tu

Stovky vedeckých časopisov, úradných časopisov, dennej tlače, týždenníkov a kníh v maďarskom jazyku s približne 4-5 miliónmi nových strán pridaných ročne.

Vyskúšam

Arcanum logo

Arcanum Adatbázis Kiadó, popredný poskytovateľ obsahu v Maďarsku, začal svoju činnosť 1. januára 1989. Spoločnosť sa zaoberá hromadnou digitalizáciou kultúrneho obsahu, jeho triedením do databáz a publikovaním.

O nás Kontakt Tlačové správy

Languages