Ghid de căutare

În acest ghid vă prezentăm caracteristicile de bază ale motorului de căutare Arcanum folosit pe platforma Ziarele Arcanum. Acesta este un sistem de căutare complex, de înaltă performanță,  pe care l-am dezvoltat în ultimele decenii.

Prin intermediul câmpurilor de căutare listate mai jos puteți efectua căutări complexe.

Câmpuri de căutare

TEXT Text complet În acest caz căutarea nu face distincții între caractere cu sau fără diacritice.
TEXT_EXACT Text complet exact Listează pagini cu rezultate exacte
DATE Date Listează rezultatele pe ani. În cazul cotidienelor căutarea se poate restrânge până la o dată precisă

Câmpul de căutare implicit este TEXT. Dacă nu folosiți alt câmp, rezultatele afișate conțin formele flexionare ale cuvintelor cu și fără diacritice.

Segmentarea ziarelor

Paginile de ziar sunt prelucrate automat de segmentatorul de ziare dezvoltat de noi, care e bazat pe inteligență artificială. Asta ne permite să efectuăm căutări în câmpuri precum cele de mai jos:

TITLE Titlu
CAPTION Text aferent imaginii
AUTHOR Autor
FOOTNOTE Notă de subsol
HEADER Antet
FOOTER Subsol
ADVERTISING Reclamă
TABLE Foaie de calcul

Recunoașterea numelor proprii

Paginile ziarelor sunt procesate automat de software-ul nostru de recunoaștere a numelor proprii bazat pe inteligență artificială. Acest lucru ne permite să căutăm conținutul în următoarele câmpuri:

PERSON Persoană
LOCATION Loc
ORGANIZATION Organizație
EVENT Eveniment
ENTITY Toate entitățile, inclusiv cele de mai sus

Alte câmpuri de căutare

BKMK Titlu și autor în articole Puteți căuta după titlu și autor. Important: această caracteristică se poate folosi doar pentru reviste științifice. La alte tipuri de publicații, ziare, cotidiene căutarea titlului și autorului se face doar prin „Text complet”.
EBKMK Titlu și autor în articole (exact) La fel ca mai sus, dar cu rezultate exacte.
AUTI Titlu și autor în cărți Puteți căuta cărți după titlu și autor sau, în cazul revistelor, după anul apariției. 
EAUTI Titlu și autor în cărți (exact) La fel ca mai sus, dar cu rezultate exacte.

Caractere joker

* înlocuiește orice număr de caractere.
? înlocuiește 0 sau un (1) caracter.
! înlocuiește un singur caracter.

Operatori

AND Conține ambele părți ale expresiei (implicit)
OR Conține cel puțin o parte dintr-o expresie
NOT Conține numai partea stângă a expresiei
S Conține ambele părți ale expresiei în cadrul unui articol
nW Afișează paginile care conțin expresia căutată la distanța de cuvânt precizată, în ordinea corectă. Pentru n puteți să introduceți un număr arbitrar, ca 3W, 10W, 30W
nN Afișează paginile care conțin expresia căutată la distanța de cuvânt precizată, în ordine arbitrară. Pentru n puteți să introduceți un număr arbitrar, ca 3N, 10N, 30N
W Listează paginile ce conțin un cuvânt care se potrivește cu ambele părți ale expresiei
WNOT Listează paginile ce conțin un cuvânt care se potrivește doar cu partea stângă a expresiei

Exemple

Rezultate care conțin toate expresiile căutate:

  • eminescu AND caragiale (link)
  • eminescu AND bălcescu (link)
  • eminescu AND bălcescu AND caragiale (link)

Rezultate care conțin măcar una din expresiile căutate:

  • eminescu OR caragiale (link)
  • eminescu OR bălcescu (link)
  • eminescu OR bălcescu OR caragiale (link)

Căutarea expresiilor

Cu ajutorul ghilimelelor veți obține rezultate cuvintele alăturate. Aceeași funcționalitate o are și operatorul 0W. Exemplele de mai jos conduc la același rezultat:

  • "mihai eminescu" (link)
  • mihai 0W eminescu (link)

Termeni exacți

Dacă doriți o potrivire exactă, trebuie să utilizați câmpul exact (TEXT_EXACT) împreună cu operatorul 0W sau ghilimele:

  • TEXT_EXACT=("mihai eminescu") (link)
  • TEXT_EXACT=(mihai 0W eminescu) (link)

Cuvinte la o anumită distanță

  • ion 1W caragiale (link)
  • muzeul 1W bucurești (link)

Asigură posibilitatea căutării cuvintelor aflate unul în apropierea celuilalt. În exemplul de mai jos se caută expresiile la o distanță de 10 cuvinte:

  • eminescu 10W caragiale 10W creangă(link)

În ordine arbitrară:

  • eminescu 10N caragiale 10N creangă (link)

Excluderea de cuvinte

Dacă vreți să eliminați eventuale rezultate false puteți utiliza operatorul NOT și WNOT:

  • român NOT (românesc) (link)
  • pană WNOT TEXT_EXACT=(până) (link)
  • capital* WNOT capital (link)

Limitarea intervalului căutat

Exemplul de mai jos listează rezultatele din 1848:

  • "nicolae bălcescu" AND DATE=(1848--1849) (link)

Puteți căuta și o dată exactă. Rezultatele afișate sunt doar din cotidiene și ziare săptămânale.

  • "nicolae bălcescu" AND DATE=(1840-01-01--1845-12-31) (link)

Căutare cu ortografii diferite

  • s!ntem (link) va afișa: suntem, sântem, sîntem
  • dependen* (link) va afișa: dependenţă, dependent, dependentă

Căutare după titlu și autor

  • TEXT=(eminescu) AND AUTHOR=(mircea eliade) (link) – listează articolele semnate de M. Eliade, unde în text apare Eminescu
  • AUTHOR=(mircea eliade) (link) – listează articolele lui Mircea Eliade
  • TITLE=(eminescu) (link) – listează articolele unde în titlu apare Eminescu

Căutare după imagini

  • CAPTION=(eminescu) (link) – listează articolele unde în textul aferent imaginii apare Eminescu

Exemple complexe

Căutarea tuturor articolelor apărute între 1845-1870, care conțin numele Bălcescu și nu conțin numele lui Alecsandri:

  • (nicolae 0W b!lces* AND DATE=(1845-1870) NOT (vasile 0W alecsandri) (link)

Sau încercați câteva caractere joker. Se pot elimina erorile tipice a introduse de OCR:

  • (nicolae 0W b!lces* AND DATE=(1845-1870) NOT (vasile 0W alecsandri) (link)

 

Încă aveți nevoie de ajutor? Contactați-ne!

 

 

Arcanum logo

Arcanum se ocupă cu digitalizarea în masă, cu arhivarea și cu publicarea materialelor tipărite.

Despre noi Contact Apariții în presă

Languages