1.2 A számítógépes háttér

Teljes szövegű keresés

1.2 A számítógépes háttér
A munkám során felhasznált 253 inventáriumban található adatok mennyiségéből következett, hogy feldolgozásuk csupán egyetlen úton, számítógép segítségével történhetett. Amikor 1984-ben megírtam már említett első tanulmányomat, az abban feldolgozott mintegy 5-600 löveg adatait még cédulákra kellett írnom, majd ezek különböző szempontú csoportosítása után kézzel vagy írógéppel írt listákon kellett azokat összesítenem. Manapság, amikor a megfelelő teljesítményű számítógépek egyre több ember számára elérhetővé válnak, az élet minden területén, így a humán tudományok, jelen esetben pedig a történészi kutatómunkában is előtérbe kerül az adatok számítógéppel, számítógépes adatbázisban történő feldolgozása. Az előbb említett időrabló, sok hibára lehetőséget adó módszer már nem célravezető. Jóllehet, egy nagyméretű, sok szempontot figyelembe vevő adatbázis létrehozása rendkívül időigényes és aprólékos feladat, és a tévedés (elírás) lehetősége itt is fennáll, ám annak elkészülte után az adatok előre meghatározott szempontok szerinti csoportosítása, a velük végzett műveletek, grafikonok, listák összeállítása a korábbi módszerekhez képest elenyésző ideig, olykor csak másodpercekig tart.
Esetemben ez a munka 1993-94-re nyúlik vissza. Ekkor kezdtem hozzá az adatbázis kialakításához. Az egész munkafolyamat legfontosabb, minden további lépést meghatározó pillanta akkor következett be, midőn eldöntöttük, hogy milyen módszer szerint kell bevinni az adatokat az adatbázisba. Nyilvánvaló volt, hogy a számítógépes feldolgozás során is alapvetően a cédulázás elvét kell követi, csak itt nem valós papírra, hanem virtuális cédulákra írunk (adatbázis-szaknyelven ezt hívják rekordnak) (1. kép). Cédulázni azonban sokféleképpen lehet (ezt ugyebár mindenki a saját szisztémája szerint csinálja), ám a számítógépes cédulázásnál már figyelembe kell venni bizonyos törvényszerűségeket. Jelesül arról van szó, hogy a majd kétszáz inventáriumban a tárgyak jelentős része többször is előfordul. A kérdés „csupán”, hogy minden tárgyat egyszer kell-e felvenni az adatbázisba, és ehhez kapcsoljuk a sokszori előfordulás adatait, avagy nem maga a tárgy, hanem annak előfordulása az alapegység, azaz minden alkalommal újból fel kell-e venni az adott tárgyat, bármennyiszer is fordul elő. Bár ez első hallásra nem tűnik túl fontosnak, mégis e megközelítés hogyanján és mikéntjén múlik a későbbiekben az adatbázis kezelhetősége.
Az első esetben nyilván lényegesen kevesebb cédulával, azaz rekorddal kell dolgozni, továbbá az egy várról egyidőben vagy egymás után felvett leltárakban ismétlődően előforduló tételek kiszűrése utóbb biztosabbá válik.35 Ezzel azonban az előnyök véget is érnek. Leszámítva a technikai problémákat,36 a kitöltendő rubrikák száma alig csökken,37 de ennél is nagyobb gondok keletkeznek a csoportosításnál. Egyazon tárgy ugyanis, felhasználója, felhasználásának módja alapján különböző keresőcsoportok tagja lehet,38 ám ebben a szerkezetben igen nehézkes az ilyen jellegű elkülönítés. A második módszer ezzel szemben technikailag lényegesen egyszerűbb, s noha így az adatbázis jóval több tételt, azaz rekordot tartalmaz, egyediségük folytán az azokban történő keresés, továbbá csoportosításuk sokszorta egyszerűbbé válik, és a „gépelnivaló” mennyisége sem nő meg túlzottan.39
35 Viszont minden egyes tételnél külön meg kellett volna vizsgálni a beírás során, hogy az adat valóban bekerült-e már korábban az adatbázisba, ez pedig csak manuális módszerekkel lehetséges, ami rendkívüli módon lelassította volna az adatbevitelt.
36 Alapvetően arról van szó, hogy ebben az esetben egy tárgyhoz pl. a forrás megadására szolgáló rubrikában (adatbázis-szaknyelven ezt hívják mezőnek) egynél több adatot kell rögzíteni, mégpedig úgy, hogy az adatok ettől még kereshetőek és rendezhetőek maradjanak. Ha elképzelünk egy sorokból (rekord) és oszlopokból (mező) álló kétdimenziós hagyományos táblázatot (s a legtöbb adatbázis-kezelő így működik), akkor az említett megoldás csak úgy lehetséges, hogy egy harmadik dimenziót is hozzáadunk az adatbázisunkhoz, tehát egy adott rekord adott mezőjében tkp. „egymás felett” több adat sorakozik. A dolog nem megoldhatatlan, működőképes (kipróbáltuk), ám megnehezíti az így felvett adatok keresését, rendezését.
37 Bár ez is technikai kérdés, mégis szót kell ejtenem az adatbázis néhány számunkra fontos jellemzőjéről. Esetünkben relációs adatbázisról van szó, amely többek között lehetővé teszi, hogy az adatokat gazdaságosan tároljuk. Ez azt jelenti, hogy az ismétlődő adatokat nem kell újból és újból, csupán egyszer beírni, mert az adatbázis ezeket az ismétlődő adatokat külön táblákban tárolja, és a virtuális űrlapon a második alkalommal már csak egy legördülő listából kell kiválasztani. Emellett, felépítésénél fogva, kizárja azonos rekordok felvételét, vagyis a tévedés egyik lehetőségét. További óriási előnye e megoldásnak, hogy az adatok csoportosítása (lekérdezése) egyszerűen, gyorsan, szinte bármilyen szempont szerint lehetséges.
38 Pl. a kovács és a lakatos is használ üllőt, vagy egyformán horogként szerepel az emelőkhöz tartozó horog és a kigyulladt tetők bontására szolgáló hosszú nyelű, horgas vasú tűzcsáklya.
39 Ez az alapötlet nem tőlem származik, sem akkor, sem most nem lévén járatos a számítógépes adatbázisok elméletében. Az adatbázis ilyen szempontú megközelítésének módja, továbbá technikai kivitelezése is döntő mértékben barátomnak és kollégámnak, Pollmann Ferencnek köszönhető, akinek ezért külön is nagy hálával és köszönettel tartozom.
Joggal kérdezheti persze bárki, hogy szükség van-e egyáltalán ilyen méretű háttérmunkára, mondván, a korábbi időszakok kutatói is végeztek adatelemzéseket, csupán ceruza és papír segítségével. Nos, éppen e témakörben található az egyik legbiztosabb cáfolat e felvetésre. Iványi Béla már említett cikke meggyőződésem szerint épp azért tartalmaz bizonyos pontatlanságokat, ellentmondásokat, továbbá viszonylag kevés technikai adatot, mert kézi módszerekkel lehetetlen azokat az adatműveleteket elvégezni, amelyekre a számítógép másodpercek alatt, minden erőfeszítés nélkül képes. Csupán a nagyságrend érzékeltetésére: az adatbázis több mint 13500 rekordot (tételt) tartalmaz, a bennük található (darabra mérhető) tárgyak száma megközelíti a 3750000-t (8917 rekordban)40, az ágyúké 4684 (2602 rekordban). Ezen adatmennyiség feldolgozása pedig, véleményem szerint, csak számítógépes adatbázis segítségével végezhető el hatékonyan és viszonylag gyorsan.
40 A megadott darabszámnak persze több mint a háromnegyede (2946913 db, 78,63%) lövedék. Közel 1600 tétel a súlyra és hosszra mérhető tételeket tartalmazza.
Azzal, hogy a módszert eldöntöttük, valamint a fentebb leírt megközelítést meghatároztuk, még korántsem értek véget a problémák. Legalább ennyi fejtörést okozott azon szempontok kiválasztása, amelyeknek virtuális űrlapon szerepelniük kell. Ezek számától, a bevitt adatok jellegétől függött a (relációs) adatbázis szerkezete, de méginkább attól, hogy később milyen csoportosításban akarjuk a bevitt adatokat visszanyerni (szakszóval: lekérdezni). Sajnos, a munka során szerzett tapasztalatok e téren számos kezdeti hiányosságra világítottak rá, és emiatt az adatbázis szerkezetét több esetben módosítanom kellett, ami komoly időveszteséggel és az adat-vesztés veszélyével járt. Ebből a szempontból a legfontosabb tanulság az, hogy ilyen jellegű munka végzésénél sokkal nagyobb hangsúlyt kell fektetni az előkészítésre!
A tapasztalat mutatta meg azt is, hogy nem elegendő a tárgyakat saját nevükön szerepeltetni, hiszen így az azonos nevű, de eltérő módón felhasznált tárgyakat nem, vagy csak nagy nehézségek árán lehet egymástól elkülöníteni. Ezért vezettem be a csoport fogalmát41, amely lehetővé tette a tematikus kategorizálást. A csoportba sorolás azonban megint nehéz feladatot jelentett, mert az egyértelmű esetek mellett rengeteg kérdéses helyzet adódott, olykor pedig talán önkényesnek látszó beosztás is született. Mentségemre legyen mondva, hogy a tételek eredeti megfogalmazása miatt az adatbázis működéséhez elengedhetetlenül szükséges egységesítési törekvés igen nagy akadályokba ütközött.42
41 Ezek: ácsmesterség, ágyúalkatrészek, ágyúemelők, ágyúfogatolás, ágyús szerszámok, ágyútartozékok, alap- és nyersanyagok, alkatrészek, asztalosmesterség, bádogosmesterség, bognármesterség, edények, egyéb eszköz-szerszám-tárgy, egyéb fegyverzet, emelőeszközök, építőanyag, esztergályosmesterség, faanyagok, fegyveralkatrészek, fegyvertartozékok, fémek, hajók, hidak, kádármesterség, kézi lőfegyverek, kovácsmesterség, kőfaragó-mesterség, kőművesmesterség, kötelek, lakatosmesterség, láncok, lópatkolás, lószerszámok, lőpor, lőporgyártás, lövedékek, malom, mérőeszközök, nyergesmesterség, öntőeszközök, ötvösmesterség, puskaagyműves mesterség, rabtartás, sáncszerszámok, szálfegyverek, szállítóeszközök, szegfélék, szekéralkatrészek, szerszámalkatrészek, szerszámok, tárolóeszközök, tüzes szerszámok, tüzes szerszámok készítése, tűzoltás, vágófegyverek, védőfegyverek, világítóeszköz.
42 Valamiféle formai egységesítésre mindenképpen szükség volt, mert a keresési-csoportosítási műveletek során a túl sok eltérő alak rendkívüli módon megnehezítette volna a munkát.
Az inventáriumokban szereplő tárgyak jellegénél fogva végül is két külön adatbázist kellett létrehozni: az egyikben a lövegek, a másikban a többi tárgy adatai szerepelnek. Ezt a két csoportnak a forráshivatkozáson kívül teljesen eltérő jellemzői, kísérő adatai tették indokolttá. A lövegek esetében a virtuális űrlap a következő jellemzőket tartalmazza (mezők):
– a hivatkozás adatait, tehát a forrás helyét, a forrás folioszámát, a forrás keletkezési évét, a vár nevét, és az eredeti forrásszöveget;
– a lövegcsoportot (ostromágyú, tábori ágyú, stb.), a löveg típusát (pl. Karthaune, Falkaun, Mörser), esetleges másféle elnevezését (vulgo ...), az ágyú állapotára vonatkozó információkat, a darabszámot, s hogy ebből hány darab rossz;
– a löveg kaliberét, a kilőtt golyó anyagát, a lövegcső hosszát, súlyát, anyagát (bronz, réz, vas);
– nemzetiségét (hol öntötték, vagy öntetője milyen nemzetiségű), a löveg egyedi névét, az öntető nevét, a csövön levő címer(ek) leírását, az öntés évét, az öntő nevét, öntés helyét;
– a löveghez tartozó szerszámok adatait, az egyéb tartozékokat, a lafetta és a kerék állapotát.
A másik adatbázisban összegyűjtött többi tárgy esetében kevesebb szempont is elegendő volt:
– a fent részletezett forráshivatkozáson túl itt is az eredeti forrásszöveget;
– az általam létrehozott csoportbeosztást, a tárgy korabeli elnevezését a mai helyesírás szerinti alakban, a tárgy mai elnevezését (a latin és a német esetében a fordítást), a tárgy állapotára, anyagára, stb. utaló jelzőt (a relatív jelzőket, mint kicsi, nagy, hosszú, rövid, nem), a tárgy eredeti alakját (a forrásszövegből kiemelve, főleg a német nyelv esetében, a gyakori problémás olvasat/értelmezés miatt), az esetleges másik elnevezést (vulgo ...);
– a darabszámot, s hogy ebből hány darab rossz, a darabra nem mérhető dolgok mennyiségét és mértékegységét, továbbá a megjegyzés-rubrikát tartalmazza.
A számítógépes feldolgozás hitelessége szempontjából még egy problémát vázolnom kell: ez pedig az egyazon várról egyidőben vagy egymást követően több évben készült leltárakban ismétlődően előforduló, és az adatbázisba is bekerült tárgyak kérdése.43 A dolognak itt is legalább két aspektusa van. Egyfelől az eltérő nyelvhasználat, az iratkészítő személyének változása, stb. miatt ugyanazon tárgy esetleg a későbbiekben már nem követhető nyomon, noha valójában ott van a következő inventáriumokban. Másrészt – ebből következően – az adatműveletek során nehéz kiküszöbölni az ebből származó hibákat. Az ismétlődések kiszűrése nem lehetetlen, de nehéz és időigényes, ezért csak ott vállalkoztam rá, ahol feltétlenül szükségét éreztem.
43 Hogy ezen duplumok és sorozatok felhasználására miért volt szükségem, az korábban már vázoltam.

 

 

Arcanum Újságok
Arcanum Újságok

Kíváncsi, mit írtak az újságok erről a temáról az elmúlt 250 évben?

Megnézem

Arcanum logo

Az Arcanum Adatbázis Kiadó Magyarország vezető tartalomszolgáltatója, 1989. január elsején kezdte meg működését. A cég kulturális tartalmak nagy tömegű digitalizálásával, adatbázisokba rendezésével és publikálásával foglalkozik.

Rólunk Kapcsolat Sajtószoba

Languages







Arcanum Újságok

Arcanum Újságok
Kíváncsi, mit írtak az újságok erről a temáról az elmúlt 250 évben?

Megnézem