1.2 A számítógépes háttér
A munkám során felhasznált 253 inventáriumban található adatok mennyiségéből következett, hogy feldolgozásuk csupán egyetlen úton, számítógép segítségével történhetett. Amikor 1984-ben megírtam már említett első tanulmányomat, az abban feldolgozott mintegy 5-600 löveg adatait még cédulákra kellett írnom, majd ezek különböző szempontú csoportosítása után kézzel vagy írógéppel írt listákon kellett azokat összesítenem. Manapság, amikor a megfelelő teljesítményű számítógépek egyre több ember számára elérhetővé válnak, az élet minden területén, így a humán tudományok, jelen esetben pedig a történészi kutatómunkában is előtérbe kerül az adatok számítógéppel, számítógépes adatbázisban történő feldolgozása. Az előbb említett időrabló, sok hibára lehetőséget adó módszer már nem célravezető. Jóllehet, egy nagyméretű, sok szempontot figyelembe vevő adatbázis létrehozása rendkívül időigényes és aprólékos feladat, és a tévedés (elírás) lehetősége itt is fennáll, ám annak elkészülte után az adatok előre meghatározott szempontok szerinti csoportosítása, a velük végzett műveletek, grafikonok, listák összeállítása a korábbi módszerekhez képest elenyésző ideig, olykor csak másodpercekig tart.
Esetemben ez a munka 1993-94-re nyúlik vissza. Ekkor kezdtem hozzá az adatbázis kialakításához. Az egész munkafolyamat legfontosabb, minden további lépést meghatározó pillanta akkor következett be, midőn eldöntöttük, hogy milyen módszer szerint kell bevinni az adatokat az adatbázisba. Nyilvánvaló volt, hogy a számítógépes feldolgozás során is alapvetően a cédulázás elvét kell követi, csak itt nem valós papírra, hanem virtuális cédulákra írunk (adatbázis-szaknyelven ezt hívják rekordnak) (1. kép). Cédulázni azonban sokféleképpen lehet (ezt ugyebár mindenki a saját szisztémája szerint csinálja), ám a számítógépes cédulázásnál már figyelembe kell venni bizonyos törvényszerűségeket. Jelesül arról van szó, hogy a majd kétszáz inventáriumban a tárgyak jelentős része többször is előfordul. A kérdés „csupán”, hogy minden tárgyat egyszer kell-e felvenni az adatbázisba, és ehhez kapcsoljuk a sokszori előfordulás adatait, avagy nem maga a tárgy, hanem annak előfordulása az alapegység, azaz minden alkalommal újból fel kell-e venni az adott tárgyat, bármennyiszer is fordul elő. Bár ez első hallásra nem tűnik túl fontosnak, mégis e megközelítés hogyanján és mikéntjén múlik a későbbiekben az adatbázis kezelhetősége.
Az első esetben nyilván lényegesen kevesebb cédulával, azaz rekorddal kell dolgozni, továbbá az egy várról egyidőben vagy egymás után felvett leltárakban ismétlődően előforduló tételek kiszűrése utóbb biztosabbá válik. Ezzel azonban az előnyök véget is érnek. Leszámítva a technikai problémákat, a kitöltendő rubrikák száma alig csökken, de ennél is nagyobb gondok keletkeznek a csoportosításnál. Egyazon tárgy ugyanis, felhasználója, felhasználásának módja alapján különböző keresőcsoportok tagja lehet, ám ebben a szerkezetben igen nehézkes az ilyen jellegű elkülönítés. A második módszer ezzel szemben technikailag lényegesen egyszerűbb, s noha így az adatbázis jóval több tételt, azaz rekordot tartalmaz, egyediségük folytán az azokban történő keresés, továbbá csoportosításuk sokszorta egyszerűbbé válik, és a „gépelnivaló” mennyisége sem nő meg túlzottan.
Joggal kérdezheti persze bárki, hogy szükség van-e egyáltalán ilyen méretű háttérmunkára, mondván, a korábbi időszakok kutatói is végeztek adatelemzéseket, csupán ceruza és papír segítségével. Nos, éppen e témakörben található az egyik legbiztosabb cáfolat e felvetésre. Iványi Béla már említett cikke meggyőződésem szerint épp azért tartalmaz bizonyos pontatlanságokat, ellentmondásokat, továbbá viszonylag kevés technikai adatot, mert kézi módszerekkel lehetetlen azokat az adatműveleteket elvégezni, amelyekre a számítógép másodpercek alatt, minden erőfeszítés nélkül képes. Csupán a nagyságrend érzékeltetésére: az adatbázis több mint 13500 rekordot (tételt) tartalmaz, a bennük található (darabra mérhető) tárgyak száma megközelíti a 3750000-t (8917 rekordban), az ágyúké 4684 (2602 rekordban). Ezen adatmennyiség feldolgozása pedig, véleményem szerint, csak számítógépes adatbázis segítségével végezhető el hatékonyan és viszonylag gyorsan.
Azzal, hogy a módszert eldöntöttük, valamint a fentebb leírt megközelítést meghatároztuk, még korántsem értek véget a problémák. Legalább ennyi fejtörést okozott azon szempontok kiválasztása, amelyeknek virtuális űrlapon szerepelniük kell. Ezek számától, a bevitt adatok jellegétől függött a (relációs) adatbázis szerkezete, de méginkább attól, hogy később milyen csoportosításban akarjuk a bevitt adatokat visszanyerni (szakszóval: lekérdezni). Sajnos, a munka során szerzett tapasztalatok e téren számos kezdeti hiányosságra világítottak rá, és emiatt az adatbázis szerkezetét több esetben módosítanom kellett, ami komoly időveszteséggel és az adat-vesztés veszélyével járt. Ebből a szempontból a legfontosabb tanulság az, hogy ilyen jellegű munka végzésénél sokkal nagyobb hangsúlyt kell fektetni az előkészítésre!
A tapasztalat mutatta meg azt is, hogy nem elegendő a tárgyakat saját nevükön szerepeltetni, hiszen így az azonos nevű, de eltérő módón felhasznált tárgyakat nem, vagy csak nagy nehézségek árán lehet egymástól elkülöníteni. Ezért vezettem be a csoport fogalmát, amely lehetővé tette a tematikus kategorizálást. A csoportba sorolás azonban megint nehéz feladatot jelentett, mert az egyértelmű esetek mellett rengeteg kérdéses helyzet adódott, olykor pedig talán önkényesnek látszó beosztás is született. Mentségemre legyen mondva, hogy a tételek eredeti megfogalmazása miatt az adatbázis működéséhez elengedhetetlenül szükséges egységesítési törekvés igen nagy akadályokba ütközött.
Az inventáriumokban szereplő tárgyak jellegénél fogva végül is két külön adatbázist kellett létrehozni: az egyikben a lövegek, a másikban a többi tárgy adatai szerepelnek. Ezt a két csoportnak a forráshivatkozáson kívül teljesen eltérő jellemzői, kísérő adatai tették indokolttá. A lövegek esetében a virtuális űrlap a következő jellemzőket tartalmazza (mezők):
– a hivatkozás adatait, tehát a forrás helyét, a forrás folioszámát, a forrás keletkezési évét, a vár nevét, és az eredeti forrásszöveget;
– a lövegcsoportot (ostromágyú, tábori ágyú, stb.), a löveg típusát (pl. Karthaune, Falkaun, Mörser), esetleges másféle elnevezését (vulgo ...), az ágyú állapotára vonatkozó információkat, a darabszámot, s hogy ebből hány darab rossz;
– a löveg kaliberét, a kilőtt golyó anyagát, a lövegcső hosszát, súlyát, anyagát (bronz, réz, vas);
– nemzetiségét (hol öntötték, vagy öntetője milyen nemzetiségű), a löveg egyedi névét, az öntető nevét, a csövön levő címer(ek) leírását, az öntés évét, az öntő nevét, öntés helyét;
– a löveghez tartozó szerszámok adatait, az egyéb tartozékokat, a lafetta és a kerék állapotát.
A másik adatbázisban összegyűjtött többi tárgy esetében kevesebb szempont is elegendő volt:
– a fent részletezett forráshivatkozáson túl itt is az eredeti forrásszöveget;
– az általam létrehozott csoportbeosztást, a tárgy korabeli elnevezését a mai helyesírás szerinti alakban, a tárgy mai elnevezését (a latin és a német esetében a fordítást), a tárgy állapotára, anyagára, stb. utaló jelzőt (a relatív jelzőket, mint kicsi, nagy, hosszú, rövid, nem), a tárgy eredeti alakját (a forrásszövegből kiemelve, főleg a német nyelv esetében, a gyakori problémás olvasat/értelmezés miatt), az esetleges másik elnevezést (vulgo ...);
– a darabszámot, s hogy ebből hány darab rossz, a darabra nem mérhető dolgok mennyiségét és mértékegységét, továbbá a megjegyzés-rubrikát tartalmazza.
A számítógépes feldolgozás hitelessége szempontjából még egy problémát vázolnom kell: ez pedig az egyazon várról egyidőben vagy egymást követően több évben készült leltárakban ismétlődően előforduló, és az adatbázisba is bekerült tárgyak kérdése. A dolognak itt is legalább két aspektusa van. Egyfelől az eltérő nyelvhasználat, az iratkészítő személyének változása, stb. miatt ugyanazon tárgy esetleg a későbbiekben már nem követhető nyomon, noha valójában ott van a következő inventáriumokban. Másrészt – ebből következően – az adatműveletek során nehéz kiküszöbölni az ebből származó hibákat. Az ismétlődések kiszűrése nem lehetetlen, de nehéz és időigényes, ezért csak ott vállalkoztam rá, ahol feltétlenül szükségét éreztem.