Informatika és történettudomány – A Digital Diplomatics 2022 konferencián jártunk

Az ERC (European Research Council – Európai Kutatási Tanács) „From Digital to Distant Diplomatics” (DiDip) című projekt keretében 2022. szeptember 28. és 30. között rendezték meg a „Digital Diplomatics” (Digitális Oklevéltan) című konferenciát a kutatócsoportnak otthont adó Grazi Egyetemen. A tudományos tanácskozás célja, hogy a középkori és kora újkori források iránt érdeklődők számára lehetővé tegye, hogy a dokumentumok feldolgozása során felhasználhassák az adatbázisokkal és a mesterséges intelligenciával kapcsolatos legfrissebb kutatási eredményeket. Az előadásokban prezentált oklevelek olyan jelentős – főként európai történelmet érintő – eseményekhez kapcsolódtak, mint a nyugati egyházszakadás (1378–1417) vagy a nagy pestisjárvány (1348/49) és az azt követő gazdasági válság. A kutatócsoportot – és ezáltal a konferenciát – az ERC Advanced Grant (2022 és 2026 között folyósított megelőlegezett támogatás) keretében finanszírozza. Az ERC működteti az Európai Unió legnagyobb, „felfedező kutatásokat” támogató pályázati rendszerét. Feladata továbbá, hogy hosszú távon finanszírozza a nagy kockázattal járó, de jelentős megtérülést ígérő kutatásokat.

A rendezvény már-már tradicionálisnak tekinthető, hiszen 2007-ben Münchenben, 2011-ben Nápolyban, 2013-ban pedig Párizsban kapott helyet. A tudományos tanácskozásnak ezúttal a Grazi Egyetem adott otthont. A megnyitón Michael Walter, a Bölcsészettudományi Kar dékánja, Joachim Reidl, az egyetem kutatási és karrierépítési rektorhelyettese, továbbá Georg Vogeler, a Bölcsészettudományi Kar professzora, egyúttal a konferenciát szervező ERC „From Digital to Distant Diplomatics” Kutatócsoport vezetője köszöntötte a megjelenteket.

A konferencia megnyitója

Az előadások egy helyszínen és hibrid szekciókban zajlottak, vagyis személyes és online prezentációk egyaránt elhangzottak. A tudományos projektek bemutatása rendkívül informatívnak bizonyult, minden előadó hosszas disputára számíthatott. Nem egy alkalommal történt nagyobb csúszás a programban az előadásokat követő érdeklődő kérdések miatt. A konferencia az előadások típusa alapján is sokszínű volt, ugyanis meghallgathattunk 28 hagyományos időtartamú (20 perces prezentáció, 10 perces vita), valamint 3 rövid (10 perces prezentáció, 10 perces vita) előadást, mindezeken túl pedig 4 poszter is kiállításra került. Az első napot egy plenáris előadás zárta, amelyet a magyar kötődéssel is bíró Michael Gervers, a Torontói Egyetem professzora tartott.

A prezentációk közös vonása volt, hogy az Európa eltérő helyeiről származó oklevelek feldolgozása mellett különböző adatbázisok, online gyűjtemények, valamint oklevél-feldolgozó (átíró, datáló) algoritmusok bemutatására is kiemelt hangsúlyt fektettek.

Utóbbi kapcsán citálhatjuk Žarko Vujošević, a Belgrádi Egyetem adjunktusának előadását, aki egy szerb oklevelekből és levelekből álló adatbázist, a DSD-t (Diplomatarium Serbicum Digitale) mutatott be. „Diplomatarium Serbicum Digitale – Eine Wiederaufnahme zwischen Datenbank und digitaler Edition” című előadásában kitért a 12. század végétől datált, főként 330 oklevél és több, mint 600 jogi dokumentum keletkezési körülményeire, szerzői és kiadói adataira, végül pedig nyelv szerinti megoszlására. Mindamellett szót ejtett a különböző oklevek őrzési helyeiről is, hiszen ezen okiratok nem csak Szerbiában találhatóak, hanem szerte Európában és Észak-Amerikában. Példának okáért említjük meg Magyarországot, ahol Budapesten 19, Debrecenben pedig 2 darab ilyesfajta dokumentumot őriznek közgyűjteményekben.

Voltak azonban olyan előadások, amelyek a diplomácia és a digitális bölcsészet problematikájára hívták fel a figyelmet.

Ilyen volt például Filipa Roldão (Coimbrai Egyetem, Center for the History of Society and Culture), Joana Serafim (Centro de Linguística da Universidade de Lisboa) és João Paulo Silvestre (Aveirói Egyetem) „The electronic edition of Portuguese municipal charters (12th–15th centuries): Challenges on Diplomatics and Digital Humanities” című előadása. Kutatásuk a 12. századtól a 15. század végéig – főképp portugál és latin nyelven – íródott portugál városi kiváltságlevelek digitális feldolgozásáról szólt. Nagyon korlátozott gyűjteményről beszélünk, hiszen a korpusznak mindössze 30%-a maradt fenn. A kutatók fő célkitűzése, hogy egy portugál és latin nyelvű glosszáriumot hozzanak létre, ehhez azonban szükség van egy saját felületre a digitalizált anyagokhoz. Ilyen platform jelenleg még nem áll rendelkezésükre, ezért egy félautomata hálózatot használnak: a CollateX-et.

A Grazi Egyetem könyvtárának bejárata, a konferencia helyszíne

Mindemellett hallhattunk egész országra kiterjedő nemzeti adatbázisról is. Jan Burgers, az Amszterdami Egyetem professzora, valamint Rik Hoekstra, a The Digital Humanities Lab kutatója „The Digitale Charterbank Nederland (DCN): A digital portal to 200.000 charters in Dutch archives” című előadásukban a Holland Digitális Oklevéltárról értekeztek. Az archívum különlegessége, hogy különböző helyi irattárak, levéltárak digitális adatbázisaiban képes keresni, azokat foglalja össze. A 2022. szeptember 7-én megállapított adatok a következők: 95 levéltárban 205.625 darab oklevél, valamint 42.173 darab fotó található meg. Az archívum dokumentumai a 14. századtól datálva jelentkeznek igazán nagy számban (a 11–13. századra összesen mintegy 3200 oklevél keltezhető). Az adatbázisban például a szövegek tartalma szerinti keresés is lehetséges.

A konferencián a pápai levelek és oklevelek digitalizálása is szóba került. Az előbbi kapcsán említhetjük Adam Zapała, a Lengyel Tudományos Akadémia Történettudományi Intézet Digital Research Infrastructure for the Arts and Humanities című projektjének vezető kutatóját és munkáját, aki előadásában a késő középkori pápai levelek digitalizációjáról beszélt. A projekt fő célja, hogy javítsa a pápai levelek feldolgozásának hatékonyságát. A munkát három szinten végezték. Az első szinten a nyomtatott kiadások digitális feldolgozása, valamint egy XML-alapú adatbázis létrehozása volt a fő szempont. A második szinten a dokumentumokból az alapvető információk kinyerése volt a cél (például személyek, helyek, intézmények, kiváltságok típusai stb.). A harmadik szinten a teljes szöveg szerkesztése volt a kívánalom. Az XML/TEI-kódolás számos lehetőséget kínál a szövegek elemzésére. Ezek digitális összeválogatása felgyorsíthatja a munkát és számos hibát megelőzhet, továbbá a digitális eszközök segíthetnek a dokumentumok automatikus datálásában is.

Az utóbbira jó precedens Julien Théry, a lyoni Lumière Egyetem professzorának előadása. Az „APOSCRIPTA. A database and text corpus of papal charters: towards a unified evolutive and collaborative research tool” című prezentációja középpontjában a 12–14. századi pápai oklevelek digitalizálása és adatbázisba rendezése állt. Az e célból létrehozott adatbázis, az APOSCRIPTA nevét az apostolica scripta kifejezésről kapta, amellyel a pápák a 12. század elejétől kezdve a leveleiket jelölték. Théry az elmúlt öt év alatt több, mint 25.000 darab pápai iratot gyűjtött össze, főként leveleket, amelyeket az apostoli kancellária bocsátott ki. Ebből közel 20.000 darab a 13. századból, közel 3.000 darab a 12. századból, és majdnem 2.000 darab a 14. századból származik. A professzor prezentációjában egy IV. Kelemen pápa (1265–1268) korabeli oklevélen keresztül mutatta be az adatbázist. Kiemelte, hogy az APOSCRIPTA egy folyamatosan nyitott és fejlődő projekt, amely alapvetően kollektív és együttműködéses alapon funkcionál.

A konferencia poszterszekciója

A konferencián egy pár nagyobb körben ismert német adatbázisról is szó esett. Ezen online adatgyűjtemények egyike a Monumenta Germaniae Historica (MGH), amelyről Clemens Radl, az adatbázis egyik főszerkesztője beszélt „Dealing with diplomata – The digital MGH and beyond” című előadásában. A kutató hangsúlyozta, hogy az MGH célja Németország és a szomszédos régiók középkori német történelmére vonatkozó források kritikus szerkesztése és közzététele. 2005-ben a digitális MGH (dMGH) keretében az összes MGH-kötetet retrodigitalizálták, ezáltal bármilyen felhasználó számára online elérhetővé vált a felület. Az előadás során betekintést nyerhettünk az adatbázis működésébe a Diplomata Karolinorumon keresztül. Az eddig nem digitalizált okleveleknek az openMGH-ba való felvételével igyekeznek megkönnyíteni az egyes dokumentumokkal végzett kutatást a történészek számára.

Továbbá hallhattunk előadást az egyház által kiadott középkori oklevelek filológiai elemzéséhez segítséget nyújtó stilometriáról is. Eveline Leclercq, a Strasbourgi Egyetem doktorandusza előadásában a Cambrai püspökének kancelláriája által kibocsátott oklevelek példáján keresztül demonstrálta az aldiszciplína módszerét. A vizsgálat során több, mint 1400 oklevéllel dolgozott a kutató, melyeket a Diplomata Belgica és Chartae Galliae adatbázisokon keresztül ért el a filológiai elemzés elvégzésére. A felhasznált oklevelek negyede a 11. század második feléből, többsége pedig a 12. századból származott. Az előadó hangsúlyozta, hogy a módszer segítségével az oklevelek elemzése mellett meghatározható az oklevél szerkesztője vagy a püspök saját befolyása az adott szövegre.

A Magyar Nemzeti Levéltár adatbázisait Arany Krisztina főlevéltáros mutatta be.

A hallgatóság megismerhette a középkori oklevélgyűjteményt, valamint az időrendben ezt folytató, 1526-tól keltezett okleveleket felvonultató „Reformáció 500” kollekciót. A harmadjára bemutatott, „Vestigia hungarorum in Italia” nevet viselő gyűjtemény Észak-Itáliában őrzött magyar oklevelek közzétételét irányozta elő. A társelőadó, Péterfi Bence, a Bölcsészettudományi Kutatóközpont Történettudományi Intézet tudományos munkatársa a hungarika-kutatás fontosságát mutatta be egy esettanulmányon keresztül. Az előadás során a közönség az adatbázis gyakorlati használatába is bepillantást nyerhetett.

A konferenciát kronológiai sorrendben Novák Ádám, a Debreceni Egyetem „Magyarország a középkori Európában” Kutatócsoportjának tudományos munkatársa és Ónadi Sándor, a Debreceni Egyetem PhD-hallgatójának előadása zárta, amelynek címe „Database of diplomatic sources and 3D scanning of wax seals – Observations” volt. Prezentációjuk első részében ismertették a kutatócsoportot, valamint a jelenleg is folyó kutatási projekteket. Az előadás második felében egyrészt a középkori magyar diplomácia történetével foglalkozó digitális online adatbázist mutatták be. Másrészt pedig az a kutatási projekt került szóba, amely 2016-ban az Eperjesi Egyetem, valamint a Mensor 3D Kft. (jelenleg a 4iG Csoport tagja) közreműködésével 12 darab eredeti középkori viaszpecsétet és azok plasztikus másolatait digitalizálta 3D-ben, Reflectance Transformation Imaging (RTI) módszer segítségével. Ennek eredményei a Pilisi gótika – II. András király francia kapcsolatai című kiállítás katalógusában kerültek publikálásra.

Az effajta pecsétdigitalizálás kísérleti projektje rámutatott a technikában rejlő tudományos és tudományos-ismeretterjesztő potenciálra. Utóbbira példa az installáció, vagyis az, amikor nehezen kölcsönözhető tárgyakat az eredetiekhez nagyon hasonló másolatokkal helyettesítenek.

Az előadók a konferencia keretében az előbb említett II. András aranybullájának, valamint Luxemburgi Zsigmond második kettős felségpecsétjének másolatát is bemutatták, amit a lelkes érdeklődők közelebbről is megtekinthettek.

A Novák Ádám és Ónadi Sándor előadását követő vita

A poszterszekcióban négy tudományos kutatás összegzését szemlélhettük meg. Martina Bolom-Kotari, a Hradec Králové-i Egyetem Történeti Segédtudományok és Levéltártudományi Tanszékének vezetője „A challenge for sphragists, archivists and IT experts. Example for an approach Czech archives” című poszterében azt fejtette ki, milyen fontos célkitűzés, hogy a cseh történeti forrásokat elérhetővé tegyék. A Brno Városi Levéltár jelenleg is ezen dolgozik: 1526-ig mintegy 2000 darab pecséttel rendelkeznek. A katalóguskészítés és a fényképes dokumentáció egyszerre zajlik, de utóbbi hátránya, hogy egyetlen kép nem elégséges a pecsétről. Ez a kutatás is a korábban már említett RTI-módszert használja. E törekvés összességében a levéltárosok és a szfragisztikusok érdekeit egyaránt szolgálja, hiszen egyrészt a pecsétek megőrzését, megóvását is megkönnyíti, másrészt ily módon azok tanulmányozása is gördülékenyebbé válik.

Simon Zsolt, a Román Tudományos Akadémia „Gheorge Şincai” Társadalom- és Humán Tudományok Kutatóintézetének munkatársa „Digital editions and document corpora of medieval and early modern Transylvanian sources” címet viselő poszterével azon gyűjteményekre hívta fel a figyelmet, amelyekben megtalálhatók a középkori Erdélyre vonatkozó források. Ennek kapcsán hangsúlyosan a magyar Hungaricana adatbázisa (ahol kb. 200.000 darab, 1526 előtti dokumentum található), valamint a román Arhiva Medievală  (ahol kb. 50.000 darab, 1606 előtti forrás ismert) került bemutatásra. A poszter tartalmazott még kisebb gyűjteményeket is, mint például a Monasterium.Net interaktív levéltári archívumát, vagy a Gyulai Éva által szerkesztett, Az erdélyi fejedelmek oklevelei (1560–1689). Erdélyi Királyi Könyvek című, 2005-ben DVD-n megjelent kollekciót.

Giuseppe Consolo, a Nápolyi Egyetem PhD-hallgatója „The digital critical edition of the account books. The case study of the female monastery of SS. Pietro and Sebastiano” című poszterén arról értekezett, hogyan valósul meg az a kutatási program, melyben a Szent Péter és Sebestyén domonkos kolostor archívumából származó, 15. század második felében keletkezett könyveket digitalizálnak. A folyamat XML-ben vagy TEI-ben történik, és az Oxygen nevű programot használják hozzá. Jelenleg 10 kötet digitalizációja zajlik, melyek kritikai kiadását is tervezik. Laura Bitterli, a Zürichi Egyetem Történeti Szemináriumának asszisztense „Ad fontes: e-learning platform for the handling of archival sources goes Automatic Text Recognition (ATR)” című posztere egy, a digitális tanulást és kutatást elősegítő platformot mutatott be, mely évek óta működik. Ez a felület teljesen alkalmas például az átírások gyakorlására, hiszen 700 évnyi okleveles anyag érhető el rajta számos nyelven. A poszter a manuális átírás és oklevélhasználat fontosságát emelte ki, azzal érvelve, hogy például a korábban már említett ATR – és más algoritmusok – hibarátája még mindig túl nagy.

Végül külön érdemes tárgyalni a konferencia első napját lezáró plenáris előadást, melyet Michael Gervers, a Torontói Egyetem professzora tartott Gelila Tilahunnal közösen, aki ugyanezen az egyetemen szerzett statisztikatudományi doktori fokozatot.

Előadásuk címe „Patterns of Change. The DEEDS Database, Topic Modeling and Network Analysis in English Medieval Charters, and the Future of Digital Diplomatics” volt. A DEEDS projekt eredeti célja az volt, hogy az angliai Essex megyéből származó, 12–13. századi okleveleket digitális formában rögzítsék és datálják. Az időhatárokat a hastingsi csata (1066) és II. Eduárd király uralkodása (1284–1327) jelentik. Az eredeti oklevelek mindössze 5%-a volt datálva. Az adatbázis innen érhető el közvetlenül. Jelenleg a Földnélküli János (1199–1216) uralkodásának korában keletkezett okleveleket próbálják meg egy Latent Dirichlet Allocation (LDA) modell segítségével megvizsgálni, melynek célja, hogy bizonyos terminus technikusok alapján meghatározza az oklevelek témáit. Ezeket az idő függvényében is megpróbálják értelmezni, így adatvizualizációs módszerekkel válik ábrázolhatóvá az egyes szavak (pl. ’terre’) kontextuális jelentése.

Michael Gervers és Gelila Tilahun plenáris előadása zárta a konferencia első napját. A fotón balról jobbra: Georg Vogeler és Michael Gervers

A szekciók közti szünetekben kávé, tea, sütemények, szendvicsek vagy gyümölcsfélék mellett alakulhattak ki jókedélyű eszmecserék, ezentúl pedig a programsorozat társas eseményekben sem szűkölködött. Az első napot állófogadás, a másodikat pedig vezetett városnézés, valamint közös vacsora zárta.

Berecz Gábor – Németh Gergő

Ezt olvastad?

Az Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar Történelem Segédtudományai Tanszékének oktatói 2022 tavaszán workshop-sorozatot tartottak Hogyan kezdjünk történeti kutatást a levéltárban?