Az AI és a (történet)tudomány jövője(?)

Az elmúlt bő egy évben egyre többet olvashatunk a médiában a különböző AI-alapú alkalmazások sikereiről. Egyre-másra olvasni arról, milyen területeken válthatja ki az embert a – nem is olyan távoli – jövőben valamilyen AI-alapú rendszer, s ez a változás a tudományos életre is komoly hatással lehet. Vitaindítónak szánt cikkemben azt igyekszem felvázolni, milyen hatással lehet ez a változás a történettudományra, és milyen lépésekre lehet szükség, hogy az AI-t partnerünké, s ne ellenségünké tegyük.

Mi is az az AI?

Először is érdemes egy kicsit rávilágítani arra, hogy mi is az, amiről beszélünk. Az AI a mesterséges intelligencia angol rövidítése (angolul artifical intelligence), s ez egyből felveti a kérdést, hogy miért is ezt használom egy magyar nyelvű, magyar közönség számára készült cikkben. A válasz kettős: egyrészt ebben az esetben a magyar tudományos és civil szóhasználatban is elterjedt az angol rövidítés használata, másrészt pedig az online keresőmotorok – erre mindjárt visszatérek – is ezt a rövidítést részesítik előnyben, s így valószínűleg több emberhez juthat el a cikk. Az AI alapvetően nem más, mint egy olyan gép vagy program, ami megpróbálja az emberi elme működését lemásolni és újraalkotni.

Az a kérdés, hogy az elme lemásolható és „gépesíthető-e”, már a 17. század óta velünk van – már René Descartes is úgy gondolta, hogy az állatok igazából összetett gépekként működnek. A 20. század közepén fektettek egyre nagyobb hangsúlyt az mesterséges intelligencia kutatásra, az ’50-es, ’60-as évek az AI kutatások első aranykora: ekkor jött létre maga a fogalom, ekkor jött létre az első, AI kutatásban jelentős előretörést hozó Lisp-programnyelv, de ekkor alkotta meg Alan Turing a Turing-tesztet is, amivel meg kívánta különböztetni a gondolkodó gépeket az emberektől.

Egy a Lisp-programnyelv futtatására tervezett számítógép az MIT múzeumában. Forrás: WikimediaCommons

Természetesen a Turing által megálmodott és a tudományos-fantasztikus irodalomból jól ismert „gondolkodó gépek” napjainkban – még – nem léteznek, ugyanakkor a különböző mesterséges intelligenciák az életünk számos területén már régóta velünk élnek. Elég csak az online használt keresőmotorokra és azok algoritmusaira gondolni, melyek korábbi kereséseink alapján képesek a számunkra – véleményük szerint – megfelelő programokat, cikkeket, weboldalakat ajánlani, vagy az alapján priorizálni egy általunk beírt keresés eredményeit. Szintén egyfajta AI a Siri és az Alexa személyi asszisztens nyelvfelismerő rendszere, a különböző járművek önvezető szoftvere, de például a különböző videojátékokban a „gépet” irányító rendszer is.

Az AI-fejlesztés egyik ága a gépi tanulás (machine learning), mely egy-egy célfeladat végrehajtására optimalizált szoftver, ami a „saját” „tapasztalatai” alapján igyekszik tanulni és fejlődni. Ezek a problémamegoldásra épülő rendszerek ma a legelterjedtebbek, előnyük, hogy sok esetben igen hatékonyan képesek az adott feladat megoldására. Egy ilyen a most a közbeszédben legtöbbet szereplő ChatGPT, az OpenAI nagy nyelvi modellje, mely már képes több nyelven értelmes szöveg alkotására a meglévő „tudása” alapján.

Történettudomány és a 21. század

A történettudomány – és általában a bölcsészettudományok – alapvetően a 19. században kidolgozott elveket és módszertanokat alapul véve kutatnak a mai napig. Persze sok modern eszköz bekerült az eszköztárban, például már nem sokan írnak tanulmányokat kézzel vagy írógéppel, a legtöbb szakmai folyóirat valamilyen formában elérhető digitálisan (is), és megjelentek olyan, direkt online felületre készülő folyóiratok is, mint az Újkor.hu. Emellett léteznek kutatói blogok, az egyes intézmények is megtalálhatók online valamilyen módon, a COVID-19 járvány hatására az online konferenciák is megjelentek, s a különböző videómegosztó portálokon is elérhető számos előadás.

Ugyanakkor sok esetben ezek csak kényszerintézkedések, amivel a szakma próbálja felvenni a lépést a modernizálódó és változó világgal, nem pedig szervesen beépülő, a tudományos működést és gondolkodást is érintő változások. Az online jelenlét fontos, mert aki nem érhető el online, az mintha nem is létezne, ugyanakkor nem volt szükség rá, hogy a kutatási módszerek vagy kérdésfelvetések változzanak emiatt. Ha úgy tetszik, ezek csak a tudománykommunikáció új csatornái lehetnek.

Digitális eszközök, analóg források – avagy technológia a bölcsészettudományokban. Forrás: Wikimedia Commons

Mindannyian használtuk már például a Wikipediát információszerzésre, azonban a mai napig nincs a felhasználásának elfogadott módja a tudományos életben, és ha az ember bevallja, hogy ott nézett először utána egy témának, a kollégái biztosan furcsán néznek rá – ha pedig lehivatkozza, akkor végképp megvetés és elutasítás jut osztályrészéül. Szintén felhasználja a történettudomány az utólagos színezés módszerét, hogy közelebb hozza az átlagemberekhez és a hallgatókhoz a korábbi korok képeit, azonban ez a terület is vita tárgyát képezi, mivel a színezés meg is változtatja valamilyen mértékig az eredeti fotót. Szintén felmerült a digitális és digitalizált források használata, mellyel részben-egészben kiválthatók a költséges és időigényes levéltárazások – megspórolhatjuk az utazás költségét és idejét, nem beszélve sok esetben a szállásról, amit az igényel, hogy más városban vagy országban kutathassunk. Ezen területekkel szemben, habár felmerültek kérdések, azok periférián is maradtak, és a szakma sok esetben az egyes kutatók, intézetek, (szak)lapok és doktori iskolák hatáskörébe utalták, hogy miként viszonyulnak a témához.

Szintén példa az akadémiai szféra „lassúságára”, hogy a digitális bölcsészet megítélése is igen vegyes, és jelenleg még abban az állapotában van, hogy igyekszik megvetni a lábát a többi tudományos diszciplína egyenrangú partnereként. Az AI elterjedése azonban olyan terület, amit már nem hagyhatunk figyelmen kívül, és ahol nincs időnk arra, hogy évtizedek alatt kialakuljanak a szokásjogok, vagy azon vitatkozzunk, hogy vajon hasznos-e és érdemes-e a bölcsészet- és társadalomtudományok figyelmére – az AI már itt van és mindnyájunkra hatással lesz.

AI – problémák és lehetőségek

Ahogy egyre kifinomultabb nyelvi modellek megjelennek, úgy jelenthet az AI egyre nagyobb kihívást a kutatók és oktatók számára. Már jelenleg is lehet hallani arról, hogy különböző egyetemi kurzusokon, vagy akár szakdolgozatoknál egyes hallgatók a ChatGPT-t vagy más nyelvi modellt használtak arra, hogy a dolgozat egészét, vagy annak egyes részeit elkészítsék. A probléma ezzel az, hogy nincs egységesen elfogadott, nemhogy nemzetközi, de még hazai eljárásrend azzal kapcsolatban, hogy a dolgozatot, vagy annak egy részét egy AI-jal megíratni minek minősül. Egyes helyeken az a gyakorlat, hogy plágiumnak minősítik, azonban ez felveti azt a kérdést, hogy az AI-t tekinthetjük-e egy személynek, akinek a munkáját a hallgató ellopta? Vagy esetleg egy íratlan, szokásjogi szabályt szeg meg azzal, hogy nem teljesen önálló munkája eredményét mutatja be? Ebben az esetben vajon felelősségre vonható-e a hallgató úgy, mintha plagizált volna, vagy elég, ha feltünteti az AI-t, mint forrást – esetleg „társszerzőt”? Problémát okoz a szűrés is: hogyan állapítható meg, hogy egy munkát AI készített, vagy egy hallgató kompilált? Az AI használata amúgy is érdekes kérdéseket vet fel a szerzői jogok tekintetében, elég csak megnézni például a Midjourney nevű képalkotó algoritmus felhasználási feltételeit, miszerint, ha a képeket ingyenes fiókkal hozzuk létre, azok szerzői joga a céget illeti, és mi csak a megfelelő forrásmegjelöléssel használhatjuk, míg ha egy fizetős fiókkal hozzuk létre a képeket, azok szerzői joga minket illet meg.

A Times 2023 egyik címlapja, rajta egy a ChatGPT-vel folytatott beszélgetés részletével. Forrás: Wikimedia Commons

Májusban pont abból lett botrány, hogy a Texas A&M egyetem egyik oktatója a ChatGPT-vel ellenőriztette hallgatói dolgozatait, hogy azt vajon ők vagy egy AI készítette-e, azonban téves eredményt kapott: bár több hallgatót sikerült lebuktatnia, másokat tévesen vádolt meg. Az esetről a Rolling Stone is beszámolt. Ez azonban nemcsak az oktató hibája: az eset jól példázza, mennyire nincs felkészülve a felsőoktatás még az Egyesült Államokban sem arra, hogy a különböző AI nyelvi modellek terjedjenek, és azokat tömegesen kezdjék használni a hallgatók.

Azonban nemcsak az egyetemi szférára van jelentős hatással az AI terjedése, hanem a teljes akadémiaira is. Jelenleg az úgynevezett „publish or perish” szemlélet szerint működik a tudományos élet, azaz publikálj minél többet és gyakrabban, lehetőleg minél magasabban jegyzett lapokban, vagy nincs helyed ezen a pályán. Ezt a szemléletet már többször kritizálták, mondván a mennyiséget helyezi a minőség elé, azonban az AI fejlődése és a használatának elterjedése itt is változást kell, hogy indukáljon. Már 2022 júniusában megjelent egy írás Almira Thunströmtől a Scientific America online felületén, miszerint a GPT-3 algoritmussal írattattak egy 500 szavas tudományos esszét önmagáról, s lássa el a megfelelő hivatkozási és referencia jegyzékkel. Az AI teljesítette a feladatot, s Thunström megpróbálta azt publikálni. Hogy sikerrel járt-e, arról nem tudunk, azonban számos egyéb kísérlet is történt, hogy felmérjék, az AI képes lenne-e egy önálló cikket alkotni, és az eredmények nem bíztatók: sok esetben a rutinos lektorok sem képesek kiszúrni, hogy a cikket AI alkotta-e. Természetesen nem arról van szó, hogy az AI alapkutatást végezne, azonban a bölcsészettudományi kutatások és munkák jelentős százaléka nem is új eredmények létrehozását célozza, hanem korábbi ismeretanyag új szempontú értelmezését és interpretálását. Éppen ez jelenti a problémát: megadott szempontok szerint akár egy AI is képes lehet a betáplált információkból egy új szemszögű munkát írni – vagy annak fő vázát elkészíteni, amit aztán a kutatónak csak kiegészíteni, csinosítani kell. Ez esetben pedig felmerül a hallgatókkal szemben már megfogalmazott kérdés: hol húzódik a határ a saját szellemi termék és az AI használata közt?

A fentiek az AI jelentette problémákat és kihívásokat mutatják csak be, azonban a mesterséges intelligenciák számos lehetőséggel kecsegtetnek számunkra, s új kutatási lehetőségeket is megnyithatnak. Első sorban nagy segítség lehet az AI az alapvetően kompilációra épülő munkákban – mint a szakdolgozatok és más beadandók bizonyítják, ezen a területen már használatban is van.

A „Big Data” vizualizációja az OpenART AI-al. Forrás: a szerző képe

Talán leginkább egyértelmű segítséget az adatgyűjtésben és a nagymennyiségű adat feldolgozásában jelenthet, mivel ezt jóval hatékonyabban képes végrehajtani az embereknél. Itt gondolhatunk arra, hogy segíthet dokumentumok, képek, de akár új szakirodalom felkutatásában is, emellett pedig a más meglévő adat- és dokumentum-mennyiség első vizsgálatában is. Szintén képes lehet ezeket megadott szempontrendszer szerint kategorizálni. Az adatfeldolgozó képessége különösen hatékony lehet olyan területeken, ahol például nagy mennyiségű statisztika áll rendelkezésre, mivel ezek átvizsgálásában, összegzésében szintén hatékonyabban képes eljárni az embereknél.

A megfelelő AI képes lehet kiszűrni a hamis, adott esetben más mesterséges intelligencia generálta vagy módosította képeket és dokumentumokat. Ezen felül egy már használt metódus szerint a szöveganalízis és a szövegátírás során az AI használata jelentősen meggyorsíthatja a munkafolyamatokat. Ebbe a kategóriába tartozik – habár nem a tudományos munka szigorúan vett része – a dokumentumok vagy tanulmányok idegen nyelvre történő lefordítása, ezzel megspórolva a fordítók díját, mely igen komoly költséget jelenthet.

Emellett – hasonlóan a digitális bölcsészethez – új kérdéseket is felvethet az AI-alapú kutatás. Egyrészt új lehetőségeket hozhat a big data alkalmazásával, mely eddig kiesett a történettudomány látóköréből. Másrészt alkalmas lehet különböző elméletek tesztelésére és modellezésére, mely metódust a történettudomány eddig szintén nem használta.

Egy kis kísérlet

A cikk írása előtt kíváncsiságból tettem néhány próbált a GPT-3 nyelvi modellel, mely ingyenesen használható és hozzáférhető, azonban az adatbázisa 2021. szeptemberi adatokat tartalmaz.

Először arra kértem – angolul –, hogy írjon egy historiográfiát az Egyesült Államok korai történetéről – valami olyasmit szerettem volna, mint amit a szakdolgozatok vagy a disszertációk kötelező elemeként minden történész írt már. Extra paraméterként megadtam még, hogy 15 művet használjon, hogy ne az legyen a válasz, hogy túl hosszú lenne mindezt elkészíteni. A kísérletből egyértelművé vált, hogy GPT-3 nem tud különbséget tenni a historiográfia és a könyvlista között, azonban a lista egész érdekes lett. Igen vegyes válogatást hozott létre megjelenési évet és tematikát tekintve is, azonban látható, hogy vannak „kedvenc” szerzői: Edmund Morgan, Joseph Ellis, David McCullough és Bernard Bailyntől is két-két művet tett a listára. Azonban ez egy elfogadható lista volt, kellően átfogó, és a rajta szereplő művek is valós, ha nem is épp a legfrissebb szakirodalom volt.

A ChatGPT 15 könyves listája az Egyesült Államok korai történetéről, szerzők szerint rendezve. Forrás: képernyőkép, a szerzőtől

Ezután azonban nehezebb feladatra kértem: Horthy Miklós életéről kértem 15 tételes könyvlistát – még mindig angol nyelven. Azonban az AI által listázott művek legnagyobb hányada nem is létezik, azt az algoritmus hozta létre! Volt olyan mű, ami ugyan létezik, de a szerzőt megváltoztatta az AI, azonban nagyrészt a műveket az AI találta ki. Mentségére szóljon, volt rajta létező mű is, amit helyesen adott meg: Patai Ervin György (Raphael Patai) The Jews of Hungary: History, Culture, Psychology című műve – igaz ennek viszonylag kevés köze van a megadott témához.

Tesztelve az esszéírói képességeit, az indokínai és vietnámi háborúról kértem egy írást, s azt lefordíttattam az AI-jal magyarra. Az angol nyelvű tanulmány jól összegezte a történetet, kissé talán túl kifinomult nyelvezettel is – ettől függetlenül akár még hihető is lehet, hogy mondjuk egy hallgató írta. Azonban a magyar fordításnál már érződnek problémák. A nyelvezet sok helyen nem megfelelő, és érződik, hogy idegennyelv tükörfordítása.

Végül két próbának vetettem még alá. Kértem Horthy-irodalomlistát magyarul is. Ebben is nagyrészt „kitalált” művek szerepeltek, hasonlóan az amerikai verzióhoz, ugyanakkor voltak benne létező művek is – például az Ungváry Krisztiántól kilistázott mindhárom mű létezik – ugyanakkor például Ungváry Horthy-életrajza kétszer is szerepel, egyszer Ungváry Krisztián majd Krisztián Ungváry szerzőségével.

A második próbában arra kértem, hogy írja meg nekem magyarul, röviden a mogadishui csata történetét, illetve, hogy ajánljon magyar nyelvű cikket a témában. Maga a tényanyag nem feltétlen volt rossz, viszont időnként érthetetlen szavak, értelmetlen félmondatok kerültek bele. Emellett nem tudott magyar szerzőtől cikket javasolni – holott például én is írtam a témában egy tanulmányt 2018-ban a Belveder Meridionale-ba, illetve két cikket is 2019-ben az Újkor.hu-ra.

Ckket írt az AI. Forrás: képernyőkép, a szerzőtől

Ezekből is látszik, hogy az ingyenesen használható GPT-3 messze nem tökéletes, ugyanakkor fontos megjegyezni, hogy angolul összehasonlíthatatlanul hatékonyabb, mint magyar nyelven. Emellett azt is fontos kiemelni, hogy az aktuális, GPT-4 nyelvi modell már jóval fejlettebb.

Mit tehetünk?

A fő kérdés az AI-jal kapcsolatban az, hogy mit tehetünk, kell-e tennünk valamit a mesterséges intelligenciával kapcsolatban, vagy csak hagyni, hadd történjen minden a maga útján? Erre szerintem az a válasz, hogy igen is, és nem is.

Az előnyök kiaknázását – azt gondolom – rábízhatjuk az egyes kutatókra, kutatócsoportokra és kutatóhelyekre, már csak azért is, mivel nagyban múlik az adott egyén vagy intézmény profilján is, hogy mennyire, milyen mértékben és milyen céllal tudja az AI-t használni. Ugyanakkor fontos, hogy kezdjük el minél inkább megismerni és megtanulni ennek az eszköznek a használatát, s ennek érdekében a jövő történészeinek képzésébe is fontos lenne beépíteni, hogy ők már ezzel a tudással felvértezve vághassanak bele korai kutatásaikba. Hasonlóan fontos az új módszerek és gondolatok támogatása is, mivel az AI-ok használata által felvetett új kutatási irányok és lehetőségek kiteljesedése csak támogató környezetben lehetséges. Emellett elengedhetetlen felkészíteni a hallgatókat és oktatókat is az AI-ok hátrányaira, korlátaira és hibáira is.

Az AI átveszi a munkánk? Forrás: a szerző képe

Ahol viszont mindenképpen komoly beavatkozás szükséges, az az, hogy miként kezeljük az AI által részben-egészben írt munkákat. Szükséges kidolgozni egy országosan egységes szabályozást, amit az egyetemek és a különböző folyóiratok alkalmazhatnak az AI „segítségével” készült munkákkal kapcsolatban. Azt gondolom, hogy, bár a gyakorlat az AI használatát a plágiummal teszi egyenértékűvé, ez nem felel meg a modern kor követelményeinek, s mivel egy nem önálló személy munkájáról van szó, a plágium szellemiségének sem felel meg. Szükséges egy új kategória kidolgozása ennek kapcsán.

Ezen felül az egyetemi oktatók annyit tehetnek, hogy igyekeznek olyan feladatokat kiadni a hallgatók számára, melyeknél az egyszerű, szakirodalmon – vagy Wikipedián – alapuló összegezés nem elég, hanem komplexebb kérdéseket, önálló véleményt is kell formálniuk, így nem tudja a hallgató teljes egészében megkerülni az önálló munkát.

Lengyel Ádám

Ezt olvastad?

Csád és Líbia 1987-ben vívott háborúja rányomta a bélyegét a 21. század hadviselésére, emlékezete ráadásul össze is forrt a Toyota
Támogasson minket