Hegedűs István: Hogyan segít újragondolni a levéltárak szerepét a mesterséges intelligencia és a gépi tanulás? Levéltári Közlemények, 90. (2019) 89–98.
Levéltártan „alanyai” a „nyomtatott ipari társadalomról” a „tech-alapú internetes társadalomra” való nagy áttérésnek.3 3 Kate Theimer: It ’s the end of the archival profession as we know it, and I feel fine. In: Caroline Brown: Archival Futures. Facet, 2018, 4. Mint sok más szakma esetében, a levéltárosoknak is a lehető leghamarabb fel kell ismerniük, hogy a gépi tanulás eszközei és alkalmazásai sok feladatot elvesznek tőlük. Ugyanakkor egyre több más, kifinomultabb és magasabb minőségű, értékesebb feladat előtt nyílnak meg a lehetőségek. Kevesebb idő alatt is el lehet végezni olyan munkákat, amelyekről korábban álmodni sem mertünk volna. A jegyzékek és segédletek készítése, vagy a levéltári anyagok egymáshoz rendelése minden bizonnyal könnyen elvégezhető lesz egy mesterséges intelligencia algoritmusokkal támogatott gépi tanulási rendszerrel. Hasonlóképpen a gyűjtemények szervezése és rendszerezése, valamint a releváns tartalom rangsorolása is felgyorsul majd. Az olyan feladatok azonban, mint az archiválási adatok elemzése és az elemzéshez vezető út tervezése, új feladatokat ígérnek. Összefoglalva, ami ma nem túl egyszerű vagy rutinszerű feladat, a jövőben azzá válik. A munkatársak legtöbb idejét felemésztő feladatok robotokra és a gépi tanulás alkalmazásait is használó automatizált folyamatokra cserélhetőek a közeljövőben. Big Data, MI (mesterséges intelligencia), GT (gépi tanulás) és a levéltárak Kétségtelen, hogy az állami intézmények és a közgyűjtemények egyre több információt és nyomtatott, valamint elektronikus adatot generálnak. Egyértelmű, hogy ezeken a területeken egyre több eszköz van arra, hogy az adatokat komolyabb adatbázisokba szervezzék, egyre több kapcsolatot hozzanak létre az adatbázisok között, egyre különfélébb lekérdezéseket alkalmazzanak, és összetettebb, de mégis könnyebben használható rendszereket biztosítsanak a társadalom, az adófizetők számára. Ahogy a közgyűjtemények és a levéltárak egyre növekvő mennyiségű adatot kezelnek, úgy egyre rugalmasabb és robusztusabb informatikai infrastruktúrákat szükséges kiépíteni. Ezáltal a „Big Data ” használatának legnagyobb kihívása az, hogy miként mentsük el a nagy mennyiségű adatot az elérhető legjobb és legteljesebb formában egy adott időpillanatban. Statisztikák szerint az intézmények csak adataik 20%-át használják fel a gyakorlatban, a fennmaradó 80% pedig mind az operatív, mind a döntéshozatali eljárásokból egész egyszerűen kimarad. A Big Data és a gépi tanulás közötti szorosabb együttműködés a jövőben áttörést hozhat ezen a területen. Azonban mielőtt a levéltárak és a gépi tanulás kapcsolatát vizsgálnánk, fontos tisztázni azt, hogy mi is az a Big Data. A Forbes cikke szerint ez egy olyan terület, ahol arra keressük a választ, hogy miként kezeljük, elemezzük és alakítsuk át a nagy mennyiségű adatot 90