Hegedűs István: Hogyan segít újragondolni a levéltárak szerepét a mesterséges intelligencia és a gépi tanulás? Levéltári Közlemények, 90. (2019) 89–98.
Levéltártan információ és érték rejlik ezekben. Ezeknek az értékeknek a kiaknázása egy profitorientált vállalat számára mindig elsőbbséget fog élvezni a gyűjtemények érdekeivel szemben, ezért itt az ideje a levéltárosoknak is felvenni a kesztyűt gyűjteményeik védelmében. A gépi tanulás lehetőségei a levéltárakban A levéltárak az emberi erőfeszítés legrégebbi példái az információk és adatok összegyűjtésének. Az adatok és/vagy információk gyűjtésének közös célja ellenére a levéltárak és a gépi tanulásos rendszerek adatkészletei eltérőek. Ennek felismerése arra sarkalja a GT-kutatókat, hogy olyan programnyelveket és algoritmusokat építsenek, amelyek képesek kommunikálni a levéltári rendszerekkel is.8 8 Eun Seo Jo - Timnit Gebru: Lessons from Archives: Strategies for Collecting Sociocultural Data in Machine Learning. In: Conference on Fairness, Accountability, and Transparency. January 27- 30, 2020, Barcelona, Spain, https://doi.org/10.1145/3351095.3372829 (Utolsó letöltés ideje: 2020. szeptember 23.) 9 Richard Marciano - Jane Greenberg: Computational Archival Science (CAS): a Paradigm Shift Across the Data. July 6, 2020, CLIR & AERI, 2020. http://aeri.website/wp-content/uploads/2020/ 06/CLIR-AERI2020_Marciano-Greenberg-Students.pdf (Utolsó letöltés ideje: 2020. szeptember 23.) A digitalizálás és a számítógépesítés folyamata természetesen nemcsak a levéltárakra, hanem a könyvtárakra is igen nagy hatással volt az elmúlt évtizedekben. Király Péter tanulmányában az adatkezelést, az adatközzététel független alterületként való kezelését, az adatelemzéssel való integrációt, valamint a decentralizált web és a szemantikus web hatását vizsgálta. Eun Seo Jo és Timnit Gebru már idézett cikke szintén fontos abban a tekintetben, hogy az archívumok, könyvtárak és más intézmények hogyan működhetnek együtt a gépi tanulás kutatóival. Amely együttműködés azért is különösen fontos, mert az említett területeken belül már tanulmányoztak és szabályoztak különböző etikai, reprezentációs és átláthatósági kérdéseket. A kutatás és fejlesztés másik izgalmas területe az úgynevezett számítógépes levéltártudomány mint tudományág, amely ténylegesen egyesíti a Big Data és MI/GT irányokat és módszereket a legteljesebb és még relevánsabb adatbázisok létrehozása érdekében. A közelmúltból két nagyszerű amerikai program is említhető ennek alátámasztására, részletes bemutatásuktól azonban el kell tekintenem. Az egyik a Morgenthau Holokauszt Gyűjtemények Projekt, míg a másik a Rabszolgaság Örökségének Számítástudományi Kezelése munkacímet viselte.9 Lilley és Moore szerint „Vannak alapvető akadályok a művészeti és kulturális intézményekben a nagy adathalmazok használata kapcsán. Az első a finanszírozási környezethez kapcsolódik. Az ágazat jelenleg nagyrészt túl korlátozott megközelítést 92