Szemészet, 2021 (158. évfolyam, 1-4. szám)
2021-03-01 / 1. szám
Artificial intelligence in ophthalmology vetíti a sci-fi klasszikus Skynet tér nyerését (81). Úgy tűnhet, hogy a gépek felülkerekedtek az embereken, és a Neumann János által elsőként felvetett, későbbi értelmezésekben sok módosításon átesett technológiai szingularitást (88) elértük, ám Alan Turing híres kérdésére, miszerint „Tudnak-e a gépek gondolkozni^” (87) a válasz még egyelőre nem, bár többen érvelnek amellett, hogy a nem túl távoli jövőben ez akár meg is valósulhat (38, 52). Turing teszt - The Imitation Game A teszt során az értékelők billentyűzet és monitor segítségével kérdéseket tesznek fel (chat) két tesztalanynak. A két alany egyike gép, a másik ember, céljuk pedig meggyőzni az értékelőket arról, hogy ők gondolkodó emberek. Ha az értékelők 30%-a 5 perc chat után sem tudja egyértelműen megállapítani, hogy a két alany közül melyik a gép, akkor a gép sikerrel teljesítette a tesztet (77). Az AI használata az orvostudományban jelenleg leginkább a digitális képelemzés területén nyújt segítséget. A szemészet számos területén történik képalkotás, vagy digitális adatgyűjtés a színes fundusfotótól kezdve az elülső-, vagy hátsó szegmentum optikai koherencia tomográfia (OCT) felvételeken át a statikus automata perimetria regisztrátumokig. A nagy menynyiségű képi anyag feldolgozása szűrővizsgálatok, nyomonkövetés, telemedicina és döntéstámogató rendszerek szervezésében bizonyulhat hasznosnak. A témában jelen összefoglaló írásáig több, mint ezer tanulmány és cikk jelent meg, ezek harmada az elmúlt egy évben. Technológiai alapok A mesterséges intelligencia egyik megfogalmazás szerint „egy rendszer olyan képessége, amely helyesen értelmezi a külvilág adatait, tanul ezekből az adatokból, és a megszerzett tudást rugalmasan használja fel konkrét feladatok végrehajtására és célok elérésére” (48). A mesterséges intelligencia algoritmusokat használ. Az egyszerű algoritmus például egy egyértelmű utasítás, amit a gép végrehajt. A komplex algoritmusok több egyszerű algoritmusból épülnek fel, amelyek kódolása, tehát a döntési mechanizmus algoritmusba történő transzformációja előzetes (esetünkben orvosi) információ és szabály alapján, teljes mértékben emberi kéz által történik. Ezt a sok esetben összetett és releváns információkon alapuló kódolást nagyon nehéz feladat emberi kéz által megalkotni, amely ezáltal a hibázás lehetőségét is magában hordozza. Éppen ezért alakult ki és került előtérbe a mesterséges intelligencia 1990-ben bevezetett ága, a gépi tanulás (ma chine learning - ML), amely az információt és szabályokat nem emberi kéz által kódolt algoritmusok formájában kapja, hanem számára adott mintapéldákon keresztül a rendszer maga fejleszti őket. A gépi tanulás mesterséges neurális hálózatokat (artificial neural networks - ANN) használ, az emberi agy működését utánozva (74). ML során tehát egy vagy több algoritmus „betanítása” történik. A betanítás két alaptípusa a felügyelt (supervised learning) és felügyelet nélküli (unsupervised learning). Előbbinél egy adott adathalmazt egyenként jel1 . ábra: A mesterséges intelligencia szintjei és felhasználási területei E743 lemző tulajdonságokkal címkéznek fel (pl. egy kép esetében: magasság, forma, denzitás stb.) és meghatározzák a kimenetelt (pl.: drusen vagy ép retinaszerkezet), így a program a tanulási fázist követően dönteni tud. Jellemző példái a csoportosítás vagy regresszióanalízis. A felügyelet nélküli tanítás esetében az adathalmazhoz nem tartozik előre definiált kimenetel, hanem a program a hasonlóságok alapján képez csoportokat, akár több variációban, például cluster analízis során (5). A klasszikus gépi tanulás nem képes a nyers adatokból közvetlenül tanulni, szükség van a paraméterek (pl. egy vizsgált OCT-biomarker) numerikus leírására, jellemzésére. Ehhez a gépi tanulási mérnöknek definiálnia kell azokat a jellemzőket (feature), amelyek strukturált formában tartalmaznak információt. A gépi tanulás során a neurális hálózat ezen jellemzők közti összefüggéseket fogja megtanulni és alkalmazni. Például, ha szubretinális folyadékot (SRF) és intraretinális cisztákat (IRC) szeretnénk OCT-képeken osztályozni, akkor esetükben az egyedi jellemzők, amelyek definiálják őket: a pigmentepitheltől való távolságuk (az SRF van közelebb), alakjuk (a ciszta ovális), kiterjedésük/területük (az SRF általában nagyobb) (43). A mély gépi tanulás (deep learning - DL) az ML egy formája (1. ábra), amely a klasszikus gépi tanulással ellentétben nemcsak egy, hanem több intermedier/rejtett neuronré-Osztályozás Betegség stádiuma Betegség típusa Szűrés Szegmentáció Folyadék SHRM Erek HF Fovea GA Microaneurysma PED Retina rétegei Drusen Előrejelzés Demográfiai adatok Klinikai adatok Betegség progressziója Kezelés kimenetele Vérzés CNV C/D \ 2 • s ✓