2023. szeptember 10. 7:00

Bankrobotika: mesterséges intelligencia és gépi tanulás alapú banki kockázatkezelés

Prisznyák Alexandra tanulmánya hiánypótló elemzésként a banki kockázatkezelés, a pénzmosás és a terrorizmus-finanszírozás megelőzésért felelős területek kiegyensúlyozatlan adatállományán operáló felügyelet nélküli és hibrid gépi tanulási modelleket valamint algoritmusokat vizsgálja. A szerző hangsúlyozza, nincs egyetlen ideális algoritmus. A választást a mögöttes működési logika mellett számos összehasonlító tényező támogatja. A modellépítés az üzleti IT- és vizionárius menedzsment hibrid szempontjainak kialakítását igényli. (Pénzügyi Szemle 2022/2.)

Prisznyák Alexandra

A szerző felhívja a figyelmet arra, hogy lényegében minden algoritmussal készített előrejelzés felfogható egy optimalizálási problémaként, mivel egy adott célfüggvény optimalizálása a cél. Az algoritmusválasztás a megoldandó probléma vizsgálata alapján történik. Míg a lineáris regressziós modell célja az előrejelzések és a tényleges érték közötti (négyzetes) eltérés minimalizálása, addig az SVM-algoritmus lineáris kategorizálást hajt végre a hipersíkon egy elválasztó sík segítségével, amelynek eredményeképpen kapott margó (vagyis az elválasztó síkkal párhuzamos hipersíkkal meghatározott tér, amely nem tartalmaz tanító adatpontokat) a lehető legnagyobb. Míg a véletlenerdő-modellben lévő független döntési fák egy véletlenszerű mintát alapul véve hozzák meg egyéni döntésüket, amelyek végül többségi szavazás révén megadják a klasszifikációs probléma megoldását, addig a Naiv Bayes osztályozó a bemeneti vektorértékek alapján kalkulálja az adat osztályba tartozásának valószínűségét.

Több lehetséges megoldás esetén az egyes algoritmusok hatékonyságának mérése és összehasonlítása a következő kritériumok alapján lehetséges:

  1. időbeli komplexitás (betanításhoz igénybe vett idő),
  2. a végrehajtás időszükséglete,
  3. memória és tárigény (futás során szükséges memória),
  4. párhuzamos műveletvégzés (több művelet egyidejű végrehajtása, több gépen való futtatás) lehetősége,
  5. parametrikusság,
  6. linearitás.

A 6. táblázat - nagyításhoz klikk a képre! - a véletlenerdő-modell, a legközelebbi szomszéd módszer, az SVM, K-közép és a lineáris regresszió algoritmus említett tényezők mentén történő összehasonlítását tartalmazza. A szerző megjegyzi, hogy a táblázatban párhuzamos műveletvégzés szempontjából „nem” értékkel jelölt algoritmusok esetében számos módszer létezik a párhuzamos műveletvégzési képesség kialakításához.

 

tablazat_6_600


A vizsgált algoritmusok összehasonlítását alapul véve a szerző hangsúlyozza, hogy az üzleti cél, továbbá az algoritmus mögöttes elméleti vonatkozásainak összhangja, a rendelkezésre álló adatállomány minősége egymástól elidegeníthetetlen kérdéskörként jelentkeznek. Az algoritmusok előrejelzésének kombinációja (hibridizáció, ensemble modellek) a varianciahiba trade off csökkentésén és az előrejelzési pontosság javításán keresztül megbízható megoldást kínálhat az egyoldalú elemzés elkerülése érdekében. Figyelembe kell venni ugyanakkor, hogy nem eredményez automatikusan magasabb teljesítményű, pontosságú modellt.

Prisznyák Alexandra rámutat, hogy a pénzmosás és terrorizmusfinanszírozás megelőzése területeken alkalmazott gépi tanulási modellek validációja során a humán erőforrás nélkülözhetetlen. Ugyanakkor a gépi tanulási modellek jelentősen hozzájárulnak a munkaidő felszabadításához, a munkaerő munkavégzésének támogatásához. Nincs egyetlen ideális algoritmus, húzza alá a szerző. Az üzleti szempont, az IT-terület, továbbá a vizionárius menedzsment együttműködéséből származó hibrid nézőpont figyelembevétele elengedhetetlen előfeltétele a ML-modellek folyamatba történő integrációjának és sikeres hasznosításának. 

Az algoritmusok közötti választást az egyes algoritmusok mögöttes elméleti vonatkozásai, továbbá egyéb összehasonlításul szolgáló faktorok támogatják. A szerző hangsúlyozza, hogy a modellépítés jelentős részét (mintegy 80 százalékát) kitevő adatelőkészítési munkálatok szintén jelentősen befolyásolhatják a kapott előrejelzési eredményeket. A bankrobotika területén szakterülettől függően eltérő mértékű az adott optimalizációs problémához kapcsolódó események részaránya, amelynek függvényében a modellező eltérő gépi tanulási módszer (felügyelt, felügyelet nélküli, megerősítő tanulás), illetve algoritmus alkalmazása mellett dönthet.



Prisznyák Alexandra a Pécsi Tudományegyetem PhD-hallgatója

...

A teljes tanulmány itt olvasható, a Pénzügyi Szemle legújabb száma itt érhető el.