Federált Bayes-háló tanulás neonatális intenzív centrumok elosztott adataiból
Az értelmezhető és megbízható mesterséges intelligencia módszerek iránti igény miatt és az okozatiság közvetlen reprezentálásának a lehetősége miatt egyre nő az igény a Bayes-hálózatok hatékony, felskálázható gépi tanulására. A struktúra tanulásának diszkrét jellege, alapvető megfogalmazásban NP-teljes volta és nehéz párhuzamosíthatósága miatt ez hosszú időn át nem tűnt feloldhatónak. Egy 2018-ban publikált újszerű megközelítés [1] egy folytonos optimalizációs problémaként fogalmazta újra a feladatot az építendő irányított körmentes gráf aciklikusságát biztosító feltétel átdolgozásával. Ezáltal a feladat már megoldható standard numerikus algoritmusokkal, ilyen például a Lagrange-féle multiplikátorokat használó optimalizáció.
Az adatok elosztott volta és személyi, illetve intézményi szintű védettsége további kihívást jelent a gépi tanulási eljárások alkalmazására. A federált tanulási módszerek erre jelentenek megoldást, mivel ekkor a partnereknek nem szükséges az adatokat, elegendő a modellparamétereket megosztani a központtal. Az algoritmus egyes részei így lokálisan, a partnereknél futnak, majd a modellparaméterek megosztása után a központi globális modellen kerülnek végrehajtásra a szükséges lépések. A federált tanulási keretrendszerbe a Bayes-hálózatok új, folytonos alapú optimalizációja természetes módon tagolható be.
A dolgozatomban a bemutatom a NOTEARS és a federált NOTEARS-ADMM algoritmusokat, melyek folytonos alapú optimalizációs problémaként tekintenek a Bayes-háló tanulásra. Szisztematikusan kiértékelem a teljesítményüket különböző hiperparaméter beállítások mellett és javaslatot teszek egy federált tanulási protokollra, a hiperparaméterek megválasztására. A generált gráfok elemzését több szempont szerint is elvégzem: egyrészt vizsgálom a federált algoritmus eredményét különböző számú, illetve különböző mintaszámú kliensek esetén is, másrészt külön figyelmet fordítok a partnerek adataiból lokális, globális és federált módon épített gráfok különbségeinek feltárására.
A Bayes-hálózatok federált tanulását neonatális intenzív centrumok koraszülött intenzív ellátását leíró adatokon végzem el a centrumok által 2005 és 2013 között rögzített adatokat felhasználva. A területen a kezelést leíró döntési protokollnak nagy súlya van, hiszen újszülöttek élete a tét, ezért nagyon fontos, hogy az egyes döntési stratégiák elemzése megtörténjen és lehetőség legyen a visszacsatolásra. A mesterséges intelligencia bevonása ugyanakkor nemcsak erre teremt lehetőséget: az adatból épített oksági struktúrák vizsgálata akár eddig nem ismert összefüggésekre is fényt deríthet.
[1]: X. Zheng, B. Aragam, P. Ravikumar, and E. P. Xing. DAGs with NO TEARS: Continuous optimization for structure learning. 2018.
[2]: Ignavier Ng, K. Zhang. Towards Federated Bayesian Network Structure Learning with Continuous Optimization. 2022.
szerző
-
Kisida Júlia Lili
Villamosmérnöki szak, alapképzés
alapképzés (BA/BSc)
konzulensek
-
Dr. Antal Péter
egyetemi docens, Mesterséges Intelligencia és Rendszertervezés Tanszék -
Dr. Szabó Miklós
egyetemi tanár, Semmelweis Egyetem (külső)