Využitie metód strojového učenia pri analýze mnohorozmerných omických dát v predikcii kardiovaskulárnych ochorení

Využitie metód strojového učenia pri analýze mnohorozmerných omických dát v predikcii kardiovaskulárnych ochorení

Section reference: 
Year:
2024

Overall rating

Scientific work: 
0
67%
Design: 
0
67%
Discussion interaction: 
0
67%
UserScientific workDesignDiscussion interaction
RNDr. Monika Švecová100%100%100%

Využitie metód strojového učenia pri analýze mnohorozmerných omických dát v predikcii kardiovaskulárnych ochorení

Martina Velísková1 , Patrick Mydla1 , Natália Andelová2 , Miroslav Ferko2 , Milan Zvarík1
1 Katedra jadrovej fyziky a biofyziky, Fakulta matematiky, fyziky a informatiky, Univerzita Komenského v Bratislave
2 Centrum experimentálnej medicíny SAV, v.v.i., Bratislava
veliskova2@uniba.sk
Vývoj moderných vysokovýkonných omických metód je spojený s potrebou dostatočne výkonných výpočtových nástrojov, ktoré by umožnili extrahovať cenné informácie ukryté v získaných údajoch. Heterogénna a vysokorozmerná povaha omických údajov však túto úlohu nezľahčuje a predstavuje tak rôzne výzvy pri ich analýze a získavaní takých výstupov, ktoré by ponúkali pohľad na procesy prebiehajúce v biologických systémoch. Pri spracovaní údajov rôznych zdrojov omiky, ako je genomika, proteomika či metabolomika, sa využívajú rôzne výpočtové prístupy ako dolovanie údajov (data mining), strojové učenie (machine learning), hlboké učenie (deep learning) alebo štatistické metódy.

V tomto príspevku ponúkame prehľad najmodernejších metód strojového učenia, ktoré v našom tíme využívame na analýzu mnohorozmerných dát zameranú na predikciu ochorenia, analýzu prežitia alebo identifikáciu biomarkerov.  V príspevku vymedzujeme postavenie strojového učenia v rámci umelej inteligencie a uvádzame základné rozdelenie algoritmov na učenie s učiteľom (supervised) a bez učiteľa (unsupervised). Následne stručne popisujeme vybrané metódy ML ako analýza hlavných zložiek (PCA), lineárna diskriminačná analýza (LDA), čiastočná diskriminačná analýza najmenších štvorcov (PLS-DA), metóda podporných vektorov (SVM), logistická regresia a neurónové siete. Spomenieme ich výhody a nevýhody  oproti iným metódam, a uvedieme príklady využitia strojového učenia spolu s interpretáciou výsledkov v konkrétnych štúdiách zaoberajúcich sa predikciami kardiovaskulárnych ochorení. Cieľom príspevku je zvýšiť informovanosť výskumníkov z oblasti živých vied o možnostiach moderných techník strojového učenia, ktoré poskytujú pohľad na hlboké pochopenie biologických systémov počas fyziologického stavu organizmu, ako aj v prítomnosti choroby.

Thanks: 

Táto práca bola podporená grantami APVV-22-0264 a VEGA 2/0016/23.

Discussion

Predikčné modely v kardiológii.

Dobrý deň, veľmi pekná kompilácia moderných analytických metód na spracovanie omických dát. Ako odhadujete budúcnosť výpočtových modelov v kardiológii? Vedeli by ste povedať, a akom stave je translácia do klinickej praxe a personalizovanej medicíny? ("preloženie" výsledkov molekulárnych a predklinických fyziologických štúdií do klinických údajov). Ďakujem a prajem veľa úspechov v práci.

iwa 

Dobrý deň,

ďakujem za otázky. Výpočtové modely v kardiológii (ako aj v celej medicíne) majú určite budúcnosť, pretože môžu poskytnúť personalizovaný prístup. Do modelov sa dajú zahrnúť konkrétne špecifické parametre a detaily každého pacienta. S narastajúcim množstvom diagnostických dát sa totiž odhaľuje čoraz väčšia interindividuálna variabilita, takže klasické empirické prístupy diagnostiky, kedy boli pacienti zaraďovaní do pomerne veľkých uniformných diagnostických skupín, sa ukazujú čoraz menej relevantné (v zmysle tej interindividuálnej variability). Tým že každý pacient má "svoje" ďalšie ochorenia (mimo kardiologických), je dôležité prispôsobiť diagnostiku, a teda aj liečbu pre každého pacienta zvlášť. Výpočtové modely sa dajú použiť na skúmanie korelácií medzi anatomickými a funkčnými charakteristikami pacientov a mechanizmami, ktoré sú základom danej patofyziológie. Čiže alternatívou k tradičným (empirickým) spôsobom diagnostiky je integrácia diagnostických údajov pacienta na čo najpresnejšiu charakteristiku základného ochorenia a prispôsobenie liečby patológii jednotlivca. A to sa dá práve pomocou týchto spomínaných analytických metód. Samozrejme (ako všetko), aj tieto modely majú zatiaľ svoje limitácie, ale postupom času, väčším množstom dát, na ktorých sa budú môcť trénovať a vylepšovať budú mať tieto modely svoje miesto v personalizovanej medicíne.

Čo sa týka translácie do klinickej praxe a personalizovanej medicíny, zatiaľ (podľa mojich informácii) sú tieto modely skôr v štádiu výskumu. Vo všeobecnosti však zrozumiteľná a jednoduchá komunikácia výsledkov modelu lekárom (kardiológom) bude rozhodujúca pre prijatie modelových predpovedí pri klinickom rozhodovaní. Vývoj kardiologických modelov srdca si v súčasnosti vyžaduje veľké množstvo odborných znalostí v niekoľkých rôznych oblastiach vrátane napríklad numerickej analýzy, informatiky, elektrofyziológie srdca, mechaniky a spracovania obrazu. Aplikácia týchto modelov si teda bude vyžadovať spoluprácu kardiológov s odborným personálom.

Dúfam, že som uspokojivo odpovedala na Vaše otázky.

Martina Velísková

Ďakujem za rýchlu reakciu a súhlasím s názorom, že o miere využitia a užitočnosti výpočtových modelov v kardiológii do veľkej miery rozhoduje efektívna kumunikácia v rámci širších multidisciplinárnych tímov. Želám všetko dobré v ďalšej práci.

iwa