V tomto príspevku ponúkame prehľad najmodernejších metód strojového učenia, ktoré v našom tíme využívame na analýzu mnohorozmerných dát zameranú na predikciu ochorenia, analýzu prežitia alebo identifikáciu biomarkerov. V príspevku vymedzujeme postavenie strojového učenia v rámci umelej inteligencie a uvádzame základné rozdelenie algoritmov na učenie s učiteľom (supervised) a bez učiteľa (unsupervised). Následne stručne popisujeme vybrané metódy ML ako analýza hlavných zložiek (PCA), lineárna diskriminačná analýza (LDA), čiastočná diskriminačná analýza najmenších štvorcov (PLS-DA), metóda podporných vektorov (SVM), logistická regresia a neurónové siete. Spomenieme ich výhody a nevýhody oproti iným metódam, a uvedieme príklady využitia strojového učenia spolu s interpretáciou výsledkov v konkrétnych štúdiách zaoberajúcich sa predikciami kardiovaskulárnych ochorení. Cieľom príspevku je zvýšiť informovanosť výskumníkov z oblasti živých vied o možnostiach moderných techník strojového učenia, ktoré poskytujú pohľad na hlboké pochopenie biologických systémov počas fyziologického stavu organizmu, ako aj v prítomnosti choroby.
Táto práca bola podporená grantami APVV-22-0264 a VEGA 2/0016/23.