Machine learning and knowledge networks: in un nuovo studio la prospettiva di prevedere l’insorgenza della malattia di Alzheimer con anni di anticipo

Le demenze, sono un gruppo di patologie di cui fanno parte, solo per citarne alcune: la demenza vascolare, demenza frontotemporale, demenza a corpi di Lewy e la malattia di Alzheimer (AD). Queste patologie hanno un notevole impatto sociale e sanitario, sia perché un numero sempre crescente di persone ne è colpito, così come le loro famiglie, sia perché richiedono una rete integrata e qualificata di servizi sociosanitari. Con l’invecchiamento della popolazione generale, sia nei Paesi occidentali che in quelli in via di sviluppo, queste malattie diventano un problema di salute pubblica sempre più grave. Solo per citare alcuni dati, secondo uno studio pubblicato su Lancet, in Italia, attualmente ci sono circa 1,5 milioni di persone affette da demenza, un numero che si prevede aumenterà del 56% entro il 2050, raggiungendo quota 2,4 milioni. Questo andamento rispecchia una tendenza globale: si stima che i casi triplicheranno, passando dai 57 milioni del 2019 a oltre 153 milioni nei prossimi 30 anni.

Tra tutte, l’AD è la forma di demenza più diffusa dopo i 65 anni e la sua caratteristica perdita di memoria, è accompagnata da altri sintomi cognitivi come afasia, disorientamento, difficolta nel linguaggio e difficoltà di ragionamento. Gli approcci per mitigare questo impatto si stanno sempre più concentrando sulle terapie per le persone a rischio prima che subiscano un deterioramento permanente. A tal fine, i progressi nei biomarcatori di AD, nei test diagnostici e nelle tecniche di neuro-imaging, hanno migliorato l’individuazione e la classificazione dell’AD, insieme all’approvazione di terapie che cercano di mitigare la malattia, ma non esiste ancora una cura e non si conosce molto della sua eziopatogenesi. Ciò è dovuto in parte alla scarsità di dati longitudinali o di dati che collegano i domini molecolari e clinici.

In questo contesto, I ricercatori dell’UCSF di San Francisco, in recente studio pubblicato su Nature Aging ha esplorato l’uso delle cartelle cliniche elettroniche (EHR) e delle cosiddette knowledge networks, letteralmente “reti di conoscenze” di cui una chiamata SPOKE che consente agli scienziati di collegare dati clinici e biologici in modo integrato per predire l’insorgenza dell’AD fino a sette anni prima della diagnosi e generare ipotesi biologiche che spiegassero le condizioni cliniche associate alla malattia, con particolare attenzione alle differenze tra uomini e donne. Tra le tipologie di dati che la rete SPOKE raccoglie e che sono state utilizzate per lo studio ci sono informazioni genetiche, di proteomica, farmacologia, vie biologiche rilevanti nella patologia e fenotipi clinici.

Gli autori hanno utilizzato modelli di machine learning, come il modello a foresta casuale detto: Random Forest, un potente algoritmo per la classificazione e la regressione che è capace di gestire grandi quantità di dati e fornire previsioni accurate. Questi modelli sono stati addestrati su un ampio set di dati, contenente informazioni cliniche di 749 persone con AD e 250.545 soggetti di controllo in un periodo che va dal 1980 al 2021.

I modelli addestrati hanno dimostrato un buon potere predittivo, riuscendo a predire l’AD fino a sette anni prima della diagnosi clinica con un’accuratezza del 72% fino a raggiungere all’81% il giorno prima della diagnosi. Inoltre, lo studio ha bilanciato i fattori demografici e le variabili correlate alle visite per migliorare la rilevanza biologica delle previsioni. Un esempio rilevante è l’identificazione dell’ipertensione essenziale come una variabile significativa nei modelli non bilanciati, ma che diventa meno importante nei modelli bilanciati, suggerendo che essa potrebbe non essere specificamente collegata all’AD, ma piuttosto all’invecchiamento.

Uno degli aspetti più interessanti dello studio è la stratificazione per sesso, che ha permesso di esplorare le differenze biologiche tra uomini e donne nella previsione dell’AD. La malattia, infatti, mostra un’incidenza e una progressione diversa tra i due sessi, e lo studio ha cercato di identificare i predittori specifici per ciascun genere.

Tra queste, per le donne, i modelli hanno identificato l’osteoporosi come un predittore significativo per l’insorgenza dell’Alzheimer. Questo legame è stato ulteriormente confermato attraverso analisi genetiche, che hanno mostrato una correlazione tra l’osteoporosi e l’AD tramite il gene MS4A6A. Altri predittori rilevanti per le donne includevano la depressione maggiore e la rinite allergica. Invece per gli uomini, i principali fattori predittivi includevano condizioni come dolore toracico, ipovolemia, iperplasia prostatica e perdita uditiva neurosensoriale. Queste differenze dimostrano che l’Alzheimer non colpisce uomini e donne allo stesso modo e che è necessario considerare variabili specifiche di genere quando si sviluppano modelli predittivi o si progettano interventi terapeutici. Al contrario, l’iperlipidemia è stata confermata come uno dei principali predittori per l’AD, indipendentemente dal sesso. Questo è stato validato anche attraverso un’analisi genetica, che ha trovato una connessione con il gene APOE, già noto per il suo legame con l’Alzheimer​. Inoltre la carenza di vitamina D potrebbe indicare una correlazione con la fragilità generale del paziente nelle fasi più avanzate della malattia.

Questo studio rappresenta un importante contributo alla ricerca sull’Alzheimer, mostrando come la possibilità di utilizzare dati clinici longitudinali integrandoli con modelli di machine learning e le reti di conoscenze come SPOKE possano essere utilizzati per prevedere l’insorgenza della malattia con largo anticipo per permettere interventi tempestivi e migliorare la qualità della vita dei pazienti, rallentando il declino cognitivo. Inoltre lo studio ha dimostrato che considerare le differenze di genere nella valutazione dei fattori di rischio sia di fondamentale importanza per sviluppare modelli predittivi efficaci.

Gli autori concludono dicendo che questo approccio potrebbe essere applicato anche ad altre malattie complesse, contribuendo a trasformare il modo in cui affrontiamo le malattie neurodegenerative attraverso la medicina di precisione.

di Valentino Ribecco

Source: Nature Aging; The Lancet 

 

 

Post correlati

Lascia un commento



SICS Srl | Partita IVA: 07639150965

Sede legale: Via Giacomo Peroni, 400 - 00131 Roma
Sede operativa: Via della Stelletta, 23 - 00186 Roma

Popular Science Italia © 2024