
La cause la plus fréquente de démence dans le monde est la maladie d’Alzheimer (MA), une maladie neurodégénérative sans remède connu. Une nouvelle étude publiée dans Scientific Reports utilise l’intelligence artificielle (IA), l’apprentissage machine (ML) et les données des dossiers médicaux électroniques (EHR) pour identifier les prédicteurs importants de la maladie d’Alzheimer et constate que la génétique d’une personne surpasse l’âge comme prédicteur pour les personnes âgées de 65 ans et plus.
« Les méthodes d’apprentissage automatique constituent une alternative attrayante et efficace aux modèles de régression statistique traditionnels, en particulier dans les situations où l’on dispose d’un grand nombre de caractéristiques ou de prédicteurs », écrivent les auteurs de l’étude financée par les National Institutes of Health (NIH) et dirigée par Xiaoyi Raymond Gao du Ohio State University College of Medicine, avec les chercheurs Marion Chiariglione, Ke Qin et Douglas Scharre de l’Ohio State, les chercheurs Karen Nuytemans et Eden Martin de l’Université de Miami, et Yi-Ju Li de l’Université de Duke.
Selon l’Organisation mondiale de la santé (OMS), la maladie d’Alzheimer est à l’origine d’environ 60 à 70 % des plus de 55 millions de personnes atteintes de démence et touche les femmes de manière disproportionnée.
Aux États-Unis, on compte actuellement 6,7 millions de personnes âgées de 65 ans et plus atteintes de la maladie d’Alzheimer, dont près de deux tiers sont des femmes. Selon l’Alzheimer’s Association, ce chiffre augmentera considérablement pour atteindre 12,7 millions d’Américains d’ici 2050.
La maladie d’Alzheimer a été identifiée pour la première fois en 1906 par le psychiatre et neurologue allemand Alois Alzheimer. Il avait découvert des amas anormaux et des faisceaux de fibres enchevêtrés dans le tissu cérébral de sa patiente, Auguste Deter, décédée à l’âge de 51 ans. Alois Alzheimer la soignait dans un hôpital psychiatrique de Francfort pour des pertes de mémoire, un comportement irrationnel et des problèmes de communication. Aujourd’hui, ces amas anormaux sont connus sous le nom de plaques amyloïdes et les faisceaux de fibres enchevêtrés sous le nom d’enchevêtrements neurofibrillaires ou tau.
Selon la clinique Mayo, outre les troubles de la mémoire, les autres symptômes de la maladie d’Alzheimer comprennent des troubles de la pensée, du raisonnement, de la prise de décision, du jugement et de l’exécution des tâches quotidiennes. La maladie d’Alzheimer peut entraîner des changements dans la personnalité et le comportement, avec des symptômes tels que la dépression, les délires, les changements dans les habitudes de sommeil, la perte d’inhibition, les sautes d’humeur, la colère, l’agressivité, la perte d’intérêt pour les activités, le retrait social et l’errance. Bien qu’il n’y ait pas de remède, la progression des symptômes de la maladie d’Alzheimer peut être ralentie par des médicaments, selon la clinique Mayo.
Selon le National Institute on Aging, les changements dans le cerveau dus à la maladie d’Alzheimer peuvent survenir dix ans ou plus avant l’apparition de symptômes. La détection précoce de la maladie permet aux patients atteints de la maladie d’Alzheimer et à leurs soignants de planifier les services de soins futurs et de traiter les symptômes afin d’améliorer la qualité de vie.
Pour cette nouvelle étude, les chercheurs ont cherché à créer un modèle d’IA explicable en utilisant une bibliothèque d’apprentissage automatique populaire appelée eXtreme Gradient Boosting (XGBoost) et Shapley Additive exPlanations (SHAP), un algorithme de pointe pour l’explicabilité de l’apprentissage automatique de l’IA qui effectue une rétro-ingénierie de la sortie de l’algorithme prédictif sur la base des valeurs optimales de Shapley de la théorie des jeux. SHAP calcule la contribution de chaque caractéristique à la prédiction, ce qui en fait un outil utile pour visualiser les résultats. Les chercheurs ont utilisé plus de 11 000 caractéristiques et prédicteurs.
« La combinaison de XGBoost et de SHAP peut être utilisée comme un modèle ML explicable, qui maintient la précision des modèles ML tout en fournissant la distribution des effets avec la direction pour chaque variable afin d’améliorer l’interprétabilité des résultats », écrivent les scientifiques.
Les chercheurs ont développé des scores de risque polygénique (PRS) pour la maladie d’Alzheimer à partir de la base de données de l’Alzheimer Disease Genetics Consortium et des scores d’âge d’apparition (AAO) pour la MA à partir de la base de données de la UK Biobank.
« Le gène de l’apolipoprotéine E (APOE) est le facteur de risque génétique le plus connu pour la maladie d’Alzheimer3,12, mais les études d’association à l’échelle du génome (GWAS) ont identifié plus de 40 loci génétiques à ce jour pour la maladie d’Alzheimer », ont déclaré les chercheurs. « Ces dernières années, des scores de risque polygénique (PRS) ont été proposés pour regrouper les effets génétiques, des plus petits aux plus grands, à travers le génome en une seule mesure de risque pour chaque individu. »
Des modèles d’apprentissage automatique de l’IA pour prédire la maladie d’Alzheimer ont été développés à partir des codes de la dixième révision de la classification internationale des maladies (CIM-10) provenant des dossiers médicaux électroniques (DSE) et des données génétiques contenues dans des dépôts biologiques à grande échelle.
« À notre connaissance, il s’agit du premier rapport à développer des modèles prédictifs pour la maladie d’Alzheimer en utilisant des informations génétiques, non génétiques et des codes CIM-10 provenant du DSE dans une étude de cohorte à grande échelle en utilisant un cadre moderne de ML explicable », ont écrit les chercheurs.
Les chercheurs ont constaté que l’âge, le revenu et les scores de risque polygénique étaient les principaux facteurs de risque de maladie d’Alzheimer qui amélioraient la précision de la prédiction.
Les autres facteurs de risque importants sont les antécédents familiaux de MA/démence, les problèmes d’audition, le diabète et la tension artérielle (systolique plus élevée et diastolique plus basse). Il est intéressant de noter que l’insuffisance pondérale, et non l’obésité, augmente le risque de MA et pourrait constituer un biomarqueur préclinique utile.
Une découverte importante a été faite : les données du dossier médical électronique peuvent fournir des données clés pour prédire la maladie d’Alzheimer et le modèle d’IA a fourni les 20 caractéristiques les plus importantes pour les groupes d’âge de 40 ans et plus et de 65 ans et plus. Les scientifiques soulignent que l’importance des caractéristiques n’indique pas une relation de cause à effet.
Le modèle d’apprentissage automatique de l’IA a révélé que l’âge arrive en tête de toutes les caractéristiques dans le groupe des 40 ans et plus et que les effets génétiques reflétés dans les scores de risque polygénique deviennent plus importants que l’âge chez les personnes âgées de 65 ans et plus pour prédire la maladie d’Alzheimer.
Copyright © 2023 Cami Rosso Tous droits réservés.
