L’IA identifie les signatures génétiques des tumeurs cancéreuses

Points clés

  • Les chercheurs ont étudié les marqueurs d’états cellulaires à l’aide d’un nouvel algorithme d’apprentissage automatique de l’IA.
  • Le nouvel algorithme d’IA a obtenu de bien meilleurs résultats que d’autres méthodes d’apprentissage automatique standard, avec une précision moyenne équilibrée de 98 %.
  • Les chercheurs en apprentissage automatique de l’IA ont démontré leur capacité à classer avec précision les tumeurs épithéliales et les neuroblastomes.
Geralt/Pixabay
Source : Geralt/Pixabay Geralt/Pixabay

L’apprentissage automatique de l’intelligence artificielle (IA) devient un outil important pour les cliniciens et les chercheurs biomédicaux. Une nouvelle étude publiée dans Genome Biology montre comment un algorithme d’intelligence artificielle a découvert une signature génétique des cellules cancéreuses, permettant à l’apprentissage automatique de distinguer les cellules cancéreuses des cellules saines.

Les chercheurs ont entrepris de découvrir des marqueurs d’états cellulaires en utilisant un nouvel algorithme d’apprentissage automatique de l’IA appelé « ikarus » pour comparer divers ensembles de données qui ont été annotés.

« Nous proposons ici ikarus, un pipeline d’apprentissage automatique visant à distinguer les cellules tumorales des cellules normales au niveau de la cellule unique », écrivent les chercheurs affiliés au Centre Max Delbrück de médecine moléculaire de l’Association Helmholtz (MDC) et à l’Institut de Berlin pour la biologie des systèmes médicaux. « Nous testons ikarus sur de multiples ensembles de données unicellulaires, montrant qu’il atteint une sensibilité et une spécificité élevées dans de multiples contextes expérimentaux. »

En biotechnologie, l’omique fait référence à l’étude de la structure et des fonctions d’une fonction biologique à un niveau spécifique, tel que le niveau des protéines pour la protéomique, le niveau des gènes moléculaires pour la génomique, et le niveau métabolique pour la métabolomique.

Les recherches menées dans les différents domaines de l’omique utilisent souvent des groupes de cellules ou des échantillons de tissus contenant plusieurs cellules pour trouver des biomarqueurs. Cela suppose que les cellules sont identiques ou uniformes en termes de structure ou de composition, ou encore homogènes. En réalité, l’hétérogénéité, ou la diversité, est inhérente aux organismes biologiques. Des différences peuvent exister non seulement entre les différents tissus, organes et organismes, mais aussi entre les cellules individuelles d’un même tissu ou d’un même organe.

l’article continue après l’annonce

Pour remédier à cette hétérogénéité, le séquençage d’une seule cellule peut permettre aux scientifiques de distinguer les génotypes au sein d’un groupe de cellules et d’isoler les cellules qui présentent des mutations génétiques dans leur génome des autres cellules. Une cellule unique est la plus petite unité d’un organisme, tant du point de vue fonctionnel que structurel. Le séquençage d’une seule cellule est le séquençage de l’ADN d’une seule cellule par rapport à un groupe de cellules dans une culture ou un tissu.

Le séquençage d’une cellule unique consiste à isoler la cellule, à amplifier son génome, puis à séquencer l’ADN. Le génome est l’ensemble de l’ADN d’un organisme, c’est-à-dire l’ensemble des instructions génétiques d’une cellule qui contient toutes les informations nécessaires à la croissance et au développement. Le séquençage de l’ADN est le processus qui consiste à déterminer la séquence exacte des bases nucléotidiques dans une molécule d’ADN.

Le code chimique qui influence la croissance et le développement est déterminé par l’ordre des quatre bases nucléotidiques qui composent l’ADN. Ces quatre bases sont l’adénine (A), la cytosine (C), la guanine (G) et la thymine (T). Le génome humain est constitué de 3,2 milliards de bases d’ADN.

Afin d’identifier les marqueurs génétiques spécifiques aux tumeurs cancéreuses, l’équipe a adopté une double approche. Pour trouver des marqueurs génétiques, les chercheurs ont consolidé de nombreux ensembles de données contenant des données de cellules uniques déjà étiquetées et annotées par des experts.

Ensuite, l’équipe a entraîné un classificateur de régression logistique pour distinguer les cellules saines des cellules cancéreuses. Ensuite, l’équipe a procédé à la propagation en réseau de l’étiquette de la cellule (cancéreuse ou normale) par le biais d’un réseau cellule-cellule personnalisé. Les bases de données utilisées comprennent The Human Protein Atlas, Prognostic Genes, Gene Fusion (ChiTaRs), SEEK (base de données de coexpression), g:Profiler, CancerSEA, MsigDB (GO, ensembles de gènes Hallmark), Atlas of co-essential modules, DepMap Achilles scores, et COSMIC.

Le nouvel algorithme d’IA a obtenu de bien meilleurs résultats que d’autres méthodes d’apprentissage automatique standard, avec une précision moyenne équilibrée de 98 %. En outre, l’apprentissage automatique de l’IA a démontré sa capacité à classer avec précision les tumeurs épithéliales et les neuroblastomes. Selon les chercheurs, pour une discrimination complète de tous les types de cancer, plusieurs modèles entraînés seraient nécessaires. Il est intéressant de noter que les chercheurs soulignent que leur classificateur d’IA peut être utilisé à des fins plus larges, au-delà de la détection des tumeurs, pour identifier n’importe quel état cellulaire.

La combinaison de technologies innovantes telles que le séquençage d’une seule cellule en génomique et l’apprentissage automatique de l’intelligence artificielle accélère la possibilité d’un traitement du cancer plus ciblé et personnalisé dans la médecine de précision pour l’oncologie à l’avenir.

Copyright © 2022 Cami Rosso. Tous droits réservés.