Introduction de la formation et de ses objectifs
- Défis et enjeux liés à l'analyse génomique et bioinformatique à l'ère du NGS (quantité de données générées, complexité des approches analytiques)
- Types d'applications dans le contexte du diagnostic médical et importance du choix de la méthode de préparation des librairies.
Rappels sur le séquençage haut-débit (NGS)
- Principe du séquençage haut débit
- Base calling et analyse primaire
- Présentation des formats de fichiers : FASTA, FASTQ
Pratique : FastQC
Alignement au génome de référence
- Méthodes et algorithmes d'alignement
- Présentation des formats de fichiers : BAM, SAM et CRAM
- Critères de qualité d'un alignement
Pratique : visualisation d'un alignement dans IGV
Détection des variants génomiques
- Principes de détection
- Encodage des variants
- Présentation des formats de fichiers : VCF
- Autres types de variations génomiques : CNVs, SVs.
Pratique : Introduction au terminal Linux et aux outils en ligne de commande.
Annotation des variants génomiques
- Principe de l'annotation des variants
- Référentiels d'annotations : GENCODE, RefSeq
- Nomenclature des variants (HGVS)
Pratique : présentation d'un outil d'annotation : VEP
Prédiction de la conséquence d'un variant génomique
- Scores de prédiction (fonctionnelle, épissage, conservation)
- Fréquence populationnelle
- Association génotype-phénotype
Pratique : consulter quelques bases de données d'annotations (dbSNP, ClinVar, GnomAD)
Interprétation des variants génomiques dans un contexte clinique
- Défi de l'interprétation des données génomiques
- Critères de qualité
- Interprétation de variants en génétique somatique
- Interprétation des variants en génétique constitutionnelle
Pratique : Présentation de la plateforme SeqOne