Computational genomics (2016/2017)

Codice insegnamento
4S003667
Docente
Nicola Vitulo
Coordinatore
Nicola Vitulo
crediti
6
Settore disciplinare
BIO/18 - GENETICA
Lingua di erogazione
Inglese
Periodo
II sem. dal 1-mar-2017 al 9-giu-2017.

Orario lezioni

II sem.
Giorno Ora Tipo Luogo Note
lunedì 11.30 - 13.30 lezione Laboratorio didattico Alfa  
martedì 10.30 - 12.30 lezione Laboratorio didattico Gamma dal 21-mar-2017  al 4-apr-2017
martedì 10.30 - 12.30 lezione Laboratorio didattico Gamma dal 18-apr-2017  al 18-apr-2017
martedì 10.30 - 12.30 lezione Laboratorio didattico Gamma dal 9-mag-2017  al 9-giu-2017
venerdì 10.30 - 12.30 lezione Aula H  

Obiettivi formativi

L’avvento delle nuove tecnologie di sequenziamento (Next Generation Sequencing, NGS) ha avuto un impatto enorme nella comprensione della complessità dei genomi da un punto di vista genomico, trascrittomico ed epigenetico, e ha fornito interessanti opportunità per lo sviluppo di risorse e programmi bioinformatici per l’analisi e la gestione dei dati. Il corso fornisce una panoramica generale dei metodi computazionali che fanno uso di dati NGS applicati nell’ambito della genomica , in particolare relativi alla genomica umana, come ad esempio l’allineamento di sequenze su un genoma di riferimento, il sequenziamento genomico, il risequenziamento e l’identificazione di varianti causative di malattie genetiche, l’analisi dei trascrittomi per l’identificazione dei geni differenzialmente espressi. Al termine dell’insegnamento lo studente dovrà essere in grado di:
conoscere i principali formati elettronici con cui vengono salvati i dati genomici
conoscere i differenti algoritmi utilizzati nell’ambito della genomica e le loro applicazioni
Preparare e gestire una pipeline di lavoro per l’analisi dei dati

Programma

1. Introduzione ai dati di sequenziamento di nuova generazione (NGS)
a. Bias ed errori di sequenziamento della tecnologia illumin
b. Formato FastQ
c. Verifica della qualità delle sequenze
d. Preprocessamento delle sequenze


2. Panoramica dei metodi di assemblaggio dei genomi
a. Overlap-layout-consensus
b. Debrujin graph
c. Verifica qualitò assemblaggio

3. Allineamento dei dati NGS su un genoma di riferimento
a. Programmazione dinamica
b. Metodi euristici
c. Formato SAM/BAM

4. Risequenziamento e chiamata delle varianti
a. Identificazione di varianti germinali
b. Identificazione di varianti somatiche
c. Metodi bioinformatici per l’identificazione delle varianti strutturali
d. Formato file VCF e gVCF

5. Metodi computazionali per la prioritizzazione di geni candidati

6. Analisi di dati di epigenetica

7. Analisi di dati di trascrittomica e RNA-seq
a. Allineamento di sequenze di RNA-seq
b. Ricostruzione dei trascritti (genome-guided / denovo)
c. Quantificazione genica
d. Normalizzazione dei dati
e. Identificazione dei geni differenzialmente espressi
f. Analisi di arricchimento

8. Laboratorio di Bioinformatica
a. Introduzione alla bash ed al sistemaoperativo linux
b. Uso del programma FastQC
c. messa a punto di una pipiline per il preprocessing delle sequenze
d. allineamento delle sequenze con bowtie2
e. gestione dei file SAM/BAM

Modalità d'esame

L’esame è scritto con sei domande aperte. Le domande vertono sugli argomenti trattati durante il corso

Opinione studenti frequentanti - 2016/2017