Computational genomics (2017/2018)

Codice insegnamento
4S003667
Docente
Nicola Vitulo
Coordinatore
Nicola Vitulo
crediti
6
Settore disciplinare
BIO/18 - GENETICA
Lingua di erogazione
Inglese
Periodo
II sem. dal 1-mar-2018 al 15-giu-2018.

Orario lezioni

Vai all'orario delle lezioni

Obiettivi formativi

L'avvento delle nuove tecnologie di sequenziamento (Next Generation Sequencing, NGS) ha avuto un impatto enorme nella comprensione della complessità dei genomi da un punto di vista genomico, trascrittomico ed epigenetico, e ha fornito interessanti opportunità per lo sviluppo di risorse e programmi bioinformatici per l’analisi e la gestione dei dati. Il corso fornisce una panoramica generale dei metodi computazionali che fanno uso di dati NGS applicati nell’ambito della genomica, in particolare relativi alla genomica umana, come ad esempio l'allineamento di sequenze su un genoma di riferimento, il sequenziamento genomico, il risequenziamento e l’identificazione di varianti causative di malattie genetiche, l'analisi dei trascrittomi per l'identificazione dei geni differenzialmente espressi. Al termine dell'insegnamento lo studente dovrà essere in grado di:
conoscere i principali formati elettronici con cui vengono salvati i dati genomici
conoscere i differenti algoritmi utilizzati nell'ambito della genomica e le loro applicazioni
Preparare e gestire una pipeline di lavoro per l’analisi dei dati

Programma

1. Introduzione ai dati di sequenziamento di nuova generazione (NGS)
a. Bias ed errori di sequenziamento della tecnologia illumin
b. Formato FastQ
c. Verifica della qualità delle sequenze
d. Preprocessamento delle sequenze


2. Panoramica dei metodi di assemblaggio dei genomi
a. Overlap-layout-consensus
b. Debrujin graph
c. Verifica qualitò assemblaggio

3. Allineamento dei dati NGS su un genoma di riferimento
a. Programmazione dinamica
b. Metodi euristici
c. Formato SAM/BAM

4. Risequenziamento e chiamata delle varianti
a. Identificazione di varianti germinali
b. Identificazione di varianti somatiche
c. Metodi bioinformatici per l’identificazione delle varianti strutturali
d. Formato file VCF e gVCF

5. Metodi computazionali per la prioritizzazione di geni candidati

6. Analisi di dati di epigenetica

7. Analisi di dati di trascrittomica e RNA-seq
a. Allineamento di sequenze di RNA-seq
b. Ricostruzione dei trascritti (genome-guided / denovo)
c. Quantificazione genica
d. Normalizzazione dei dati
e. Identificazione dei geni differenzialmente espressi
f. Analisi di arricchimento

8. Laboratorio di Bioinformatica
a. Introduzione alla bash ed al sistemaoperativo linux
b. Uso del programma FastQC
c. messa a punto di una pipiline per il preprocessing delle sequenze
d. allineamento delle sequenze con bowtie2
e. gestione dei file SAM/BAM

Modalità d'esame

L'esame consiste in una verifica scritta del livello di conoscenze acquisite relativo agli argomenti trattati nel corso . Lo studente dovrà dimostrare di aver compreso il funzionamento e l'applicazione dei principali programmi e approcci bioinformatici spiegati a lezione. Dovrà inoltre dimostrare di saper progettare un pipeline di analisi nel contesto dei vari argomenti trattati.

Opinione studenti frequentanti - 2017/2018