Bioinformatica (2007/2008)

Corso a esaurimento

Codice insegnamento
4S00183
Crediti
3
Coordinatore
Alejandro Giorgetti
L'insegnamento è organizzato come segue:
Modulo Crediti Settore disciplinare Periodo Docenti
Laboratorio 1 BIO/10-BIOCHIMICA 1° Sem Alejandro Giorgetti
Teoria 2 BIO/10-BIOCHIMICA 1° Sem Alejandro Giorgetti

Obiettivi formativi

Modulo: Teoria
-------
Il corso si pone l'obiettivo di fornire gli strumenti informatici per l'analisi e l'interpretazione dei dati biologici. Si propone inoltre di stabilire le basi teoriche delle possibili applicazioni dei principali strumenti bioinformatici di uso corrente in proteomica, genomica, biochimica, biologia molecolare e strutturale, mettendo lo studente in grado di utilizzare programmi di genomica funzionale, proteomica e genomica strutturale.


Modulo: Laboratorio
-------
Il laboratorio mira a fornire agli studenti gli strumenti e i metodi necessari per accedere all'informazione biologica in modo razionale ed efficiente, utilizzando le risorse disponibili in rete e programmi d'ultima generazione.

Programma

Modulo: Teoria
-------
Banche dati in ambito biologico. Le banche dati biologiche primarie, derivate e integrate. Il formato FASTA. In particolare analizzeremo come queste banche dati sono utilizzate per l'annotazione di genomi procariotici ed eucariotici. Metodi statistici per la ricerca/annotazione di geni: matrici di punteggio sito-specifiche, Markov Models (MM). Sensibilità e specificità dei metodi. La banca dati ENSEMBL.

Metodi per la predizione e annotazione degli elementi funzionali del genoma. Metodi e programmi per la predizione di geni (ab initio, comparative), analisi dei promotori.

Annotazione funzionale dei geni. Mediante l'utilizzo della struttura dei prodotti genici, utilizzo della filogenesi Concetti di paralogia e ortologia. Database di famiglie e banche dati derivate. Classificazione di domini. Predizione di interazioni proteiche e geniche. Metodi knowledge-based per la predizione della funzione.

Analisi dell’espressione genica: Data mining di dati di espressione:
estrazione ed analisi di dati da database biologici.
Data mining di letteratura scientifica.
Progetto di sequenziamento del genoma umano e progetto ENCODE

Annotazione funzionale:
Gene Ontology (GO).
ENSEMBL

Utilizzo dei Microarray per l'analisi della espressione genica: Introduzione alle metodologie e studio delle tecniche per l’analisi dei dati: normalizzazione e filtering dei dati, banche dati, metodi di clustering.
Allineamento di sequenze. Matrici di punteggio PAM e BLOSUM, penalizzazione di inserzioni e delezioni. Algoritmi di allineamento esatti ed euristici. Esempio di algoritmi di allineamento esatti: le matrici cumulative.

Allineamenti multipli. Il programma Clustal W. L’informazione strutturale contenuta negli allineamenti multipli. Profili di sequenza.

L’evoluzione delle proteine. Famiglie e superfamiglie proteiche. Ricerca in banche dati per similarità. Significatività dell’allineamento. I programmi FASTA, BLAST e PSI-BLAST.

Predizione della struttura tridimensionale di una proteina:
Modelling comparativo, Fold Recognition e metodi Ab initio. Relazione quantitativa per la conservazione della struttura primaria e terziaria in proteine omologhe. Il core proteico e le regioni strutturalmente divergenti (SDR). Passaggi per la costruzione di un modello comparativo. Librerie di rotameri. Modelling dei loop. Metodi statistici basati su parametri geometrici e di impacchettamento proteico. Applicazione al controllo di un modello proteico.


Modulo: Laboratorio
-------
Utilizzo dei database in ambito biologico, loro struttura e metodologie di interrogazione.

Metodiche di allineamento di sequenze.
L’evoluzione e la filogenesi. Ricerca in banche dati per similarità. Significatività dell’allineamento. Riconoscimento di omologia. I programmi FASTA, BLAST e PSI-BLAST.

Predizione della struttura tridimensionale di una proteina: Modelling comparativo. Fold recognition e Ab initio. Utilizzo dei principali programmi.

Laboratorio di Genomica:

Predizione automatica di geni utilizzando i programmi di utlima generazione.
Utilizzo della banca dati ENSEMBL.
Analisi dell’espressione genica: Data mining di dati di espressione:
. estrazione ed analisi di dati da database biologici.
. Data mining di letteratura scientifica.

Annotazione funzionale:
. Gene Ontology (GO).
. geni ortologhi: loro funzione nell’annotazione funzionale.

Microarray: Utilizzo dei principali programmi e banche dati .

Modalità d'esame

Modulo: Teoria
-------
Scritto


Modulo: Laboratorio
-------
scritto