Fasta - spiegazione generale PDF

Title Fasta - spiegazione generale
Author Manu Cr
Course Bioinformatica
Institution Università degli Studi di Padova
Pages 1
File Size 53 KB
File Type PDF
Total Views 129

Summary

Spiegazione generale del metodo fasta. Dalle lezioni di bioinformatica del corso dell'unipd...


Description

Il metodo FASTA Il nome FASTA è ormai da molti associato solo ad un diffuso formato in cui possono essere presentate ed utilizzate le sequenze di DNA e proteine. Tuttavia FASTA è anche il nome di un metodo di allineamento che ha rappresentato per molti anni un’alternativa a BLAST e che si basa sull'algoritmo di Pearson e Lipman. In FASTA la ricerca di similarità è effettuata in fasi: - ricerca rapida delle regioni di identità. E' fondamentale in questa fase il parametro ktup, che definisce il numero di residui identici contigui necessario perchè sia realizzata un'identità. Ad esempio, in un allineamento di sequenze di DNA con set di ktup = 4, sono considerati i tetranucleotidi identici, ma non i trinucleotidi, i dinicleotidi ed i singoli nucleotidi; - dopo aver individuato tutte le similarità, sono individuate le regioni con la più alta densità di similarità; - i punteggi di similarità sono ricalcolati considerando tratti di sequenza identici di lunghezza < ktup, introducendo gaps (piccoli) e considerando le sostituzioni conservative. In questa fase, sono adottate matrici di identità/non identità (per il DNA) o di punteggi (per le proteine; solitamente, PAM-250); - si verifica la possibilità di congiungere le regioni precedentemente individuate per formare un allineamento unico; l'allineamento viene quindi ulteriormente ottimizzato mediante appositi algoritmi. FASTA è indicato per il confronto di sequenze nucleotidiche particolarmente divergenti; negli altri casi è sensibile quanto BLAST che, però, è molto più veloce e quindi più utilizzato....


Similar Free PDFs