Pràctica Bioedit 2019-2020 PDF

Title Pràctica Bioedit 2019-2020
Course Bioinformàtica Aplicada
Institution Universitat de Girona
Pages 15
File Size 1.6 MB
File Type PDF
Total Downloads 30
Total Views 129

Summary

Download Pràctica Bioedit 2019-2020 PDF


Description

Pràctica

BIOEDIT

Bioinformàtica Aplicada 2019-2020

Introducció BioEdit és un dels programes més utilitzats en biologia molecular, especialment pel que fa a edició i alineament de seqüències. La seva interfície gràfica permet que el seu ús sigui molt fàcil i intuïtiu. El podeu descarregar en aquesta adreça:

https://bioedit.software.informer.com/Descargar-gratis/ En aquesta pràctica realitzarem una petita introducció a les funcions més bàsiques, que us permetran realitzar sense problemes tant la pràctica avaluable del proper dimarts com el projecte final de l’assignatura. Bioinformàtica Aplicada, com ja sabeu, és una assignatura pràctica que té com a objectiu introduir-vos en l’ús de les eines bioinformàtiques més habituals. Per aquesta raó, no incidirem massa en els conceptes teòrics, ja que aquests se us explicaran a Fonaments de Bioinformàtica. Al llarg d’aquest document, veureu que s’alternen les explicacions dels menús del programa amb una part pràctica, que teniu ressaltada en color blau. Aquesta part pràctica és la que podreu respondre en el qüestionari de seguiment disponible al Moodle.

1

1. Edició de seqüències Obrir un arxiu File  Open file Quan esteu en aquesta opció, si feu click en el desplegable que us permet triar el tipus d’arxiu, podreu veure quins són els formats suportats pel programa.

NOTA: Si no teniu cap altre programa d’aquest tipus instal·lat a l’ordinador, el més probable és que l’ordinador associï els arxius FASTA amb BioEdit. En aquest cas, els vostres arxius mostraran la icona identificativa de BioEdit i s’obriran automàticament amb el programa en fer-hi doble click.

2

PRÀCTICA En primer lloc, descarrega des de NCBI la seqüència amb número d’accés JF990713 amb un arxiu que tingui format GenBank full (.gb). Anomena el teu arxiu com a “Mostra_E” i desa’l. 1. Quin tipus de molècula estàs analitzant? 2. Quina és la seva longitud? Dintre de la carpeta “Pràctica Bioedit” al Moodle, trobaràs dos arxius en format FASTA (.fas), una anomenat “AMS.fas” i un altre anomenat “Mostra_D.fas”. Obre tots dos arxius amb un editor de text (p.e. llibreta/bloc de notas). 3. Quantes seqüències hi ha a cadascun dels arxius?

Opcions de visualització

Un cop obert un arxiu, us apareixerà dins el programa una nova finestra amb les seqüències contingudes en aquest. A l’esquerra de la finestra, apareixeran els noms de les seqüències. Si feu un click sobre el nom de la seqüència, se us marcarà com a seleccionada. Si feu un altre click, podreu canviar-li el nom. NOTA: és molt aconsellable que canvieu el nom a les seqüències que us descarregueu de GenBank. Per defecte, us posarà el títol complet de l’entrada (molt llarg), i correu el risc que algun programa no us conservi la totalitat de caràcters i us acabi tallant el nom. Intenteu posar noms que no superin els 10 caràcters. A la dreta, tindreu les seqüències. Les icones assenyalades a la imatge us permetran seleccionar una opció de visualització de les diferents posicions: fons en color o blanc i negre, marcar les identitats com a punts, etc. Podeu triar la que més us agradi, ja que només és una qüestió visual i no afecta als anàlisis posteriors.

3

A dalt de les seqüències, hi ha una regleta que indica les posicions. A més, si poseu el cursor a sobre una base, us n’indicarà la posició.

Obrir simultàniament més d’un arxiu BioEdit us permetrà obrir més d’un arxiu a la vegada. Aquests apareixeran com a diferents finestres dins el programa. Quan teniu diversos arxius oberts, podeu seleccionar una seqüència determinada i copiar-la en un arxiu diferent. Oju! És important que obriu les seqüències dins un ÚNIC bioedit, si feu doble click a les seqüències un cop descarregades se us obrirà Bioedit per separat en cada una d’elles i no podreu treballar amb elles conjuntament, ni fer alineaments amb totes elles. Per tant assegureu-vos que només teniu obert una finestra de Bioedit a la vostra sessió de Windows o Mac.

Dins el menú Edit, teniu diferents opcions per copiar i enganxar seqüències. Serien totes les opcions que teniu marcades a la imatge de la pàgina següent. Les altres opcions de copiar i pegar dins aquest menú fan referència a residus seleccionats amb el cursor, títols de la seqüència, copiar-pegar des del “corta-papeles”, etc.

4

Editar la informació d’una seqüència Sequence  Edit Sequence (O fent doble click sobre el títol de la seqüència) S’obrirà una finestra on podreu veure i editar la informació continguda a l’arxiu.

5

PRÀCTICA Un cop obert l’arxiu “AMS.fas”, obre els arxius “Mostra_D.fas” i “Mostra_E.gb” en la mateixa aplicació de BioEdit en la que has obert l’arxiu “AMS.fas. Quan tinguis tots els arxius oberts, compara la informació del arxius “Mostra_D.fas” i “Mostra_E.gb” seleccionant les diferents finestres que s’obren per cadascun del arxius. Desplega la finestra d’edició completament. 4. Observes diferències entre els dos formats d’arxius? Quin és més informatiu? Per què? Copia les seqüències de la “Mostra_D” i la “Mostra_E” i enganxa-les a l’arxiu “AMS.fas” Un cop enganxades les seqüències “Mostra_D” i “Mostra_E”, compara les diferents seqüències que es troben incloses dins l’arxiu “AMS.fas”. 5. Quina és la longitud de les diferents seqüències incloses? Guarda l’arxiu amb totes les seqüències amb el nom “AMS_Nom_alumne.fas”.

Editar una seqüència

Per editar una seqüència (canviar, afegir, o bases), haureu de triar el mode Edit dintre del menú desplegable Mode. D’aquesta manera, podreu modificar les seqüències com si fossin text editable. Una opció interessant és la de Edit  Select to end / Select to beginning Si poseu el cursor en una base concreta (o seleccioneu una posició de totes les seqüències d’un alineament), aquestes opcions us permetran seleccionar automàticament totes les bases a la dreta i a l’esquerra respectivament. Si teniu una seqüència molt llarga i us interessa suprimir l’inici o el final, això us permetrà fer-ho de manera fàcil i ràpida.

6

2. Eines d’anàlisi ClustalW BioEdit permet realitzar alineaments de seqüències basant-se en el mètode de ClustalW. Haureu de seleccionar les seqüències que vulgueu alinear (si no en seleccioneu cap, per defecte les seleccionarà totes). Accessory Application  ClustalW Multiple alignment

A continuació se us obrirà una finestra per configurar els paràmetres de l’alineament. En la major part de casos, ho podreu deixar amb les opcions per defecte. OPCIONAL: Si voleu ampliar la informació, podeu consultar aquest article: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC308517/ Finalment, l’alineament se us obrirà en una nova finestra. Us recomanem que guardeu l’arxiu de l’alineament amb un nom diferent, perquè és molt fàcil confondre’s amb l’arxiu sense alinear i/o sortir sense guardar els canvis.

7

Llargada d’una seqüència Com ja heu comprovat abans, el programa permet veure fàcilment la llargada d’una seqüència determinada, ja sigui desplaçant el visor fins el final per veure les últimes posicions, o obrint el menú de la informació de seqüència. No obstant, un cop hem alineat un conjunt de seqüències, pot ser que es generin gaps. Tenint en compte aquest fet, podem definir dues longituds diferents de seqüència: Length  llargada d’una seqüència en relació a un alineament True length  llargada real d’una seqüència (és a dir, quantitat real de nucleòtids).

Abans d’alinear: les dues primeres seqüències tenen una llargada de 291 bases.

Després d’alinear: s’ha generat un gap. En aquest cas, la length de les dues primeres seqüències és de 303, mentre que la true length segueix sent de 291.

Si aneu a Sequence  Edit Sequence (o fent doble click sobre el títol de la seqüència), podreu veure les dues llargàries.

8

Composició nucleotídica Sequence  Nucleic Acid  Nucleotide Composition Us obrirà dues finestres, presentant aquesta informació tant escrita com en format gràfic.

9

Càlcul de similitud i diferències BioEdit incorpora diverses eines que ens permeten analitzar la semblança o diferència entre seqüències. A nivell visual, l’eina d’identitat permet visualitzar les posicions invariables (apareixen com un punt) i les variables (apareixen mostrant la variant respecte a la seqüència en primera posició).

Matriu d’Identitat Alignment  Sequence Identity Matrix Calcula la identitat entre seqüències. Ens proporcionarà un arxiu de sortida .txt El format de visualització pot ser una mica incòmode, ja que les columnes se solen desplaçar i ajuntar. Podeu reduir la mida de la lletra o enganxar el text a l’Excel per tal de solventar aquest inconvenient (reconeixerà què fa a cada cel·la).

10

Matriu de diferències Alignment  Sequence Difference Count Matrix En aquest cas, el que calcula és el número de posicions diferents entre dues seqüències, en nombres absoluts. També crearà un arxiu de sortida en format txt.

11

Seqüència consens Alignment  Create Consensus Seqüence Donat un grup de seqüències alineades, aquesta opció ens permetrà crear una seqüència consens: és a dir, una seqüència representativa de les anteriors. Fixeu-vos que les bases que presenten polimorfismes els residus tenen caràcters especials. Com podeu veure a la imatge les posicions no variables conserven el residu. Un consell, si quan genereu la seqüència consens la majoria dels residus no estan conservats és molt probable que l’alineament no estigui ben fet. És habitual que hi hagi regions poc conservades (10-30%) però valors més alts ens faran sospitar d’algun error.

12

Realització de BLAST per a un conjunt de seqüències Si guardeu l’alineament en format FASTA, podeu utilitzar aquest arxiu per realitzar un BLAST simultani per totes les seqüències.

Un cop realitzat el BLAST, un menú desplegable us permetrà triar els resultats per cadascuna de les seqüències contingudes a dins l’arxiu.

NOTA: Cal que elimineu prèviament la seqüència consens de l’arxiu, si no, us donarà error.

13

PRÀCTICA Realitza l’alineament múltiple de les teves seqüències utilitzant el programa ClustalW. Guarda aquest arxiu amb el nom “AMS_Nom_alumne_Clu.fas”. 6. Quina és la longitud de l’alineament? 7. Quin és el contingut CG de cadascuna de les seqüències? Calcula la matriu d’identitat entre les diferents seqüències. 8. Quin parell o parells de seqüències són les més semblants? I quines són les més divergents? 9. Crea la seqüència consens.

14...


Similar Free PDFs