Tema 9. Filogenia molecular PDF

Title Tema 9. Filogenia molecular
Course Bioinformática
Institution Universidad Politécnica de Madrid
Pages 14
File Size 1.2 MB
File Type PDF
Total Downloads 34
Total Views 139

Summary

Profesor Pablo Rodríguez Palenzuela...


Description

TEMA 9. Filogenia molecular ! I. Conceptos básicos. Introducción. ! •

Filogenia es la historia evolutiva de una especie o un grupo de especies relacionadas.



La Sistemática clasifica a los organismos y determina sus relaciones evolutivas (filogenia + taxonomía).! La Sistemática utiliza el registro fósil, datos genéticos y moleculares para inferir las relaciones evolutivas; y emplea árboles filogenéticos para representar estas relaciones evolutivas. Por tanto, el principal objetivo de la Sistemática se basará en establecer relaciones evolutivas a partir de datos moleculares de cualquier frecuencia.



Taxonomía consiste en la división organizada y la nomenclatura de los organismos.

No obstante, hasta el siglo XIX no existía una teoría evolutiva, y únicamente se hacía taxonomía; se establecían características de cualquier tipo y posteriormente se hacía la clasificación, lo que se conocía por “taxonomía numérica”. Como impulsores o padres de la Sistemática, podemos destacar las figuras de:

!

-

Charles Darwin July 1837, un naturalista inglés que postuló que todas las especies de seres vivos han evolucionado con el tiempo a partir de un antepasado común mediante un proceso denominado selección natural. Los árboles filogenéticos surgen a partir de esta teoría de la evolución de Darwin, como representaciones gráficas de las relaciones evolutivas entre un grupo de organismos vivos.!

-

Ernst Heinrich Haeckel 1834-1919, que tras la publicación de “El origen de las especies” de Darwin, postuló que la evidencia de la evolución humana se podía encontrar en las Indias Orientales Holandesas, y describió esas teorías con gran detalle, reconociendo el origen común de simios y humanos. El primer árbol filogenético fue debido a Haeckel, hacia 1866, quién demandó que todas las especies descienden por evolución de una especie ancestral común, y que la aparición de una nueva especie se produce por la subdivisión de una existente en dos subespecies que han divergido tanto que pierden la capacidad de cruzarse.!

-

!

Análisis filogenéticos

!!!-

Los análisis filogenéticos clásicos se basaban en caracteres morfológicos (ej.: número de patas, número de pétalos, etc.) y en criterios subjetivos. Los métodos modernos incorporan datos de tipo molecular tales como: secuencias de genes, secuencias de proteínas, etc. Los análisis se basan en secuencias homólogas en diferentes especies (ej., globinas).

! ! !

Una de las primeras familias de proteínas que se estudiaron fueron las globinas, cuya divergencia se produjo hace millones de años. A partir de datos moleculares, se pudo deducir cuando tuvo lugar esta divergencia entre distintos genes.

!

1

¿Cuál es la especie actual más próxima a los humanos?!

!

El hombre y el mono tienen un ancestro común, pero es incorrecto decir que descendemos del mono. Habrá organismos más evolucionados que otros, como puede ser el caso de todas las bacterias.

! ! !

Visión actual basada en datos moleculares

Hipótesis premolecular

Evolución implica cambio genético a lo largo del tiempo, no adaptación (fitness: alude a la capacidad de individuos, genotipos, a sobrevivir y reproducirse, es decir, aumentar el número de copias de sí mismo en la siguiente generación).

!

☛ En el lenguaje común, el concepto de más evolucionado tiene connotaciones positivas. ☛ El cambio genético sí puede ser más rápido en unas u otras especies, sin dirección determinada, pero no sugiere algo mejor o peor, o más o menos adaptado.

! ! !

La Filogenia molecular tiene diversas aplicaciones, entre ellas, algunas de tipo forense y legal; este es el caso del dentista de Florida, que infectó a un número alto de pacientes del virus del SIDA, el cual evoluciona asombrosamente rápido. Mediante estudios genéticos de los retrovirus, se pudo ver qué pacientes enfermos tenían un antecesor común con el virus del dentista.

! ! ! ! ! !

Otro ejemplo es el caso Maeso, que de nuevo habla de un médico que infectó, con una misma jeringuilla, de hepatitis B a sus pacientes. Varios de ellos ya habían fallecido cuando se celebró el juicio.

! ! ! !

2

Teoría Neutral de la Evolución

(por Motoo Kimura)

Esta teoría postula que: “La gran mayoría de cambios evolutivos a nivel molecular son causados por la deriva genética de mutantes neutros desde el punto de vista de la selección”.

!

No obstante, no todas las mutaciones tendrán efectos. Podemos así hablar de dos planos:

!

- Las mutaciones pueden ser neutrales: no tienen efectos alguno sobre fitness (por ej, en intrones, en zonas codificantes, mutaciones sinónimas (dan el mismo aa), etc. ).

- La cuestión de la deriva genética: la composición de una muestra aleatoria que tomamos de una población puede determinar la condición genética cuando la población se regenera.

! Darwin !

vs Kimura, ¿son incompatibles ambas teorías?!

Los partidarios de las teorías más seleccionistas niegan que la parte neutral exista, es decir, consideran que las características de los seres vivos son resultado de la selección natural, y solo una parte se debe al cambio genético. Toman la selección natural como única fuente de cambio adaptativo.

! ! ! II.Terminología ! ! !

de los árboles genéticos

Raíz de un árbol genético : ancestro común. El patrón de ramificación de un árbol se denomina topología.

!

Tres árboles son iguales si tienen la misma topología (quién está más cerca de quién):

! !

Árboles con raíz y sin raíz:

! ! ! !

⇢ En un árbol enraizado existe un nodo particular, llamado raíz, del cual parte un camino único hasta cualquier otro nodo. La dirección de cada camino marca el tiempo de evolución y la raíz es el antecesor común de todas las unidades taxonómicas incluidas en el estudio. Mucho más informativo es un árbol filogenético enraizado que no enraizado, dado que las relaciones filogenéticas resultan más evidentes. ⇢ En un árbol filogenético no- enraizado, las relaciones filogenéticas no son deducibles inmediatamente.

3

Dos maneras básicas de enraizar un árbol:

!

Usando un “outgroup”: Incluyendo un taxón que está más alejado de todos los objetos de estudio, por ejemplo, un ave en un árbol de mamíferos. !!!!!

!

Punto medio o distancia: La raíz se encuentra en el punto medio de los taxones más alejados. .

! !

El formato Newick!

!

En programas de ordenador, los árboles se representan mediante una cadena de paréntesis anidados, que incluyen los nombres de los taxones (a veces incluyen más información). El inventor de este formato fue el matemático Arthur Cayley (1821–1895). El patrón de paréntesis indica la topología del árbol, y que los taxones se hallen dentro del mismo paréntesis, indica que son más cercanos. Un árbol en este formato siempre acaba en un punto y coma(;).

! !

En definitiva, es un formato informático de árboles.

!



TAXON

Un taxón es una especie o grupo de especies al que se le ha dado un nombre, por ejemplo, Homo sapiens (humanos modernos) o Lepidoptera (mariposas). Hay códigos de nomenclatura biológica que trata de garantizar que cada taxón tiene un nombre único y estable, y que cada nombre se utiliza para un solo taxón.

!



Clades

Es lo mismo que un grupo monofilético.

!

Estrictamente: un clade es un grupo de todos los taxones que han derivado de un ancestro común más el mismo antepasado común.

!

Según la Filogenia Inmolecular: un clade es un grupo de taxones que presentan un antecesor común que no es compartido por ningún otro grupo filogenético.

4

➡ Taxa parafilético

!

Un taxón, cuyo ancestro común es compartido por otros taxones, se denomina taxón parafilético o taxón inválido. Otra definición: un grupo es parafilético cuando incluye al antepasado común de sus miembros, pero no a todos los descendientes de este.

!

Los reptiles, por ejemplo, no son un grupo monofilético, sino una taxa parafilético.

! !

¿Cuáles de los siguientes grupos no son monofiléticos?

!

(a)human, chimpanzee, baboon: Sí (b)mouse, chimpanzee, baboon: No (c)rat, mouse: No (d)human, chimpanzee, baboon, rat, mouse: Sí (e) E. coli, human, chimpanzee, baboon, rat,mouse:Sí

! !

¿Cuántos árboles existen para cada unidad taxonómica?

!

1 unrooted tree = 3 rooted trees ( 1 OTU )

! ! ! ! ! ! ! !

Existen 15 posibles árboles enraizados, número que continúa aumentado de forma exponencial. A cada número nuevo de OTUs, el número de posibles árboles enraizados crece. (Por ejemplo: 3 unrooted trees = 15 rooted trees ➝ 4 OTUs)

!

Para calcular el número de árboles enraizados de una bifurcación para un n ≥ 2 OTUs:

! ! ! ! !

Para calcular el número de árboles no enraizados para un n ≥ 3 OTUs:

! ! ! ! !

5

Uno de sucesos claves en evolución:Duplicación génica!

!

Se podría resumir diciendo que se trata del proceso por el cual un fragmento que contiene un gen se duplica por procedimientos al azar.

!

Más rigurosamente, una duplicación génica es la duplicación de una región de DNA que contiene al menos un gen. Puede ocurrir por un error del mecanismo de recombinación homóloga (duplicación segmental), por un evento de retrotransposición o por la duplicación de un cromosoma entero. A veces las duplicaciones del gen no son completas, tan solo contienen parte del gen ancestral (duplicaciones parciales) o bien pueden tener trozos de varios genes (duplicaciones quiméricas). Este concepto es clave en la evolución dado que estos dos tipos de duplicaciones contribuyen a la formación de nuevos genes, y, por tanto, de nuevas funciones.

!

En definitiva, un gen que codifica una proteína se va a duplicar sucesivamente, pero conforme pasa el tiempo, se podrán ir sucediendo cambios.

El destino más común de un gen duplicado redundante es la no funcionalización (pseudogenes), dado que la mayoría de nuevas mutaciones que le ocurran serán deletéreas por naturaleza. En el genoma nos quedará un pseudogen, porque no realiza ninguna función o porque ha perdido la expresión, dependiendo de donde se den las mutaciones.

!

Por tanto, un pseudogen es una posibilidad que se pueda dar durante la duplicación, resultado de la acumulación de mutaciones en un gen que dan lugar a una inactivación. Puede adquirir una función distinta que sea favorable al organismo.

!

El proceso de duplicación cambio evolutivo.

génica seguida de evolución de uno de los genes es fundamental en el

!

Hay árboles de genes y árboles de especies!

!

Antes de la separación de humanos y ratas, un gen sufre una duplicación, y tras la separación se produce otra. ➝ 1 y 3 son ortólogos ➝ 2 y 3 son ortólogos: relación unívoca

!

Existen dos (4 y 5) genes igual de separados de 2: no hay una relación uno a uno, no son ortólogos.

! ! !

!

➝ 2 y 4 son homólogos ➝ 2 y 5 son homólogos ➝ 4 y 5 son ortólogos

6

III.Interferencia filogenética

!

El objetivo de las filogenias es construir un árbol evolutivo que relacione los diferentes taxones de nuestro interés de manera correcta.! Distinguiremos filogenias basadas en métodos de carácter y otros basados en matrices de distancias.

! Tipos !

de datos usados en inferencia filogenética:

Métodos basados en caracteres:! Un carácter es una propiedad bien definida de las unidades taxonómicas que puede tener uno o más estados mutuamente excluyentes. Un carácter equivale a una variable cuantitativa o cualitativa, y el estado es el valor que toma. Por ejemplo, un carácter podría ser la posición 195 en un gen y el estado el nucleótido A.

!

! Métodos basados en distancias:!

Una matriz de distancias, entre uno o dos taxa, tiene las siguientes propiedades:

! ! ! ! ! ! ! !

Se pueden crear de distinta manera: es una función que dada dos especies no deduce la distancia cuantitativa entre ambas.

! !

No obstante,… La mayoría de los métodos moleculares suministran datos de tipo carácter. Hay métodos en los que los datos de tipo carácter los convierten en una matriz de distancias.

! ! !

7

¿Secuencias de nucleótidos o de aminoácidos?

!

• 3 posiciones diferentes en el DNA, pero sólo una en los aminoácidos: 2 de la sustituciones de nucleótidos sinónimas y una es no-sinónima.

! !

- El DNA proporciona más información filogenética que las proteínas (es más variable), pero las secuencias -! -! -! ! !

de aminoácidos pueden alinearse de forma más eficiente, se conservan mucho mejor ( por los 20 aminoácidos frente a los 4 nucleótidos). Las regiones no codificantes, por ejemplo pseudogenes, no tienen (en general) presión selectiva. El rRNA evoluciona muy lentamente, clave para estudios filogenéticos. El mtDNA cambia más deprisa que los genes nucleares.

Dependiendo del tipo de taxones, nos interesará uno u otro. Para un árbol filogenético de todos los seres vivos, no emplearíamos genes puesto que difieren mucho unos de otros.

!

Reloj molecular ! Tasa de mutación! λ= no sustituciones/aa x año!

!

Eje Y : número de correcciones de aminoácidos por cada 100 residuos Eje X: millones de años de divergencia

!

Corrección de Margoliash & Smith

!

! !

n: número años m: cambios/100aa!

Conclusiones de la gráfica:

!-

Relación lineal entre tiempo y número de cambios.

- Distintas familias de proteínas varían a distinta velocidad, dado que hay cambios con efectos mucho más

!

drásticos sobre la función que otros.

Cuando tenemos cambios en la secuencia respecto al tiempo, si este (T) es suficientemente grande, obtendríamos una asíntota, no una recta, hasta el 25% (es la diferencia por azar); esto es debido a que puede haber vuelta atrás y recuperar su identidad original (esto es mucho más difícil en proteínas, donde si se superase hasta un 50% de aa distintos entre A y B, obtendríamos una secuencia final donde no se podría detectar si se ha recuperado un aminoácido (no se puede apreciar el cambio), y por tanto, la relación no es lineal (pero sí hay relación). Por ello se aplica una corrección sin la cual no aparecería como líneas rectas.

!

Ciertas familias de proteínas varían con tasa de mutación muy diversa, que refleja el hecho de que determinadas proteínas tengan distintas restricciones: diferentes efectos de los cambios. 8

Tasa de sustitución de nucleótidos: en un árbol filogenético de dos especies, para calcular r, la tasa de sustitución, deberíamos primero contar el número de sustituciones, dividida por el número de residuos, y después dividiendo por 2 * tiempo (2 = cambio en ambos sentidos). !

!

r = nº sustituciones/nt x año ⟶ r = K/2T T: tiempo de divergencia K: no sustituciones x sitio!

! ! !

Por ejemplo, al comparar secuencias de globinas humanas y de rata: 0.093 sustituciones/sitio.

!

Divergencia: 80 millones de años r = 0.093/2(8.107)

! !

OJO: r puede variar en cada gen, incluso entre regiones distintas de un gen.!

! !

Podemos estimar el tiempo de divergencia empleando la tasa de sustitución de nucleótidos. En ocasiones, el reloj molecular adelanta o atrasa el tiempo de divergencia: ✓ La tasa de evolución varía entre diferentes organismos. ✓ La tasa de evolución varía entre diferentes genes. ✓ La hipótesis del reloj molecular sólo es aplicable cuando el gen retiene su función en el tiempo considerado.!

! Selección ! !

positiva o negativa

➡ Negativa o purificadora: elimina determinadas variantes por sus efectos negativos. ➡ Positiva: solo los individuos con una determinada mutación sobreviven, es decir, están favorecidos (por

! !!

ejemplo: estirpes resistentes a un antibiótico). Es un proceso poco habitual.

Existen múltiples tests o sistemas para evaluar la selección:

! ! ! ! ! ! ! ! ! ! !

El más simple es el conteo de mutaciones sinónimas (que no dan lugar a cambio), que se emplea como indicador de selección positiva o negativa: ratio ds / dns

> 1 = negativa < 1 = positiva (las sinónimas se acercan a las no sinónimas).

Permite escanear un genoma y detectar los genes expuestos a selección positiva.

9

IV.CÓMO CONSTRUIR UN ÁRBOL FILOGENÉTICO

!

1) Tenemos una serie de genomas (taxones y secuencias) y entre ellos elegimos los genes a utilizar, bajo los criterios : - el gen sea común en todas las especies y dependiente del tipo de especie nos interesarán unos u otros genes con características diferentes. - una razón adicional de la elección es que otros trabajos ya los hayan utilizados anteriormente y se quiera hacer una comparación entre ellos.

!

2) Hacer alineamiento múltiple: secuencias de tamaño similar, etc. 3) Elegir modelo de sustitución de DNA o proteínas. 4) Elegir método de construcción de árboles. 5) Evaluación del árbol.

!

Además,! • Elegir cuidadosamente los genes que se van a emplear; deben estar representados en todos los taxones. • Asegurarse de que todas las secuencias son homólogas (alineamiento por pares, Pfam, etc...). • Editar e inspeccionar manualmente el MSA. Modificar los parámetros de introducción de gaps, el número de secuencias o incluso restringir el análisis a una parte. • Las regiones con múltiples gaps no son interpretadas correctamente por los programas de filogenia.

!! Modelos de sustitución de nucleótidos y aminoácidos !

Idea básica: Diferencias y distancias (proporción de residuos que difieren ➝ de forma resumida ) no son lo mismo.

!

Diferencias vs Distancia! d = 100 n/N; d = p p= proporción de residuos que difieren! d = distancia n = número de diferencias N = número de sitios

! ! !!

→ A distancias más largas, el número de cambios no refleja la distancia real.

Corrección de Poison d = - ln (1 − p)!

!

Se asume igual frecuencia de todos los aminoácidos e iguales tasas de sustitución en todos los sitios.

!

Por el procedimiento de Poison se corrigen las distancias largas.

! ! ! ! !

10

Modelos de evolución más complejos

!

En el caso de DNA, una posibilidad es asumir que la probabilidad de mutación entre aminoácido es la misma (α); o asumir que tiene dos parámetros, (α y β), si hablamos de bases púricas o pirimidínicas, pues es más lógico asumir que las frecuencias de mutación (transición más frecuente que transversión) son diferentes.

! ! ! ! ! ! ! ! ! ! !

Proporción de diferencias no directa, por la fórm...


Similar Free PDFs