Guía - Análisis de datos genéticos con GenAlEx PDF

Title Guía - Análisis de datos genéticos con GenAlEx
Course Biodiversidad: Gestión y conservación
Institution Universidade de Vigo
Pages 4
File Size 150 KB
File Type PDF
Total Downloads 75
Total Views 130

Summary

Download Guía - Análisis de datos genéticos con GenAlEx PDF


Description

GUÍA PARA LA PRÁCTICA Análisis de datos genéticos con GenAlEx Con este programa se pueden hacer análisis sencillos como estimación de la diversidad genética, Fst, etc. Conviene hacer directorios para cada análisis. Abril fichero excel HaagForGenalex.xlsx. Para habilitar GenAlEx hay que abrir el excel que viene en la descarga del programa (GenAlEx 6.502.xla). Aparecerá la pantalla de GenAlEx y una pestaña de complementos donde está el menú de GenAlEx. Habilitar macros en nuestra hoja. Ir a Complementos/GenAlEx. La opción create permite crear datos aleatorios en el formato que necesita GenAlEx para diferentes tipos de marcadores Correr Frequency (tras marcar OK a la descripción de los datos, marcar “Het, Fstat and Poli by Pop”, “Private alleles list”, “ei distance” y “Pairwise Fst”) (debes estar en la hoja de los datos para aplicar los diferentes análisis) AFP: Muestra las frecuencias de cada alelo HFP: Anotar la heterocigosis esperada (He) y el número de alelos (Na) promedio de cada población FstP: Anotar Fst entre pares de poblaciones NeiP: Anotar distancias genéticas de Nei entre pares de poblaciones PAS: Anotar el número de alelos privados por población Correr Disequil. – HWE (para comprobar el equilibrio de Hardy-Weinberg). Marcar “Obs vs Exp” y “graphs” Anotar qué loci están en desequilibrio de HW Correr Distance – Genetic distance – ok (se crea una matriz de distancias genéticas) Sobre la hoja de la matriz de distancias recién creada correr PCoA – Analysis (marcar “Color Code pops”, desmarcar “Data labels”) – ok Copiar la figura de Componentes Principales Comprobar los formatos que puede generar con Export Data

Estructura poblacional y migración con STRUCTURE Se trata de ilustrar hasta qué punto la fragmentación geográfica se asocia con diferenciación genética. Para ello utilizaremos el programa STRUCTURE Abrir structure.exe

1

File – ew project – dar un nombre – seleccionar un directorio para la salida – escoger el fichero de datos: HaagForStructure Introduce la siguiente información en las ventanas de diálogo: umber of individuals (59) – umber of loci (13) – Missing data value (-9) Siguiente pantalla: Marcar “Row of marker names” (dado que la primera fila pone nombre a los marcadores) Siguiente pantalla: Marcar “Individual ID for each individual” and “Putative population origin” – finish – proceed . Hay que marcar estas dos primeras casillas, ya que el fichero de datos incluye en la primera columna el nº de identificación de los individuos (ID), y en la segunda incluye el indicador de la población de origen. El programa no utiliza esta información en el proceso de asignación de los individuos a “clusters” pero la utiliza a posteriori para comprobar si las asignaciones coinciden con los grupos deducidos. A continuación se marca “finish” y “proceed” Para introducir los parámetros de las simulaciones se usa la pestaña siguiente: Parameter set -> New -> RunLength Nº de iteraciones durante el periodo “burnin”: 100.000 (10.000 para ir más rápido) Nº de iteraciones durante el periodo MCMC (MarkovChain Monte Carlo) 100.000 o 10.000 (se suelen utilizar muchas más, pero se ralentiza mucho el programa) Damos un nombre cualquiera a los parámetros introducidos: parameter set (pueden modificarse en Parameter Set – Modify current set) Para correr el programa usamos: Parameter set -> Run (hay que especificar el número de grupos, K, que se asumen) Hacemos doble click en la casilla de resultados. La representación “Bar Plot” indica la estructuración inferida en la población y marcando “Group by POP Id” se presenta la estructuración en relación a las poblaciones identificadas a priori. Plotting -> TrianglePlot (representa los datos en un triángulo según su proporción de ascendencia en tres “clusters” -su hay más de tres se agrupan en tres- identificando su verdadero origen mediante color). “Tree Plot“ proporciona un árbol de neighbour joining. Correr el programa para distintos valores de K. Mirar el valor de “Estimated Ln Prob of Data”. Copiar figuras de Bar plot, Triangle plot y Tree plot para K = 4 Para comprobar los migrantes: correr de nuevo para K = 4 cambiando Parameter Set – En Ancestry Model sheet: marcar “Use population Information to test for migrants”. Llamar al set de parámetros con otro nombre. Poner el ratón sobre su directorio y correr de nuevo Anotar cuantos individuos son supuestos migrantes viendo el “Bar plot” (marcar “group by pop”)

2

Detección de cuellos de botella con BOTTLE*ECK Correr Bottleneck Añadir fichero: Add Data File HaagForGenepop. Marcar sólo TPM (variance=10, proportion SMM=90, Iterations=1000) y Wilcoxon sign rank test. Go. Save results as text file y Anotar Probability (one tail for H excess) para cada población

Estimación de *e con *eEstimator Correr NeEstimator 2.01.jar (el fichero ejecutable está en Zip Folder) Elegir directorio donde están los datos. Desmarcar “List Files with extensions ..”. Insertar datos HaagForGenepop ESTIMACIÓN DE Ne MEDIANTE DESEQUILIBRIO DE LIGAMIENTO: Marcar sólo método “Linkage Disequilibrium”. Desmarcar los otros métodos. Marcar “Main and Tabular format outputs” y “Output files in tabular format for the top 1 critical value” Anotar las estimas de Ne y los intervalos de confianza del fichero HaagForGenepopLDxLD Correr luego los otros métodos de una sola muestra (Heterozygosity excess y Molecular coancestry). Anotar los resultados. ESTIMACIÓN CON EL MÉTODO TEMPORAL (dos muestras). Datos de 9 microsatélites de una población de Drosophila melanogaster mantenida con  = 100 durante 50 generaciones. Abrir fichero dataVigoG0G50ForGenepop.txt (dejar marcado “list files with extensions” en este caso). y correr sólo Temporal method. Meter el número de generaciones en la casilla a la derecha: 0, 50 Anotar las estimas de Ne y los intervalos de confianza del fichero dataVigoG0G50ForGenepopTpxTp

Manejo de una población en cautividad con METAPOP Utilizaremos una población de salmones: 110 individuos muestreados para 6 loci. Con el programa METAPOP simularemos cómo deben ser los cruzamientos de mínimo parentesco si dispusiéramos de 55 machos y 55 hembras. Corre el programa Metapop1.0.3. Pega en la pestaña de “Input” la entrada del fichero MicrosMetapop. Primero selecciona sólo “Population Analysis” (desmarcar “Population management”). Mirar la matriz de parentescos de la pestaña “Coancestry Matrix”. Debe estar marcado “Use molecular data”.

3

Ejecuta el programa y anota los valores calculados de número de alelos por locus, consanguinidad (Fi), heterocigosis (GWs) y valores de parentesco (ft) y consanguinidad (Ft) en la sección final (7. Summary). Vuelve a ejecutar el programa, pero esta vez selecciona sólo “Population Management” (desmarca “Population analysis”). Anota qué apareamientos y número de descendientes sugiere el programa en “5. Mating matrix”. Copia la sección “6. Input for the next generation” en la pestaña “Input” para correr una nueva generación. Desmarca “Use molecular data” y marca “Use matrix”. Anota qué apareamientos sugiere y los cálculos de la sección “7. Summary”. Repite este proceso una generación más.

REPETICIÓ* DE ALGU*OS A*ÁLISIS CO* OTROS DATOS (si hay tiempo) DATOS DE SALMO*ES Repetir todos los análisis con los datos de microsatélites de dos ríos (Eo y Ulla). 97 individuos muestreados para 6 loci (ficheros Eo_Ulla_micros_Genalex.xls y micros Structure). Con los datos de 221 AFLPs de los mismos individuos de los dos ríos, correr Genalex (fichero Eo_Ulla_AFLPs_Genalex.xls). No permite estimar Fst pero sí la distancia de Nei. Usando el fichero AFLPstructure correr STRUCTURE con K = 2 y 3. Los datos se tratan como haploides por lo que hay que meter 97 individuos, ploidía = 1, Número de loci = 221, Datos que faltan = -9. Si se alarga mucho correr con solo 10.000 iteraciones de Burnin y de MCMC, en lugar de 100.000.

DATOS DE PÁJAROS Repetir el análisis de STRUCTURE para los datos de los pájaros de Galbusera et al. (2000) (fichero dataGalbuseraForStructure.txt). Los datos corresponden a siete loci microsatélites genotipados en las siguientes cuatro muestras obtenidas en los tres fragmentos forestales conservados que son actualmente su principal refugio, más unos vestigios de otras zonas: 1234-

Mbololo: 80 (29 hembras y 51 machos; población estimada 1060 individuos). Chawia: 17 (5 hembras y 12 machos; población estimada 38 individuos). Ngangao: 54 (24 hembras y 30 machos; población estimada 250 individuos). Otros vestigios: 4 (1 hembras y 3 machos).

Las entradas son: Nº individuos = 155; Ploidía = 2; Nº loci = 7; Missing data = -9 (identifica en este caso la dosis que falta en el sexo heterogamético para el locus 5, que está en el cromosoma sexual Z).

4...


Similar Free PDFs