Informe 09 Metodología Seminario PDF

Title Informe 09 Metodología Seminario
Author Percy Quenaya
Course Metodología de la Investigación
Institution Universidad de San Martín de Porres
Pages 11
File Size 357.1 KB
File Type PDF
Total Downloads 25
Total Views 66

Summary

METODOLOGÍA DE LA INVESTIGACIÓN“Análisis de la Información”Semestre Académico 2021 - I Campos Monteza Walter André 71056917 / 2019113307 Quenaya Campusano Rafael 74569545 / 2016440014Dr. Herry Lloclla GonzálesChiclayo – PerúMarzo, 2021INTEGRANTES - CÓDIGO / GRUPODOCENTEOBJETIVO Conoce el software ...


Description

METODOLOGÍA DE LA INVESTIGACIÓN “Análisis de la Información”

Semestre Académico 2021 - I INTEGRANTES - CÓDIGO / GRUPO

 Campos Monteza Walter André  Quenaya Campusano Rafael

71056917 / 2019113307 74569545 / 2016440014

DOCENTE Dr. Herry Lloclla Gonzáles

Chiclayo – Perú

Marzo, 2021

OBJETIVO 1. Conoce el software para el análisis de los datos de los trabajos de investigación tanto a nivel cuantitativo como cualitativo.

CUESTIONARIO 1.- ¿Cuáles son los pasos que se debe seguir para realizar un análisis de datos cuantitativo? Los datos cuantitativos son la base del análisis estadístico, son datos que se puede medir y verificar, que nos dan información acerca de las cantidades; es decir, información que puede ser medida y escrito con números. 1. Defina bien su problema: Para plantear una solución basada en datos, la clave más importante para recibir los resultados esperados es definir el problema en una forma clara y concreta. Si dos seres humanos no pueden estar universalmente de acuerdo en qué constituye el problema, mucho menos en su solución. Lo mismo pasa con las computadoras, son solo una extensión de nuestro cerebro que se encarga de recibir instrucciones y arrojar resultados. 2. Conozca sus datos: Esto para saber el rango de soluciones que cada set de datos pueda ofrecer. Referencias como diccionarios de datos permiten a las demás personas involucradas tener acceso a la información de los datos disponibles. 3. Identifique el set de datos ideal: Basado en el problema que usted quiera solucionar, también sepa a lo que quiere llegar para poder solucionarlo. Por ejemplo, si su problema es “¿cuál de mis empleados ha vendido más en los últimos seis meses? “, su conjunto de datos ideal es una lista de empleados, y la suma de ventas para cada uno, para el último semestre vigente. ¿Fácil verdad? Al conocer su entorno de datos, identifique qué datos le hacen falta, y una estrategia para dar con estos y consumirlos. También, asegúrese de “limpiar” sus variables para evitar confusiones (empleados repetidos, faltas de ortografía o formatos).Una buena estrategia es crear análisis exploratorios, con datos simulados, para poder justificar la compra u obtención de los datos faltantes. 4. Haga su análisis reproducible: Como muchas veces la intención de un análisis es comunicar una evidencia o hecho mediante datos, es importante que las demás personas involucradas sepan exactamente cuál fue su estrategia para llegar a ese resultado. Para esto manuales de usuario y guías son muy útiles, más aún cuando es un análisis que se deba repetir periódicamente. Herramientas de análisis de datos populares como Microsoft Excel, tiene su propio lenguaje de programación para poder recrear todas las funcionalidades utilizadas. 5. Rete su análisis: Ya teniendo resultados preliminares, someta sus resultados a prueba. Un análisis mal planteado conlleva a malos resultados. 6. Presente su análisis en formatos multiplataforma: Muchos clientes tienen diferentes entornos en sus computadoras, muchos no tienen ni siquiera Microsoft Excel en sus computadoras o quieren ver sus resultados en su celular o en su computadora con Linux o Mac.

2.- ¿Cómo se puede describir los datos, valores o puntuaciones obtenidas de la variable o variables de estudio? (Estadística Descriptiva) Una vez que se han recogido los valores que toman las variables de nuestro estudio (datos), procederemos al análisis descriptivo de los mismos. Para variables categóricas, como el sexo o el estadiaje, se quiere conocer el número de casos en cada una de las categorías, reflejando habitualmente el porcentaje que representan del total, y expresándose en una tabla de frecuencias. Para variables numéricas, en las que puede haber un gran número de valores observados distintos, se ha de optar por un método de análisis distinto, respondiendo a las siguientes preguntas: 1. ¿Alrededor de qué valor se agrupan los datos? 2. Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen? ¿muy concentrados? ¿muy dispersos?

a. Medidas de tendencia central La medida más evidente que podemos calcular para describir un conjunto de observaciones numéricas es su valor medio. La media no es más que la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone. Como ejemplo, consideremos 10 pacientes de edades 21 años, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La media de edad de estos sujetos será de:

Más formalmente, si denotamos por (X1, X2,...,Xn) los n datos que tenemos recogidos de la variable en cuestión, el valor medio vendrá dado por:

Otra medida de tendencia central que se utiliza habitualmente es la mediana. Es la observación equidistante de los extremos. La mediana del ejemplo anterior sería el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia: 15, 21, 32, 59, 60, 60,61, 64, 71, 80. Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana. Si la media y la mediana son iguales, la distribución de la variable es simétrica. Por último, otra medida de tendencia central, no tan usual como las anteriores, es la moda, siendo éste el valor de la variable que presenta una mayor frecuencia. En el ejemplo anterior el valor que más se repite es 60, que es la moda.

b. Medidas de dispersión Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la dispersión de los mismos. Existen distintas formas de cuantificar esa variabilidad. De todas ellas, la varianza (S2) de los datos es la más utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada. En el ejemplo anterior la varianza sería:

La desviación típica (S) es la raíz cuadrada de la varianza. Expresa la dispersión de la distribución y se expresa en las mismas unidades de medida de la variable. La desviación típica es la medida de dispersión más utilizada en estadística.

Aunque esta fórmula de la desviación típica muestral es correcta, en la práctica, la estadística nos interesa para realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de n, el valor n-1. Por tanto, la medida que se utiliza es la cuasidesviación típica, dada por:

En los cálculos del ejercicio previo, la desviación típica muestral, que tiene como denominador n, el valor sería 20.678. A efectos de cálculo lo haremos como n-1 y el resultado sería 21,79. Cuando se quieren señalar valores extremos en una distribución de datos, se suele utilizar la amplitud como medida de dispersión. La amplitud es la diferencia entre el valor mayor y el menor de la distribución. Por ejemplo, utilizando los datos del ejemplo previo tendremos 80-15 =65

Otra medida que se suele utilizar es el coeficiente de variación (CV). Es una medida de dispersión relativa de los datos y se calcula dividiendo la desviación típica muestral por la media y multiplicando el cociente por 100. Su utilidad estriba en que nos permite comparar la dispersión o variabilidad de dos o más grupos. Así, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es de 69,6 kg. y su desviación típica (s) = 10,44 y la TAS de los mismos (150, 170, 135, 180 y 195 mmHg) cuya media es de 166 mmHg y su desviación típica de 21,3. La pregunta sería: ¿qué distribución es más dispersa, el peso o la tensión arterial? Si comparamos las desviaciones típicas observamos que la desviación típica de la tensión arterial es mucho mayor; sin embargo, no podemos comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variación:

A la vista de los resultados, observamos que la variable peso tiene mayor dispersión. Cuando los datos se distribuyen de forma simétrica (y ya hemos dicho que esto ocurre cuando los valores de su media y mediana están próximos), se usan para describir esa variable su media y desviación típica. En el caso de distribuciones asimétricas, la mediana y la amplitud son medidas más adecuadas. En este caso, se suelen utilizar además los cuartiles y percentiles. Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posición. El percentil es el valor de la variable que indica el porcentaje de una distribución que es igual o menor a esa cifra. Así, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de sí al 80% del total de las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de sí el 25%, 50% y el 75% del total de las puntuaciones y así tenemos por tanto el primer cuartil (Q1), el segundo (Q2) y el tercer cuartil (Q3).

3.- ¿Cómo se puede analizar mediante pruebas estadísticas las

hipótesis planteadas? (Estadística Inferencial) La estadística, como parte de las matemáticas empleadas, es la secuencia de razonamientos para estudiar los fenómenos de la naturaleza, y considera que la inferencia estadística es la que permite obtener conclusiones en función de los resultados obtenidos en una muestra en estudio representativa; sin embargo, cabe señalar que hay dos tipos de inferencias: la que se conoce como prueba de hipótesis y la que concierne a la estimación de intervalos.7 Y en cuanto a las hipótesis en las pruebas estadísticas, la hipótesis de nulidad (Ho) plantea la ausencia de diferencias significativas, en tanto que la hipótesis alterna (Hi) afirma que hay diferencias en las variables de estudio. Es así como las pruebas de significancia estadística conducen a conocer la magnitud de las diferencias y la significancia de los resultados, considerando un nivel significativo cuando la p < 0.05, que se interpreta como rechazo de la hipótesis de nulidad y aceptación de la hipótesis alterna8 y de no existir diferencias estadísticas, la p ≥ 0.05. Las pruebas de significancia estadística son métodos estadísticos que permiten contrastar las hipótesis para valorar los efectos del azar, de acuerdo con los resultados de una investigación. En el estudio de casos y controles se emplea la razón de momios o razón de productos cruzados (Odds Ratio de la literatura sajona) cuya fórmula es ad/bc, y en el estudio transversal la razón de momios de prevalencia informa de la fuerza de la asociación, y ambas razones tienen una interpretación similar al riesgo relativo. El valor de p (probabilidad asociada con la hipótesis nula de la prueba) es la probabilidad de que un resultado sea debido al azar; entre menor sea la diferencia encontrada entre dos o más grupos hay una mayor significancia estadística (y se considera significativa p < 0.05 en adelante); el valor de p tiene distinto significado de acuerdo con la prueba de que se trata, por ejemplo: la t de Student y la prueba Z ponen a prueba la hipótesis de que la diferencia entre dos promedios se debe al azar; la p de una correlación indica la probabilidad de que la pendiente de esa recta sea igual a la pendiente de una recta igual a 0, y no indica qué tan importante es esa correlación, mientras que la p de la prueba exacta de Fisher indica cuál es la probabilidad de que la distribución observada se deba al azar.

¿Cuáles son los métodos o las pruebas estadísticas paramétricas y no paramétricas más utilizadas y qué evalúa cada una? 4.-

Las pruebas paramétricas disponibles para la comparación de grupos son numerosas; a continuación las más utilizadas. Si el investigador quiere comparar 2 grupos con variables cuantitativas continuas y con distribución normal, (dicho de otra forma, comparación de promedios entre 2 grupos), se puede elegir una prueba t de Student. Tomando en cuenta lo descrito, esta prueba puede utilizarse en 2 escenarios diferentes: • Muestras relacionadas (un solo grupo antes y después). • Muestras independientes (comparación de 2 grupos).

A continuación un ejemplo: al evaluar el efecto de inmunoglobulina G sintética en un grupo de pacientes con hipogammaglobulinemia se mide la IgG posterior a la administración de la inmunoglobulina. Para hacer la comparación se toman los promedios del nivel sérico de IgG, primero administrando el compuesto en un grupo comparando contra la inmunoglobulina humana (grupo experimental versus grupo control). En el escenario 1, análisis de muestras relacionadas, se utiliza la prueba t student para comparar la muestra basal de IgG (antes de la administración de la inmunoglobulina sintética) con la tomada 21 días después. Para el escenario 2, grupos independientes, se comparan los promedios de la IgG sérica en el grupo que recibe la inmunoglobulina sintética y el grupo que recibe inmunoglobulina humana. Ahora bien, si lo que se desea es comparar más de 3 grupos (comparación de 3 o más promedios) se debe seleccionar una prueba denominada análisis de varianza o ANOVA. De esta última prueba se pueden distinguir al menos 2 variantes: ANOVA de una vía, cuando se comparan los promedios de 3 o más grupos independientes, y ANOVA de 2 vías, que se emplea cuando se pretende comparar los promedios de muestras relacionadas medidas 3 o más veces. Continuando con el ejemplo: los investigadores pueden ampliar el estudio de los niveles séricos de IgG, es decir, medición basal y a los 21 y 45 días después de la administración de la inmunoglobulina.

Pruebas estadísticas no paramétricas más utilizadas y qué evalúa cada una En el caso de pruebas estadísticas no paramétricas: Variables cuantitativas Cuando la distribución de datos cuantitativos no sigue una distribución normal también hay diferentes pruebas estadísticas con las que se comparan las medianas. La prueba de Wilcoxon se utiliza para comparar un grupo antes y después, es decir, muestras relacionadas. Para la comparación de grupos independientes se debe emplear U de Mann-Withney En el caso de 3 o más grupos independientes se debe utilizar la prueba de Kruskal-Wallis (la cual es equivalente a ANOVA de una vía). La prueba Friedman es la que se recomienda cuando se comparan 3 o más muestras relacionadas (equivalente a ANOVA de 2 vías).

Variables cualitativas Existen pruebas específicas para la comparación de grupos cuando la escala de medición de las variables es cualitativa. Retomando el mismo ejemplo, si tomamos solo a los pacientes que alcancen un nivel sérico de IgG > 400 mg/dL, en 2 grupos independientes se puede comparar el porcentaje de pacientes que alcanzan el nivel establecido de IgG utilizando la prueba de chi cuadrada, pero si las muestras son relacionadas deberá emplearse la prueba de McNemar. En caso de comparar 3 o más grupos independientes también se utiliza chi-cuadrada; en caso de muestras relacionadas, Q de Cochran. Un punto a destacar cuando se emplean las pruebas de comparación de proporciones es que se deben cumplir ciertas condiciones: cuando el número de datos sea menor a 30 se aplicará la corrección de Yates, mientras que la prueba exacta de Fisher debe ser utilizada en lugar de χ2 cuando se comparan 2 grupos independientes si en algunas de las casillas de la tabla de contingencia se encuentra algún valor menor de 5.

5. ¿Cuál es el análisis de la información que incluiste en tu Plan de Trabajo de investigación? Menciona el software que aplicarás. Se utilizará la estadística descriptiva (tablas y figuras, medidas de tendencia central y medida de dispersión) e inferencial (prueba de independencia de criterios chi cuadrado) considerando el 95% de confiabilidad y el 5% de error permisible. Los datos serán procesados en el software SPSS versión 26.

REFERENCIAS

• Manual para elaborar el plan del trabajo de investigación y artículo científico para obtener grado académico de bachiller en medicina. [Internet]. [citado 2021 Mayo 26]. Disponible en: https://medicina.usmp.edu.pe/investigacion/medicina/publicaciones/manuales/MANUAL -PLAN-INVESTIGACION-ARTICULO-CIENTIFICO-BACHILLER_OCT19.pdf • Fernández P., Díaz P. Estadística descriptiva de los datos. [Internet ] .Madrid : Universidad de Alicante. 2001,Marzo. [Citado el 25 de mayo del 2021] ; pp. 115-161. Disponible en: https://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.asp#estadistica...


Similar Free PDFs