01. Introducción - ESTADISTICA INFERENCIAL PDF

Title 01. Introducción - ESTADISTICA INFERENCIAL
Author EZEQUIEL ALVARADO
Course Gestión Empresarial
Institution Instituto Tecnológico de La Paz
Pages 7
File Size 255.8 KB
File Type PDF
Total Downloads 49
Total Views 183

Summary

ESTADISTICA INFERENCIAL ...


Description

Apuntes del curso de estadística

I Introducción

Introducción Conceptos de estadística y recolección de datos. La estadística se ha convertido en el lenguaje para las ciencias y teorías del pensamiento. Son muy útiles para resolver problemas profesionales y de investigación académica. Los métodos que incluyen el análisis estadístico te ayudarán a obtener conclusiones adecuadas de tus variables de estudio. Estos apuntes son de estadística descriptiva clásica, elementos de probabilidad y temas introductorios para métodos inferenciales. El curso trata exclusivamente el enfoque paramétrico y los ejemplos están basados en estudios observacionales (de medición) y teóricos con fines de aprendizaje. El curso tiene enfoque pragmático.

CONCEPTOS (EL IDIOMA DE LAS ESTADÍSTICAS). La estadística es ciencia de recolectar, describir e interpretar datos. Involucra el manejo de información, números y gráficos. Se utiliza para economizar tiempo, dinero y energía; también ayuda a tomar decisiones y comprobar hipótesis matemáticas. Comúnmente se divide en: Descriptiva Se usa para describir una muestra o población pequeña.

Trata de la recolección y descripción de datos de una o más muestras o de la población.

Estadística Inferencial Se usa cuando la población a estudiar es muy grande o infinita

Son técnicas para interpretar e inferir una población a partir de muestras, ayuda a tomar desiciones y se basa en la probabilidad.

Ten en cuenta los siguientes términos estadísticos: Población: colección o conjunto de individuos, objetos o eventos cuyas propiedades se analizarán. Es el total de los datos que nos interesa conocer. Cuando se inicia un estudio estadístico el primer paso es definir la población cuidadosamente. Existen dos tipos de poblaciones: Población finita: cuando los miembros o elementos de una población tienen un límite de medidas u observaciones contables. Población infinita: cuando los miembros o elementos de una población son infinitas, no tienen un límite de medidas u observaciones. En ocasiones, algunas poblaciones son tan grandes, que conviene manejarlas como infinitas (dependerá de la experiencia de la persona). Muestra: Es el subconjunto de una población. Consiste en los individuos, objetos o mediciones seleccionados de la población por el recolector de la muestra. [email protected] 2015

Apuntes del curso de estadística

I Introducción

Variable: Es la característica de interés acerca de la cada elemento individual de una población o muestra.

Cualitativa (atributo) Variable Cuantitativa (numérica)

Nominal: {Café, azul, rojo} {BCN, DF, NL...} Ordinal: {Grande, mediana, chica} {Alto, bajo} Discreta: 2 hijos, 10 fósiles, 3 pelotas Continua: 23.4 ºC, 3.4 g, 3.7 g, $32.65

La variable cualitativa nominal describe o nombra a un elemento de una población. Por ejemplo el color del cabello o lugar de procedencia de un individuo. La variable ordinal incorpora una posición ordenada o clasificación de las variables cualitativas. Por ejemplo el nivel de calidad de un producto en alto, medio y bajo. La variable cuantitativa discreta se refiere cuando el valor del dato es un número entero (sin fracciones ni valores intermedios entre números). Por ejemplo el número de huracanes que pasa en una región, el número de especies fósiles, la cantidad de hijos. La variable continua se da cuando el valor del dato es un número que toma cualquier valoren una escala continua. Puede tomar valores entre dos números. Por ejemplo 23.3, 24.8 y 32.2 grados; 3.4, 2.4, 3.89 g. Datos. El conjunto de valores recolectados de la variable para cada uno de los elementos que pertenecen a una muestra. Una vez recolectado todos los datos es común referirse al conjunto de datos como la muestra. Cada dato tiene un valor del dato.

Parámetr

Censo. Cuando todo elemento en la población de interés se puede mencionar, observarse, enumerarse o Estadístico representarse en una lista, entonces se compila un censo. Rara vez se puede tener un censo. Parámetro: Valor numérico que resume todos los datos de una población entera. Por [email protected] 2015

Se presentan datos de temperatura. El cuadro grande representa la población (todos los datos de temperatura) y los recuadros representan los datos de una muestra aleatoria. Observe que la media muestral (estadístico) es de 15.6 (n=10), mientras que la media poblacional es de 15.2 (N= 200). La muestra es una

Apuntes del curso de estadística

I Introducción

ejemplo la media poblacional (µ), la varianza (� 2) y la desviación estándar poblacional (�). Estadístico: Valor numérico que resume los datos muéstrales. Por ejemplo la media maestral ( ´x ), la varianza (s2) y la desviación estándar maestral (s). Experimento: Actividad planificada cuyos resultados producen un conjunto de datos.

ESTUDIOS OBERVACIONALES Y EXPERIMENTALES. El método empírico-analítico es un modelo de investigación científica (empírico=experiencia). Se basa en la lógica empírica junto con la observación de fenómenos o experimentación donde el análisis estadístico apoya contundentemente en la prueba de hipótesis. En los estudios observacionales (que incluyen la medición) el investigador no modifica el entorno es decir, no controla el proceso a observar. Los datos se obtienen al muestrear (medir) la población de interés por medio de un diseño de muestreo propio. Estos estudios son los más utilizados en ciencias sociales y naturales. En un estudio experimental, el investigador controla o modifica el entorno y observa el efecto sobre la variable bajo estudio, es decir, manipula las condiciones. Lo anterior se realiza a través de tratamientos o diseños experimentales (una rama propia de las estadísticas). Ya sea que realices un estudio observacional ó experimental al momento de muestrear ó diseñar el experimento debes tener en cuenta la exactitud y precisión de la toma de datos.

MENSURABILIDAD vs. VARIABILIDAD. En estadística se deben de medir elementos: objetos, eventos, personas o cualquier unidad experimental. La mensurabilidad define con qué precisión se realiza una medición y con qué exactitud se ejecuta el proceso de medición. Por ejemplo sí se mide el peso de 4 minerales “iguales” y las mediciones dan 0.1 g de cada uno, ¿son en realidad idénticos en peso? La respuesta es no. Supón una báscula analítica (de mayor precisión) que pesa hasta 0.001g (una milésima de gramo), ahora las mediciones dan: 0.1928g, 0.1237g, 0.1535g y 0.1015g. Dado que el aparato es más preciso, se observa una variabilidad natural de los minerales. La mensurabilidad de la variabilidad es el objetivo de la estadística. Por otro lado, la exactitud se refiere a la variación de mediciones de un mismo valor. Por ejemplo, si tomamos un mineral (y suponemos que el valor real sea 0.1928g) y lo pesamos 3 veces arrojando: 0.1928g, 0.1929g y 0.1926g. Podemos decir que no es tan exacta la medición. La exactitud puede deberse a muchas razones inmersas en el procedimiento como errores humanos, factores ambientales, Etc. [email protected] 2015

Apuntes del curso de estadística

I Introducción

LA RECOLECCIÓN DE DATOS. Una vez que tengas definido una investigación o anteproyecto (pregunta, problema o hipótesis) con previo marco teórico estudiado, objetivos y metodología dada, se procede a recolectar datos. La recolección de datos como parte de la metodología debe ser un plan detallado de procedimientos que conduzcan a reunir datos con un propósito específico. Algunos pasos recomendados en la recolección de datos son los siguientes: 1) Define el objetivo claramente. Consúltalo con personas experimentadas. 2) Definir la variable y la población de interés. Delimita tu estudio a tu alcance (verifica recursos). 3) Define como recolectar datos y los esquemas de medición: diseño de muestreo, procedimientos, tamaño de muestra, dispositivo de medición, etiquetados y/o almacenamiento de la información. 4) Recolecta una muestra piloto, revísala y analiza el procedimiento. 5) Ordena tus datos recolectados (preferentemente en digital y con copias físicas).

DISEÑO DE MUESTREO. Hay dos tipos de diseños muéstrales: las muestras dirigidas (no probabilísticas) y las probabilísticas. Muestras dirigidas: muestras que se seleccionan sobre la base de juzgarse “típicas o buenas” de cada persona. Este tipo de muestreo no es un procedimiento estadístico aceptable. Muestras probabilísticas: muestras en las que los elementos a seleccionar se extraen sobre la base de la probabilidad. Cada elemento en una población tiene cierta posibilidad de ser seleccionado como parte de la muestra. Es un procedimiento estadístico formal. Los métodos para obtener muestras probabilísticas comúnmente son los siguientes:

[email protected] 2015

Apuntes del curso de estadística

Muestreo aleatorio simple (MAS)

Métodos sencillos Adquisición de datos aleatorios

Muestreo sistemático (MS)

Muestras probabilística s

Muestro aleatorio estratificado (MAE)

Método de muestreo Muestras dirigidas No aceptable estadísticament e

I Introducción

Métodos múltiples

Muestreo aleatorio estratificado proporcional ( MAEP) Muestreo por conglomerados (cluster) (MC)

¿Cómo logro que mi muestra sea representativa de la población? Tomando muestras aleatorias, donde la muestra debe tener características proporcionales a la población. TÉCNICAS ALEATORIAS. Una vez que tengas identificados los elementos de la población, ordenados en un espacio, tiempo o una lista; tendrás que tomar la muestra de manera aleatoria con alguno de los métodos anteriores. Las técnicas para tomar elementos al azar son: 1) Uso de urnas. 2) Tabla de números aleatorios. 3) Genera números en tu calculadora con la tecla shift +N+RAN. 4) Por medio de una aplicación (App) desde tu móvil. 5) Con un software (como Excel, Matlab, Minitab, R) ó páginas web.

Aplicación gratuita “Random Lite”

METODOS PROBABILÍSTICOS SENCILLOS. Es un diseño muestral en el que los elementos de una población o marco se tratan igual y no hay subdivisiones. Muestreo aleatorio simple (MAS): Es la muestra seleccionada de tal forma que todo elemento en la población (o marco muestral) tiene la misma probabilidad de ser elegido. Las muestras se obtienen al muestrear con reemplazo en poblaciones finitas y sin reemplazo en poblaciones infinitas. Toma muestras con reemplazo en poblaciones finitas y sin reemplazo en poblaciones infinitas. [email protected] 2015

Apuntes del curso de estadística

I Introducción

Muestreo aleatorio sistemático (MS): Muestra en la que se selecciona a cada k-ésimo elemento de la población o marco muestral a partir de un primer elemento. Donde el elemento k=

N n

, N= población y n= al tamaño de la muestra. Por ejemplo, si

deseamos seleccionar 5 muestras (n=5) en un población N=100, k será 20. Posteriormente se elige con un MAS entre el 0 y 20 para determinar el primer elemento y a partir de éste, se le suma k sistemáticamente. Sí el MAS arroja el número 4, entonces se muestreará los siguientes 5 elementos {4…24….44….64….84}. Ejercicio: a) realice un MAS en el salón y obtenga n=3 y b) realice un MS con muestras de una playa.

MÉTODOS MÚLTIPLES. Diseño muestral en el que los elementos del marco o población se subdividen y la muestra se elige en más de una etapa aleatoriamente. Cuando la población es muy grande, con frecuencia se subdivide sobre la base de ciertos criterios. Estos criterios se deben definir y justificar. Las subpoblaciones resultantes se llaman estratos. Cada estrato se puede manejar por un MAS o MS. Muestreo aleatorio estratificado (MAE): Muestra que se obtiene al estratificar la población o marco muestral y posteriormente se seleccionan los elementos de cada estrato con un MAS o MS. Por lo general, las subdivisiones suelen darse de manear natural. Por ejemplo sí caracterizaras las rocas de 4 volcanes diferentes y tienes un máximo de 80 muestras disponibles, la estratificación natural sería tomar 20 muestras de cada volcán. Pero, en el caso de que uno de los 4 volcanes sea 100 veces más grande que los otros, conviene hacer estratos proporcionales. Muestreo aleatorio estratificado proporcional (MAEP): Muestra que se obtiene al estratificar la población o marco muestral y posteriormente se obtiene un número de elementos proporcional al tamaño del estrato mediante un MAS o MS. Una idea para expresar la toma del elemento es determinar una cuota, por ejemplo “seleccionar 1 elemento a cada 150” de esta manera si tienes un estrato de n=300 y otro n=4500, tomarás proporcionalmente 2 elementos en el primer estrato y 30 en el segundo. Muestreo por conglomerados (ó clúster) (MC): Muestra que se obtiene al estratificar la población o marco muestral y posteriormente se seleccionan algunos estratos de manera aleatoria tomando todos los elementos dentro del estrato seleccionado. Se puede usar un MAS o MS para elegir los estratos. Ejercicio: Diseñe un MAE o MAEP para tomar 30 alumnos en su universidad o instituto.

TAMAÑO DE MUESTRA. ¿Cuántas muestras debo tomar para mi estudio? No hay un número específico porque depende de muchos factores: costos, tiempos, objetivos, riesgos, Etc. Sin embargo una [email protected] 2015

Apuntes del curso de estadística

I Introducción

respuesta puede ser “toma todas las posibles, entre más muestras tomes es mejor” siempre que sean al azar. Siempre que tomes muestras tendrás manera de justificar por qué decidiste ese número. Por ejemplo, sí cada muestra te cuesta 5 mil pesos, posiblemente quieras usar las menos posibles. Si tu muestra tarda 3 meses en arrojar un resultado, quizás deberías tomar pocas muestras. Por el momento, es recomendable tomar al menos 30 muestras (para propiciar una distribución normal de tus datos). Cuanto tengas menos de 20 muestras debes usar técnicas de estadística NO paramétrica (son temas fuera del presente curso). En estadística paramétrica se utilizan fórmulas basadas en distribuciones de probabilidad donde se asume un nivel de confianza, un error máximo y un tamaño de muestra vinculados todos a la vez, por ejemplo: n=

Z (

( α2 ) σ )

2

α 2

donde Z ( )

E

es el nivel de confianza que quieres trabajar y E es el

error máximo deseado. El detalle de la ecuación es tener la σ2 (varianza poblacional) de los datos, generalmente no la tenemos por lo cual es posible estimarla. El tamaño de muestras a través de fórmulas se analizará en la última unidad.

[email protected] 2015...


Similar Free PDFs