Tema 2. Introducción a la Inferencia Estadística PDF

Title Tema 2. Introducción a la Inferencia Estadística
Author Mateusz Kowieski
Course Estadística
Institution Universidad Rey Juan Carlos
Pages 8
File Size 301.8 KB
File Type PDF
Total Downloads 7
Total Views 119

Summary

Download Tema 2. Introducción a la Inferencia Estadística PDF


Description

Estadística Empresarial II

Tema 2. Introducción a la Inferencia Estadística. Descriptiva: rama de las matemáticas que recolecta, presenta y caracteriza una serie de datos de una población con la finalidad de describir sus características. Estadística

Inferencial: rama de la estadística que tiene por objeto realizar estimaciones sobre las propiedades de una población a partir de los datos obtenidos de una muestra (Clásica o Bayesiana) Nota: Para la estimación, hay que tener en cuenta si las medidas estadísticas se refieren a la población o a la muestra, ya que trabajaremos con ambas. En el caso de referirnos a la población usaremos letras griegas (𝜇, 𝜎 2 , etc.), en el caso de la muestra usaremos letras latinas (𝑥 , 𝑆 2 , etc.).

Fundamentalmente la inferencia consiste en la resolución de dos grandes categorías de problemas: la estimación y el contraste de hipótesis.

𝐼𝑛𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 →

𝑅𝑒𝑠𝑜𝑙𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑜𝑠 𝑏𝑙𝑜𝑞𝑢𝑒𝑠 𝑑𝑒 𝑝𝑟𝑜𝑏𝑙𝑒𝑚𝑎𝑠

{

𝐿𝑎 𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛

𝐸𝑙 𝑐𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒

𝑃𝑢𝑛𝑡𝑢𝑎𝑙 𝑃𝑜𝑟 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑃𝑎𝑟𝑎𝑚é𝑡𝑟𝑖𝑐𝑎 { 𝑁𝑜 𝑝𝑎𝑟𝑎𝑚é𝑡𝑟𝑖𝑐𝑎

{

La estimación consiste en hacer inferencias acerca de unos parámetros desconocidos de la población. Así pues, si se busca un solo valor para estimar el parámetro desconocido se estará realizando estimación puntual. Mientras que si lo que se busca es un conjunto de valores o intervalo, se estará realizando una estimación por intervalo. Una vez realizada la estimación, se formula una hipótesis acerca de la población con el objetivo de disponer de elementos que permitan aceptar o rechazar dicha hipótesis. El contraste será paramétrico si la población a la que se hace referencia en la hipótesis pertenece a una familia paramétrica de distribución conocida. El contraste será no paramétrico si no se conoce a la familia a la que pertenece. 1

Estadística Empresarial II

MUESTREO Y TIPOS DE MUESTREO Se denomina muestreo a la técnica que se utiliza para la obtención de una muestra. Para identificar el modelo de probabilidad que describe a una variable aleatoria, será necesario contestar a las siguientes preguntas:  

¿Cómo se elige una muestra? ¿Cómo se analiza una muestra para asimilar el comportamiento de una población con el de un modelo de probabilidad?

Tipos de muestro:  

No probabilístico u opinático: la muestra es seleccionada subjetivamente por la persona que lo realiza. Probabilístico o aleatorio: la muestra es seleccionada utilizando métodos aleatorios o de azar. 1. M.A.S (muestreo aleatorio simple): En general, una muestra obtenida por M.A.S es aquella que cumple que: todos los individuos de la población tienen la misma probabilidad de pertenecer a la muestra. Una manera de asegurar el cumplimiento de las propiedades de un M.A.S es el sorteo entre los miembros de la población. Podemos distinguir dos tipos de M.A.S: Con reemplazamiento: El mismo elemento se puede repetir n veces y simplifica los cálculos, ya que supone que los elementos de la muestra sean INDEPENDIENTES. Sin reemplazamiento: Aplicable a poblaciones finitas en las que muestreamos más del 5%. En esos casos se mejora la precisión de la estimación, aunque no se da la independencia. La selección de una muestra se suele hacer mediante la generación de números aleatorios. 2. Muestreo estratificado: se utiliza para poblaciones heterogéneas. Se divide la población en estratos homogéneos y se emplea un M.A.S dentro de cada estrato. Si todos los estratos tienen el mismo número de elementos, de cada estrato se cogerá el mismo número de elementos mediante M.A.S siendo dicho número el cociente entre el tamaño de la muestra de la población (n) y el número de estratos (L).

2

Estadística Empresarial II

ESTIMACIÓN Un estimador es un estadístico cuyo objetivo es estimar un parámetro poblacional desconocido. Un estadístico es cualquier función que dependa únicamente de los elementos muestrales que no contengan elementos desconocidos. Dado que los elementos que integran la muestra son variables aleatorias, los estimadores (estadísticos) también lo serán. Su distribución de probabilidad vendrá determinada por la de la población de la que se ha extraído la muestra. Esa distribución de probabilidad se denomina distribución muestral o distribución en el muestreo del estimador. Ejemplo: Estadístico media muestral, estadístico varianza muestral, etc. Nota: A partir de este momento se considerará m.a.s.

3

Estadística Empresarial II

Estadístico media muestral

Estadístico varianza muestral

Una población Estadístico quasivarianza

M.A.S o estimadores

Proporción muestral

2 poblaciones normales con distinto número de elementos en la muestra

General (cualquier población) n>30, se aproxima a una N por el TCL N (𝜇, 𝜎 ), conocidas ambas N (𝜇, 𝜎 ), 𝜎 desconocida General 2 N (𝜇, 𝜎 ), 𝜇 desconocida ~ 𝑋𝑛−1 General 2 N (𝜇, 𝜎 ), 𝜎 desconocida ~ 𝑋𝑛−1 (1,p) para n < 30 N > 30 ~ N (𝜇, 𝜎), Diferencias de medias muestrales

Cociente de varianzas muestrales

Dos poblaciones 2 poblaciones normales con mismo número de elementos en la muestra 2 poblaciones no normales

Varianzas conocidas~𝑁 Var. Desconocidas pero iguales~𝑡 Var. Desconocidas distintas ~𝑡 ~𝐹

Se estudia diferencia de medias ~𝑁(0,1)

~𝑡 4

Estadística Empresarial II

DISTRIBUCIÓN EN EL MUESTREO

UNA POBLACIÓN. Principales parámetros del estadístico media muestral 𝑥 =

∑ 𝑥𝑖

1. Sea cual sea la distribución de la población se verifica que: 𝐸(𝑋) = 𝜇

2. Si n es grande (n≥30) podemos aplicar el TCL.

𝑉𝑎𝑟 (𝑋) =

𝑋 ≈ 𝑁 (𝜇,

𝜎

√𝑛

𝑛

𝜎2 𝑛

)

3. 𝜉 sigue una 𝑁(𝜇, 𝜎), entonces por propiedad aditiva, aun con n pequeña: 𝑋 ≈ 𝑁 (𝜇,

𝜎

√𝑛

)

4. 𝜉 sigue una 𝑁(𝜇, 𝜎) con 𝜎 2 desconocida. En ese caso no resulta operativa la expresión anterior, empleando la cuasidesviación típica muestral en lugar de 𝜎 : 𝑋 − 𝜇 √𝑛 − 1 ≈ 𝑡𝑛−1 𝑜 𝑆

𝑋 − 𝜇 √𝑛 ≈ 𝑡𝑛−1 𝑆1

Principales parámetros del estadístico varianza muestral 𝑆 2 =

∑(𝑥𝑖−𝑥)  2 𝑛

=

∑ 𝑥2𝑖 𝑛

− 𝑥 2

1. Teniendo en cuenta la definición del estadístico varianza muestral y aplicando las propiedades de la esperanza, se deduce que:

También se puede demostrar: 𝑉𝑎𝑟 (𝑆 2 ) =

𝐸(𝑆 2 ) = (

𝜇4 − 𝜇22 2(𝜇4 − 2𝜇22 ) 𝜇4 − 3𝜇22 − + 𝑛3 𝑛 𝑛2

2. 𝜉 sigue una 𝑁(𝜇, 𝜎) con 𝜎 2 conocida

𝑉𝑎𝑟 (𝑆 2 ) =

Por lo que:

𝑛−1 2 )𝜎 𝑛

2(𝑛 − 1)𝜎 4 𝑛2

5

Estadística Empresarial II 𝑛𝑆 2 𝜎2

2

≈ 𝜒𝑛−1

o análogamente 𝑆 2 ≈

𝜎2 𝑛

2

𝜒𝑛−1

Principales parámetros del estadístico cuasivarianza muestral 𝑆12 =

𝑛𝑆 2

𝑛−1

=

∑(𝑥𝑖−𝑥 )2 𝑛−1

Nota: Cuidado con la notación ya que la cuasivarianza se representa como 𝑆′2 𝑜 𝑆12

1. Teniendo en cuenta la definición del estadístico cuasivarianza muestral y aplicando las propiedades de la esperanza, se deduce que: 𝐸(𝑆12 ) = 𝐸(𝑆 ′ ) = 𝜎 2 2

2. En poblaciones normales con varianza conocida. (𝑛 − 1)𝑆12 2 ≈ 𝜒𝑛−1 𝜎2

𝑉𝑎𝑟(𝑆12 ) =

Principales parámetros del Estadístico Proporción Muestral.

2𝜎 4 𝑛−1

Se tiene una población de Bernoulli, 𝐵(1, 𝑝), se considera la V.A. X = “nº de éxitos en la muestra”, que sique una distribución 𝐵(𝑛, 𝑝). Se define 𝑝 = “proporción de éxitos en n extracciones”, entonces 𝑥 ≡ 𝑝 =

𝑋 ∑ 𝑥𝑖 𝐵(𝑛, 𝑝) = = 𝑛 𝑛 𝑛

𝐸(𝑝 ) = 𝑝;

𝑉(𝑝 ) =

Además. Si n es grande por el TCL: 𝑝 ≈ 𝑁 (𝑝, √

𝑝𝑞 𝑛

𝑝𝑞 ) 𝑛

6

Estadística Empresarial II

DOS POBLACIONES NORMALES (MUESTRAS INDEPENDIENTES). Se toman dos muestras independientes de dos variables que se quieren comparar: Sea (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) una m.a.s. con 𝑥𝑖 ≈ 𝑁(𝜇𝑥 , 𝜎𝑥 ) para todo i. Sea (𝑦1 , 𝑦2 , … , 𝑦𝑚 ) una m.a.s. con 𝑦𝑗 ≈ 𝑁(𝜇𝑦 , 𝜎𝑦 ) para todo j. Variante diferencia de medias muestrales. 1. Varianzas poblacionales conocidas: 𝑋 − 𝑌 ≈ 𝑁 (𝜇𝑥 − 𝜇𝑦 , √

𝜎𝑦2 𝜎𝑥2 + ) 𝑚 𝑛

Un caso particular sería la diferencia de proporciones: 𝑝1 − 𝑝2 ≈ 𝑁 (𝑝1 − 𝑝2 , √ 2. Varianzas poblacionales desconocidas pero iguales:

𝑝1 𝑞1 𝑝2 𝑞2 + ) 𝑛 𝑚

(𝑥 − 𝑦) − (𝜇𝑥 − 𝜇𝑦 )

Con 𝑠 ∗ = √

2 (𝑛−1)𝑠1𝑥2 +(𝑚−1)𝑠1𝑦

𝑛+𝑚−2

1 1 𝑠 ∗√ + 𝑚 𝑛

o 𝑠∗ = √

≈ 𝑡𝑛+𝑚−2

𝑛𝑠𝑥 2 +𝑚𝑠𝑦2 𝑛+𝑚−2

3. Varianzas poblacionales desconocidas y desiguales: (𝑥 − 𝑦) − (𝜇𝑥 − 𝜇𝑦 )

Con 𝑔 =

2

2

2

𝑠 𝑠 [(𝑚−1) 1𝑥 −(𝑛−1) 1𝑦 ] 𝑛 𝑚

4

𝑠1𝑦 𝑠4 (𝑚−1) 1𝑥2 −(𝑛−1) 2 𝑛

2 𝑠2 √𝑠1𝑥 + 1𝑦 𝑛 𝑚

≈ 𝑡𝑛+𝑚−2−𝑔

𝑚

Variante Cociente de varianzas muestrales. 2 𝑠1𝑥

2 𝑠1𝑦

⁄ 2 𝜎𝑥

⁄ 2 𝜎𝑦

~𝐹(𝑛−1),(𝑚−1) o

𝑛𝑠𝑥2 𝑚𝑠𝑦2

⁄ (𝑛−1)𝜎𝑥2

⁄ (𝑚−1)𝜎𝑦2

~𝐹(𝑛−1),(𝑚−1) 7

Estadística Empresarial II

DOS POBLACIONES NORMALES (MUESTRAS RELACIONADAS, DATOS PAREADOS). Se tienen dos muestras relacionadas para comparar dos variables, esto es, las dos muestras que se toman no son independientes (los datos están pareados). Sea (𝑥1 , 𝑥2 , … , 𝑥𝑛 ) una m.a.s. con 𝑥𝑖 ≈ 𝑁(𝜇𝑥 , 𝜎𝑥 ) para todo i. Sea (𝑦1 , 𝑦2 , … , 𝑦𝑛 ) una m.a.s. con 𝑦𝑗 ≈ 𝑁(𝜇𝑦 , 𝜎𝑦 ) para todo j. Las muestras están relacionadas. Notar que en este caso n=m. Variante Diferencia de medias muestrales.

Conformamos los n pares de diferencias: 𝑑𝑖 = 𝑥𝑖 − 𝑦𝑖 Sean 𝑑 = (𝑥 − 𝑦) la media muestral de las diferencias y 𝑠1𝑑 su cuasidesviación típica muestral, se puede usar el siguiente resultado: 𝑑 −(𝜇𝑥 −𝜇𝑦 ) 𝑠1𝑑 ⁄ √𝑛

~𝑡𝑛−1 o

𝑑 −(𝜇𝑥−𝜇𝑦 ) 𝑠𝑑 ⁄ √𝑛−1

~𝑡𝑛−1

DOS POBLACIONES NO NORMALES (MUESTRAS INDEPENDIENTES GRANDES). Variante Diferencia de medias muestrales Caso general: se toman dos muestras independientes con n y m grandes. La diferencia de medias muestrales se aproximará a un normal de media µx-µy y de varianza la suma de las varianzas de las respectivas medias, que al ser desconocidas habrá que estimar: (𝑥 − 𝑦) − (𝜇𝑥 − 𝜇𝑦 ) 2 𝑠2 √𝑠1𝑥 + 1𝑦 𝑛 𝑚

~𝑁(0,1)

8...


Similar Free PDFs