Tema 6 investigacion de mercados PDF

Title	Tema 6 investigacion de mercados
Course	Metodología de la Investigación
Institution	Universidad Rey Juan Carlos
Pages	11
File Size	705.3 KB
File Type	PDF
Total Downloads	5
Total Views	144

Preview

CLICK TO PREVIEW PDF

Summary

tema 6 mercados...

Description

TEMA 6: EL MUESTREO 1.

ANTES DE EMPEZAR…

Dos cuestiones previas: • •

2. • • •

Cálculo del Tamaño Muestral → Ficha técnica de una encuesta. Selección de un tipo de muestreo → ¿Cómo seleccionar a las personas que estarán la muestra?

CONCEPTOS RELACIONADOS Población Población. La muestra muestra. Marco muestral muestral.

2.1.

• • •

Nivel de confianza confianza. Dispersión Dispersión. Error de muestr muestreo eo eo.

POBLACIÓN

La población es el colectivo objeto de estudio; se llama también universo. Puede ser empresas, consumidores, hogares, jóvenes etc.

2.2.

MUESTRA

La muestra es un conjunto pequeño que extraigo de una población para hacer un estudio. Esa muestra debe tener las mismas características que la población de la que hemos elegido la muestra, porque a partir de ellos tengo que extraer las conclusiones (inferencia). Es el conjunto de elementos seleccionados mediante un procedimiento de muestreo. Si a partir de la muestra queremos inferir las características correspondientes de la población es imperativo diseñar una muestra que constituya una representación en pequeña escala de la población a la que pertenece. Para ello, se utiliza la Estadística In Inferencial ferencial ferencial.

2.3.

MARCO MUESTRAL

Hace referencia al listado que comprende todas mis unidades de población. Cualquier diseño muestral comienza con búsqueda de información que ayude a la identificación de la población de estudio. Con el término “marco” se hace referencia al “listado” que comprende las unidades de población. Puede ser un censo, un registro de individuos o cualquier otro procedimiento de identificación de los miembros de la población. (El INE es una fuente secundaria donde podemos mirar información. También las empresas compran bases de datos que recogen esta información).

¿Qué hay que tener en cuenta a la hora de diseñar una muestra? 12345-

Tiempo y presupuesto. Diversidad de análisis a realizar. Error muestreo. Dispersión de la población. Nivel de confianza.

2.4.

NIVEL DE CONFIANZA

La curva normal Es una curva que se suele utilizar en cualquier representación gráfica de datos, y tiene características muy significativas: una de ellas es que la mayoría de los datos se concentran en torno a una media. La representación y la Ley teórica de aplicación en fenómenos biológicos y sociales.

La distribución de Gauss da respuesta a una inmensa cantidad de datos cuyas medidas se concentran en torno a un valor central y presentan un valor menor conforme se alejan del valor medio. Se da un mayor cúmulo de individuos en torno a la media. Fórmulas de la curva normal:

Características: • • • • •

Está caracterizada por dos parámetros: la media, y la desviación típica, σ. Altura máxima de la curva es igual a la media. El área total de la curva es 1. Simétrica con respecto a la media ( ) donde coinciden la mediana (Mn) y la moda (Mo). Tiene forma de campana, es asintótica al eje de las abscisas (para x = ±∞).

Otras características (puntos de inflexión): •

•

La función de densidad tiene dos puntos de inflexión que están localizados a una distancia de la media de una desviación típica (más y menos). Los puntos de inflexión tienen como abscisas los valores ± σ. Distan de la media, una desviación típica.

Aumentando la desviación estándar (si no modificamos la media, el centro de la gráfica no cambia) la forma de la curva cambia. La curva se hace más ancha y menos alta, es decir, la dispersión aumenta. Cuanto mayor es la desviación estándar mayor es la dispersión de la variable. Si la desviación estándar es pequeña la curva es más alta y estrecha. La dispersión de la variable es menor.

Histograma de una distribución normal hipotética: Puesto que la distribución de estos datos es normal, usted puede determinar exactamente qué porcentaje de los valores está dentro de cualquier rango específico. Si tomamos intervalos centrados en , y cuyos extremos están: •

A distancia σ, tenemos 68,3% → Aproximadamente el 68% de las observaciones está dentro de una 1 desviación estándar de la media (-1 a +1).

•

A distancia 2σ, tenemos 95,5% → Alrededor del 95% de las observaciones está dentro de 2 desviaciones estándar de la media. El 95% de los valores se ubicará dentro de 1.96 desviaciones estándar con respecto a la media (entre −1.96 y +1.96). Por lo tanto, menos del 5% (0.05) de las observaciones estará fuera de este rango. Este rango es la base del nivel de significancia de 0.05 que se utiliza para muchas pruebas de hipótesis. A distancia 2,6 σ, tenemos 99,7% → Alrededor del 99.7% de las observaciones estarían dentro de 3 desviaciones estándar con respecto a la media (-3 a +3).

•

Ejemplo:

Inferencia estadística Ya no me interesa analizar solo mis pacientes, sino que necesito analizar toda la población. Para ello se utiliza la inferencia estadística. La única manera que tengo de saber el peso medio de la población es sabiendo el peso de todos. Cada vez que cojo una muestra, la media puede variar. Es decir: • • •

Salen parecidos, pero nunca misma media; misma desviación. Pero SÍ todos los datos concentrados en torno a una media. La distribución sucesiva de las medias sigue una curva de Gauss con media única.

Ejemplo: realizo un experimento en días sucesivos:

Error estándar de la media: Mide la dispersión de cada una de las medias que yo he sacado de la población. Siempre y cuando elijamos muestras suficientemente grandes, podremos hallar una ecuación de la distribución de medias y obtener una curva concreta. Podremos saber cuándo cambia de cóncava a convexa, es decir, los puntos de inflexión y su desviación típica. Sin embargo, la desviación típica es para una colección de valores individuales; mientras que el error estándar de la media es para referirse a una muestra representativa (siempre menor que desviación típica). • •

Desviación típica para colección de valores individuales → mide la dispersión real de los valores de una muestra o índice descriptivo de la concentración de los datos de la muestra. Error estándar de la media para referirse a una muestra representativa → mide la dispersión imaginaria de las medias que se obtendrían de una hipotética repetición del experimento. Fórmula:

Ejemplo:

Intervalo de confianza Repetir infinitas veces un experimento es rastrear infinitamente la población= población entera. No tenemos la seguridad de obtener una media fija cada vez, pero sí tenemos un margen de confianza confianza. Nuestros datos no escaparán de un escaso y conocido porcentaje de las ocasiones que repitamos el ensayo. Es lo que se denomina el in interv terv tervalo alo de confianza confianza. Ejemplo: “En la muestra se ha obtenido 80KG de peso de valor medio de la población. Este valor no escaparía de 82 y 78 K de peso nada más que 5 de cada 100 ocasiones en que nuestro experimento fuese repetido”.

Nivel de confianza El nivel de confianza es la probabilidad con la que los resultados de la muestra se pueden ex extrapolar trapolar al resto de la población con el margen de error considerado. El nivel más utilizado son ± 2 σ, es decir, el 95,5%.

2.5.

LA DISPERSIÓN O VARIANZA POBLACIONAL

La dispersión, varianza o heterogeneidad poblacional se define como la variación en las respuestas del colectivo analizado. Cuanto más heterogéneo, más grande ha de ser la muestra.

¿Cómo medir a priori la dispersión? a) Estimar dispersión a través de un pretest. Sólo recomendado cuando se analiza un colectivo homogéneo. b) Manejar dispersión resultante de un estudio anterior. c) Realizar cálculos de dispersión máxima. Se recurre al producto de las probabilidades: • p= aparición de un suceso. • Q= no ocurrencia de un suceso (1-p) ➔ Ambas tienen el valor de 0,50. Ejemplo:

2.6.

ERROR DE MUESTREO

Cuando se diseña una muestra nuestro objetivo es conseguir un elevado nivel de adecuación en la selección de la muestra respecto a la población a la que pertenece, pero, por muy perfecta que sea la muestra, siempre existe un error de muestreo. Como únicamente analizamos una parte de la población, siempre hay divergencia entre los valores (estimaciones) obtenidos en la muestra (una de las tantas posibles) y los valores correspondientes en la población (parámetros). Esa disparidad se denomina error muestral muestral, que es el grado de inadecuación existente entre las estimaciones muestrales y los parámetros poblacionales. Es el error cometido y lo que es más importante, admitido, por el investigador al extrapolar los datos de la muestra a la población. Interviene en la decisión sobre el tamaño de la muestra siempre que el diseño muestral sea probabilístico. El investigador lo fija a priori sopesando la precisión que desea para sus estimaciones, con los costes que supondría la reducción del error muestral. Los errores entre el ± 2,5 y el 2 son los más frecuentes. En función de que subamos o bajemos el error muestral, implicará más o menos muestra.

Nivel de confianza y error de muestreo “Nivel de confianza indica la probabilidad de que los errores de muestreo no rebasen determinados límites. Cuando se dice, por ejemplo, que para un nivel de confianza del 95,5 por 100 el error de muestreo es de ±2 por 100, lo que se está expresando es que hay una probabilidad del 95,5 por 100 de que el valor real que se trata de estimar se encuentre dentro de los límites definidos por la estimación y el error de muestreo. Indica también que existe la probabilidad del 1-0,955, es decir, del 4,5 por 100, de que la estimación rebase el error señalado”. “Esto significa que de 100 muestras que se diseñaran adecuadamente, la probabilidad de que la estimación no tenga un error absoluto superior a 2xerror de muestreo es del 95,44 por 100”.

3. CÁLCULO DEL TAMAÑO MUESTRAL (FIJO ENTRA UNA PREGUNTA EN EL EXAMEN) Hay dos supuestos: • •

Poblaciones finita finitass : aquellas que tienen menos de 100.000 sujetos. Poblaciones infinit infinitas as as: tienen más de 100.000 sujetos.

Magnitudes a tener en cuenta: • • • • •

N=universo n= tamaño muestral s (z) =Nivel de confianza. Sigma E=error muestral P y q= varianza poblacional

4. TIPOS DE MUESTREO Probabilísticos Aquellos en los que cualquier persona tiene la misma probabilidad de ser seleccionada. Así se evitan sesgos. Se fundamenta en la aleatorización como criterio de selección muestral. • • • •

Cada unidad de la población tiene una probabilidad igual (y conocida a priori) de participar en la muestra. La elección de cada unidad muestral es independiente de las demás. El cálculo de la adecuación de la estimación muestral (error muestral) a los parámetros poblacionales pueda hacerlo dentro de los márgenes de probabilidad específicos. Sirve para comprobar hipótesis.

Aleatorio simple Se realiza a colectivos pequeños y homogéneos. 1- Enumeramos el censo universo. → con reemplazamiento o sin reemplazamiento. 2- Mediante sorteo (tabla de número aleatorios) se seleccionan unidades muestrales. • Elegir un punto de partida: una columna o una fila cualquiera. Moverse en cualquier dirección de la tabla. • El número de dígitos ha de corresponder con el número de dígitos de la población contenida en el marco muestral. • 10.000 unidades (5 dígitos): desde el primero (00001) hasta el último (10.000).

Sistemático Se realiza en colectivos pequeños y homogéneos. 1- Enumeramos el censo universo. 2- Se calcula el coeficiente de elevación: cociente entre la población y el tamaño de la muestra. • 1000 estudiantes LADE. Muestra 100 • 1000/100=10. 3- Se elige por sorteo un número inferior al coeficiente de elevación.

•

Número 5; 5+10=15; 15+10=25; 25+10=35.

¿Y CUANDO SON POBLACIONES HETEROGÉNEAS? MUESTREO ESTRATIFICADO Cuando hay un grupo grande que estudia ADE, otro mediano que estudia Marketing y otro mucho más pequeños que estudian ADE+Marketing. → muestreo estratificado.

Estratificado: ➔ 123-

Simple Se numeran tres censos. Se divide el tamaño de mi muestra entre el número de segmentos (estratos): 150/3. Se seleccionan por sorteo 50 estudiantes LADE, 50 LADE + Informática y 50 Económicas.

En el ejemplo: Estudiantes LADE: 1.000 Estudiantes LADE+Informática: 1.500 Estudiantes Económicas: 100 Muestra de 150. Sin embargo, esto tiene un problema, porque no tiene en cuenta el peso de cada uno de los segmentos. Ej.: hay más estudiantes de una titulación que de otra, por ello hago el estratificado proporcional: ➔ Proporcional 1- Se numeran tres censos de forma diferenciada. 2- Se hace reparto proporcional teniendo en cuanta su peso. Ejemplo: LADE: 1000/2.600*150=58 LADE + Informática= 1.500/2.600*150=86 Económicas=00/2.600*150=6 *2.600 es la suma de los tres estratos. Dentro de mi muestra tiene que haber 58 estudiantes de LADE, 86 del doble grado y 6 de Económicas, porque es la proporción exacta de cada uno de los estratos. 3- Se seleccionan por sorteo 58 estudiantes LADE, 86 LADE + Informática y 6 Económicas. ➔ Óptimo Tiene en cuenta no solo el peso de cada estrato sino la dispersión existente en cada uno de ellos. Debemos saber esta dispersión de antemano y coste elevado. • •

Cuando hay mucha dispersión. El colectivo se estudia de forma longitudinal.

No solo tengo en cuenta la proporción de cada estrato, sino también cómo son dentro de cada uno de esos estratos (ej.: hombre o mujer).

¿Cómo es la operativa? 1- Se numeran tres censos de forma diferenciada. 2- Se obtiene la dispersión para cada estrato a partir de un pretest o de los datos de un estudio anterior.

Conglomerados Se aplica con colectivos más numerosos. Se seleccionan grupos de unidades muestrales. Lo que hago es reducir el marco muestral, para que sea más manejable. ¿Cómo es la operativa? 1- Hábitos compra de familias ¿censo muy difícil? 2- Se elabora un censo de calles de Madrid capital. 3- Se seleccionan aleatoriamente (por sorteo) calles entrevistando a las familias que hay en ellas.

Polietápico Se aplica con poblaciones todavía más numerosas y dispersas. Se selecciona primero un conglomerado y luego otro… Podríamos tener en cuenta antes el peso de cada uno de los conglomerados. ¿Cómo es la operativa? 12345678-

Hábitos compra de familias de toda la población española. Se censan distintas zonas geográficas. Se selecciona aleatoriamente una zona geográfica. Dentro de esa zona se censan distintas localidades. Se selecciona una localidad. Dentro se censan las distintas calles. Se selecciona una calle, como en el muestreo por conglomerados, y se entrevista a las familias de la calle. Se repita tantas veces como sea necesario.

Ejemplo: me fijo en la población española, elijo Madrid, me centro en Torrelodones, por números aleatorios elijo una calle cualquiera. A partir de ahí selecciono un portal y de ahí selecciono una familia. Se repite tantas veces como sea necesario.

Rutas aleatorias Encuestas en grandes ciudades y en los hogares de los entrevistados. ¿Cómo es la operativa? 1- Preparar para cada entrevistado una ruta. 2- La ruta se inicia en una dirección concreta y a partir de este punto el entrevistador tendrá que seguir las instrucciones marcadas seleccionando portales, pisos, puertas y personas. 3- Cada entrevistado cuenta con tabla de número aleatorios que permite ir tomando decisiones de forma probabilística (portal, piso, puerta).

No probabilísticos La extracción de la muestra no se fundamenta en la aleatorización como criterio de selección muestral. Da lugar a cualquier criterio del equipo investigador. • • • • •

Desigual probabilidad de las unidades de formar parte de la muestra. Dificultad de calcular el error muestral. Introducción de sesgos en el proceso de elección muestral. No precisa marco muestral. Su materialización es sencilla y económica.

Por juicios Escoger unidades que a juicio del investigador son más relevantes.

Por cuotas Es un poco parecido al estratificado, pero de alguna forma intentas paliar no haber hecho un muestreo probabilístico. Es decir, pretende paliar los defectos de un muestreo no probabilístico teniendo en cuenta subgrupos. ¿Cómo es la operativa? 1- Se calcula la proporción de encuestas que se necesitaría en cada estrato teniendo en cuenta el peso del mismo. Tamaño muestral=400 18 a 23 años 25/100*400=100 24 a 30 años 35/100*400=140 31 a 45 años 40/100*400=160 2- Se seleccionan 100 mujeres de 18 a 23 años; 140 de 24 a 30 años y 160 de 31 a 45 años.

Bola de nieve Colectivos pequeños y especializados. Son difíciles de conseguir. Ej.: Coleccionistas de discos música country. Bola de nieve: yo a ti te digo ponme en contacto con otros 5, esos a su vez te ponen en contacto con 5 más… No hay censos: localizas a uno y éste a su vez te pone en contacto con otros.

Conveniencia Selecciona unidades atendiendo a su comodidad. Razones de coste o tiempo. Ej.: si hago una encuesta a alguien de marketing se lo hago a un compañero de clase porque lo tengo más cerca.

5. PARA TERMINAR… Ficha técnica de una encuesta Siempre tiene que aparecer: • • • • • • •

Población. Tamaño Muestral. Unidad de análisis (jóvenes, empresas etc.). Error muestral cometido, Varianza Poblacional y nivel de confianza. Tipo de Muestreo. Tipo de encuesta (tipo de cuestionario: personal, telefónica, electrónica, postal…). Fechas Trabajo de Campo (ej.: desde el 28 de noviembre hasta el 1 de enero).

EJEMPLO diap. 69: • • • •

Van a encuestar 1600 personas. Lo dividen en cuatro estratos de 400 personas cada uno. Es polietápico, es decir, lo dividen en muchas etapas. Lo divide en circunscripciones. Error de muestreo: para cada circunscripción el error muestral aumenta....