Exercicis Resolts PDF

Title Exercicis Resolts
Course Estadística Aplicada
Institution Universitat Rovira i Virgili
Pages 169
File Size 5.6 MB
File Type PDF
Total Downloads 26
Total Views 143

Summary

Exercicis Resolts...


Description

Estadística: exercicis resolts pas a pas

Josep Maria Mateo Sanz Universitat Rovira i Virgili

ÍNDEX PRESENTACIÓ ........................................................................................................................ 4 1 ESTADÍSTICA DESCRIPTIVA. ...................................................................................... 5 1.1 Mesures descriptives: dades individuals....................................................................... 5 1.2 Mesures descriptives: dades amb freqüències. ............................................................. 9 2 VARIABLES ALEATÒRIES. ........................................................................................ 14 2.1 Variable aleatòria discreta. ......................................................................................... 14 2.2 Variable aleatòria contínua. ........................................................................................ 15 3 MODELS DE DISTRIBUCIÓ DE PROBABILITATS. ................................................. 19 3.1 Distribució binomial. .................................................................................................. 19 3.2 Distribució Poisson. .................................................................................................... 22 3.3 Distribució uniforme contínua. ................................................................................... 25 3.4 Distribució exponencial. ............................................................................................. 27 3.5 Distribució normal. ..................................................................................................... 29 3.6 Distribució khi-quadrat. .............................................................................................. 33 3.7 Distribució t de Student. ............................................................................................. 34 3.8 Distribució F de Fisher-Snedecor. .............................................................................. 37 3.9 Teorema de l’addició. ................................................................................................. 38 3.10 Teorema del límit central: sumes de variables aleatòries. ....................................... 40 3.11 Teorema del límit central: mitjanes de variables aleatòries. ................................... 42 4 INTERVALS DE CONFIANÇA. .................................................................................... 44 4.1 Intervals sobre una mitjana. ........................................................................................ 44 4.1.1 X normal,  coneguda (o X no normal,  coneguda, mostra gran). ................. 44 4.1.2 X no normal,  desconeguda, mostra gran. ........................................................ 47 4.1.3 X normal,  desconeguda. .................................................................................. 50 4.2 Intervals sobre una diferència de mitjanes. ................................................................ 52 4.2.1 X1 i X2 normals, dependents,  1 i  2 desconegudes. ......................................... 52 4.2.2 X1 i X2 normals, indep,  1 i  2 conegudes (o X1 i X2 no normals,  1 i  2 conegudes, mostres grans). .............................................................................................. 55 4.2.3 X1 i X2 no normals, indep,  1 i  2 desconegudes, mostres grans. ..................... 57 4.2.4 X1 i X2 normals, indep,  1 i  2 desconegudes, dispersió semblant. .................. 60 4.2.5 X1 i X2 normals, indep,  1 i  2 desconegudes, dispersió diferent. .................... 62 4.3 Interval sobre una variància. ....................................................................................... 65 4.4 Interval sobre un quocient de variàncies. ................................................................... 66 4.5 Interval sobre una proporció. ...................................................................................... 67 4.6 Interval sobre una diferència de proporcions. ............................................................ 70 5 CONTRASTOS D'HIPÒTESIS. ...................................................................................... 73 5.1 Contrast sobre una mitjana. ........................................................................................ 73 5.1.1 X normal,  coneguda (o X no normal,  coneguda, mostra gran). ................. 73 5.1.2 X no normal,  desconeguda, mostra gran. ........................................................ 76 5.1.3 X normal,  desconeguda. .................................................................................. 79 5.2 Contrast sobre una comparació de mitjanes. .............................................................. 82 5.2.1 X1 i X2 normals, dependents,  1 i  2 desconegudes. ......................................... 82 5.2.2 X1 i X2 normals, indep,  1 i  2 conegudes (o X1 i X2 no normals,  1 i  2 conegudes, mostres grans). .............................................................................................. 86 2

5.2.3

X1 i X2 no normals, indep,  1 i  2 desconegudes, mostres grans. ..................... 90 X1 i X2 normals, indep,  1 i  2 desconegudes, dispersió semblant. .................. 93

5.2.4 5.2.5 X1 i X2 normals, indep,  1 i  2 desconegudes, dispersió diferent. .................... 97 5.3 Contrast sobre una variància..................................................................................... 101 5.4 Contrast sobre una comparació de variàncies. .......................................................... 104 5.5 Contrast sobre una proporció. ................................................................................... 107 5.6 Contrast sobre una comparació de proporcions. ....................................................... 110 6 ANÀLISI DE LA VARIÀNCIA (ANOVA). ................................................................ 114 6.1 Disseny ANOVA d'un factor. ................................................................................... 114 6.2 Comparació de variàncies: test de Levene. .............................................................. 121 6.3 Disseny ANOVA de dos factors sense interacció. Blocs aleatoritzats. .................... 123 6.4 Disseny ANOVA de dos factors amb interacció. ..................................................... 129 7 REGRESSIÓ LINEAL. ................................................................................................. 136 7.1 Regressió lineal simple. ............................................................................................ 136 7.2 Regressió no lineal simple. ....................................................................................... 145 7.3 Regressió lineal múltiple. ......................................................................................... 155 7.4 Comparació de models de regressió. ........................................................................ 163

3

PRESENTACIÓ L’objectiu principal d’aquest material és proporcionar als estudiants una eina, estructurada en format de llibre, que els hi permeti consultar de manera clara i ràpida com s’apliquen les diverses tècniques i procediments estadístics mitjançant la resolució de diversos exercicis plantejats. Aquests exercicis es corresponen als continguts que, generalment, formen part d’un curs bàsic d’Estadística a nivell universitari. Tots els enunciats estan inspirats en diversos contes clàssics. La resolució dels exercicis es detalla pas a pas ja que, la gran majoria, s’han de resoldre usant un procediment que implica el seguiment d’una sèrie d’etapes i que, depenent del resultat en alguna d’aquestes etapes, els càlculs i fórmules que s’han d’aplicar en etapes posteriors poden ser uns o altres. També es dóna una breu explicació o raonament que se segueix en cada pas; no només es posen fórmules i/o càlculs i prou. El propòsit d’utilitzar aquesta estructura és afavorir l’aprenentatge de l’estudiant, assistint-lo en la resolució dels exercicis que es proposen en l’assignatura ja que es marca el camí a seguir per aplicar cada tècnica. La part teòrica i passos en els que estan basats la resolució dels diversos exercicis es poden trobar al llibre “Estadística pràctica pas a pas” del mateix autor que ha escrit aquest recull d’exercicis. En aquest material també s’explica quines són les funcions i les eines estadístiques d’Excel que es poden fer servir per automatitzar els càlculs que es requereixen per aplicar les diverses tècniques estadístiques.

4

1 ESTADÍSTICA DESCRIPTIVA.

1.1 Mesures descriptives: dades individuals. Enunciat. La Caputxeta Vermella s’ha fet gran i ja va a la Universitat. A la seva classe són 20 estudiants. El nombre de faltes d'assistència a classe d’aquests 20 estudiants durant el primer quadrimestre, ha estat de: 0, 2, 3, 2, 1, 0, 4, 5, 0, 0, 2, 6, 1, 0, 2, 3, 5, 4, 1, 0 a) Calculeu la mitjana aritmètica. b) Calculeu la mediana. c) Trobeu la moda. d) Calculeu la desviació mitjana. e) Calculeu la variància poblacional. f) Calculeu la desviació estàndard poblacional. g) Calculeu el coeficient de variació. h) Calculeu la variància mostral. i) Calculeu la desviació estàndard mostral. j) Calculeu el quartil 1. k) Calculeu el percentil 35. l) Calculeu el percentil 80.

Solució. a) Calculeu la mitjana aritmètica. Per calcular al mitjana aritmètica cal sumar totes les dades i dividir entre el nombre total de dades. En aquest cas, tenim 20 dades. x=

0 + 2 + 3+ 2 + 1+ 0 + 4+ 5+ 0+ 0+ 2+ 6+ 1+ 0+ 2+ 3+ 5 + 4 + 1+ 0 41 = = 2.05 20 20

La mitjana aritmètica és 2.05. b) Calculeu la mediana. 5

Per calcular la mediana, ordenem totes les dades de més petita a més gran i agafem la dada que està a la posició central. Com hi ha 20 dades, hi haurà dues dades centrals, que seran les que ocupen les posicions 10 i 11, i s’haurà de fer la mitjana d’aquestes dues dades centrals. Les dades ordenades són: 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 5, 5, 6 La dada que ocupa la posició 10 és un 2 i la dada que ocupa la posició 11 també és un 2. Per tant, la mediana és 2. c) Trobeu la moda. La moda és la dada que més es repeteix. A la taula següent posem les dades i quantes vegades apareix repetida cada dada: Dada (xi)

Repeticions

0

6

1

3

2

4

3

2

4 5

2

6

1

Veiem que la dada que més es repeteix és el 0 (es repeteix 6 vegades), per tant, la moda és 0. d) Calculeu la desviació mitjana, Dx . A cadascuna de les dades cal restar-li la mitjana aritmètica, agafar aquestes diferències en valor absolut, sumar-les i dividir entre el nombre total de dades (20). Recordem que la mitjana aritmètica és 2.05. Les dades són: 0, 2, 3, 2, 1, 0, 4, 5, 0, 0, 2, 6, 1, 0, 2, 3, 5, 4, 1, 0 Per tant, la desviació mitjana és: Dx =

| 0 - 2.05 |+| 2 - 2.05 |+| 3 - 2.05|+| 2 - 2.05|+ 20

.05|

=

31.3 = 1.565 20

e) Calculeu la variància poblacional,  2 . A cadascuna de les dades cal restar-li la mitjana aritmètica, elevar al quadrat cadascuna d’aquestes diferències, sumar-les i dividir entre el nombre total de dades (20). Recordem que la mitjana aritmètica és 2.05. 6

Les dades són: 0, 2, 3, 2, 1, 0, 4, 5, 0, 0, 2, 6, 1, 0, 2, 3, 5, 4, 1, 0 Per tant, la variància poblacional és:

 = 2

( 0 - 2.05)2 + ( 2 - 2.05) 2 + ( 3 - 2.05)2 + ( 2 - 2.05)2 +

.05 )

2

=

20

70.95 = 3.5475 20

f) Calculeu la desviació estàndard poblacional,  . La desviació estàndard (o típica) poblacional s’obté fent l’arrel quadrada de la variància poblacional. És a dir,

 = 3.5475 = 1.8835 g) Calculeu el coeficient de variació, V . El coeficient de variació es calcula dividint la desviació estàndard (o típica) poblacional entre la mitjana aritmètica. V=

 x

=

1.8835 = 0.9188 2.05

h) Calculeu la variància mostral, S2 . Per calcular la variància mostral s’usa el mateix procediment usat per al càlcul de la variància poblacional, però en comptes de dividir al final entre el nombre total de dades es divideix entre el nombre total de dades menys una. En el nostre cas, tenim 20 dades i, al final, dividirem entre 19. 2

S

(0 - 2.05 ) =

2

2

2

2

+ (2 - 2.05 ) + (3 - 2.05 ) + (2 - 2.05 ) + 19

.05 )

2

=

70.95 = 3.7342 19

i) Calculeu la desviació estàndard mostral, S . La desviació estàndard (o típica) mostral s’obté fent l’arrel quadrada de la variància mostral. És a dir, S = 3.7342 = 1.9324

j) Calculeu el quartil 1. Les dades ordenades són: 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 5, 5, 6 7

Si ens demanen el quartil 1, podem buscar el percentil 25, P25, ja que és el mateix. El P25 ocupa la posició x =

25*19 + 1 = 5.75 (entre la posició 5 i la posició 6). Amb la sèrie de 100

dades ordenada veiem que la posició 5 correspon a un 0 i la posició 6 també correspon a un 0. Per tant, el percentil 25 serà igual a 0 (P25 = 0). k) Calculeu el percentil 35. Les dades ordenades són: 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 5, 5, 6 El percentil 35, P35 ocupa la posició x =

35*19 + 1 = 7.65 (entre la posició 7 i la posició 8). 100

Amb la sèrie de dades ordenada veiem que la posició 7 correspon a un 1 i la posició 6 també correspon a un 1. Per tant, el percentil 35 serà igual a 1 (P35 = 1). l) Calculeu el percentil 80. Les dades ordenades són: 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 4, 5, 5, 6 El percentil 80, P80 ocupa la posició x =

80*19 + 1= 16.2 (entre la posició 16 i la posició 100

17). Amb la sèrie de dades ordenada veiem que la posició 16 correspon a un 4 i la posició 17 també correspon a un 4. Per tant, el percentil 80 serà igual a 4 (P80 = 4).

Solució amb Excel. En aquest quadre es mostren les funcions d’Excel que fan els càlculs corresponents a diverses mesures estadístiques descriptives. Totes aquestes funcions es troben a la categoria de funcions Estadístiques d’Excel. Entre parèntesis hi ha el nom d’algunes funcions en català ja que el seu nom difereix de la versió d’Excel que es tingui (català o castellà). MESURES ESTADÍSTIQUES

FUNCIONS D’EXCEL

Mitjana, x

PROMEDIO (cat MITJANA)

Mediana

MEDIANA

Moda

MODA.UNO (ordeneu dades)

8

Desviació Mitjana, Dx

DESVPROM (cat DESVMITJ)

Variància poblacional, σ2

VAR.P

Desviació estàndard poblacional, σ

DESVEST.P

Variància mostral, s2

VAR.S (cat VAR.M)

Desviació estàndard mostral, s

DESVEST.M

Percentil, Pk

PERCENTIL.INC

L’única mesura estadística de les que es demanen que no es calcula amb una funció d’Excel específica és el coeficient de variació. Per calcular el coeficient de variació amb Excel cal dividir el valor de la casella on s’ha calculat la desviació estàndard poblacional entre el valor de la casella on s’ha calculat la mitjana aritmètica. En el cas de la moda, no és imprescindible ordenar prèviament les dades. L’ordenació de les dades només caldria si hi ha un empat de més d’una dada en el nombre màxim de vegades que repeteix; en aquest cas, no hi hauria una moda única sinó que tindríem dues modes (bimoda), tres modes (trimoda), ... L’Excel ens retornarà un sol valor de la moda. Si ordenem les dades, en cas que hi hagi més d’una moda, ens retornarà el valor més petit de les modes. En el vídeo següent es pot veure el càlcul de totes aquestes mesures descriptives.

1.2 Mesures descriptives: dades amb freqüències.

Enunciat Quan la Ventafocs arriba al ball, es troba que hi ha 400 assistents. Han vist que el príncep va descalç i entre tots es fa una col·lecta per regalar unes sabates noves al príncep. En aquesta col·lecta s’han recollit els següents donatius: Quantitat donada

Nombre de donacions

4

200 9

6

150

12

20

30

20

60

5

150

4

600

1

a) Calculeu la mitjana. b) Calculeu la mediana c) Trobeu la moda. d) Calculeu la desviació mitjana. e) Calculeu la variància poblacional. f) Calculeu la desviació estàndard poblacional. g) Calculeu el coeficient de variació. h) Calculeu la variància mostral. i) Calculeu la desviació estàndard mostral. j) Calculeu el quartil 3. k) Calculeu el percentil 10. l) Calculeu el percentil 90.

Solució. a) Calculeu la mitjana aritmètica. Per calcular al mitjana aritmètica cal tenir en compte que cada valor es repeteix un nombre determinat de vegades. Hi ha un total de 400 dades (cal tenir en compte el nombre de vegades que es repeteix cada valor) x=

4* 200 + 6*150 +12*20 + 30*20 + 60*5 + 150* 4 + 600*1 4040 = = 10.1 400 400

La mitjana aritmètica és 10.1. b) Calculeu la mediana. Per calcular la mediana, ordenem totes els valors de més petit a més gran, tenint en compte quantes vegades es repeteix cada valor, i agafem el valor que està a la posició central. Com 10

hi ha 400 dades, hi haurà dos valors centrals, que seran els que ocupen les posicions 200 i 201, i s’haurà de fer la mitjana d’aquests dos valors centrals. Observant els valors i les seves repeticions, ell valor que ocupa la posició 200 és un 4 i el valor que ocupa la posició 201 és un 6. Per tant, la mediana és 5. c) Trobeu la moda. La moda és el valor que més es repeteix. Observant els valors i les seves repeticions, i sense fer cap càlcul, veiem que la moda és el valor 4. d) Calculeu la desviació mitjana, Dx . A cadascun dels valors, cal restar-li la mitjana aritmètica, agafar aquestes diferències en valor absolut, sumar-les (tenint en compte el nombre de vegades que es repeteix cada valor) i dividir entre el nombre total de dades (400). Recordem que la mitjana aritmètica és 10.1. Per tant, la desviació mitjana és:

Dx =

| 4 - 10.1| *200 +| 6 - 10.1| *150 + 400

- 10.1|

=

3670 = 9.175 400

e) Calculeu la variància poblacional,  2 . A cadascuna de les dades cal restar-li la mitjana aritmètica, elevar al quadrat cadascuna d’aquestes diferències, sumar-les (tenint en compte el nombre de vegades que es repeteix cada valor) i dividir entre el nombre total de dades (400). Recordem que la mitjana aritmètica és 10.1. Per tant, la variància poblacional és:

2 =

( 4 - 10.1)2 *200+ ( 6 - 10.1)2 *150+

- 10.1) *1

400

2

=

456676 = 1141.69 400

f) Calculeu la desviació estàndard poblacional,  . La desviació estàndard (o típica) poblacional s’obté fent l’arrel quadrada de la variància poblacional. És a dir,

 = 1141.69 = 33.7889 g) Calculeu el coeficient de variació, V . 11

El coeficient de variació es calcula dividint la desviació estàndard (o típica) poblacional entre la mitjana aritmètica. V=

 x

=

33.7889 = 3.3454 10.1

h) Calculeu la variància mostral, S2 . Per calcular la variància mostral s’usa el mateix procediment usat per al càlcul de la variància poblacional, però en comptes de dividir al final entre el nombre total de dades es divideix entre el nombre total de dades menys una. En el nostre cas, tenim 400 dades i, al final, dividirem entre 399.

S2 =

(4 - 10.1) 2 *200 + (6 - 10.1) 2 *150 +

- 10.1 ) *1

399

2

=

456676 = 1144.5514 399

i) Calculeu la desviació ...


Similar Free PDFs