Wt ubung - WS 2019/2020 Übungen PDF

Title Wt ubung - WS 2019/2020 Übungen
Author Helmi chawachi
Course Wahrscheinlichkeitstheorie
Institution Karlsruher Institut für Technologie
Pages 55
File Size 1.8 MB
File Type PDF
Total Downloads 66
Total Views 131

Summary

WS 2019/2020 Übungen...


Description

Institut für Stochastik Wahrscheinlichkeitstheorie und Statistik für die Fachrichtung Informatik WS 2019/2020 Dr. Sebastian Lerch M. Sc. Eva-Maria Walz

Aufgabenblatt 1 Aufgabe 1 Gegeben seien zwei reellwertige Stichproben x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) vom Umfang n ∈ N mit den möglichen reellen Merkmalswerten a1, . . . , ak . Zeigen Sie die folgenden Beziehungen für die Stichprobenvarianz sx2 und den empirischen Korrelationskoeffizienten rxy : Pn P  1 2 Pk  x y − n·x·y ) n 1 2 n−1 ( j=1 j j 2 = n a − x h (a ) b) r . = a) sx2 = n−1 x xy j j j=1 j=1 xj − n(x) n−1 sx sy Aufgabe 2 Es soll eine neugezüchtete Kartoffelsorte getestet werden. Dazu wird ein Testfeld ausgewählt, das auf der gesamten Fläche gleiche Wachstumsvoraussetzungen (Bodenqualität, Sonneneinstrahlung etc.) bietet. Nachdem eine gleichmäßige Pflege der Pflanzen erfolgte (Bewässerung, Düngung etc.), wurde von der ersten Ernte auf dem Versuchsfeld eine Stichprobe entnommen, die die folgenden Werte (für das Gewicht der Kartoffeln in g) lieferte: j 1 2 3 4 5 6 7 8 9 10 xj 150 121 125 125 160 180 160 130 150 125 a) Zeichnen Sie ein Histogramm dieser Daten mit den Klassengrenzen 120, 135, 150, 165, 180 b) Berechnen Sie (1) das empirische 70%–Quantil (0.7–Quantil), (2) das arithmetische Mittel, (3) den Median, (4) das 25%–gestutzte Mittel (0.25–gestutzte Mittel), (5) die empirische Varianz, (6) die empirische Standardabweichung, (7) den Quartilsabstand. Hinweis: Benutzen Sie die in Aufgabe 1 gezeigten Beziehungen. c) Ersetzt man den 6. Wert 180 durch den Wert 810 (Schreibfehler), so ändern sich von den in b) bestimmten Größen genau 4 nicht. Welche sind dies? d) Es sei z = (z1 , z2 , . . . , z10 ) die „Stichprobe“ mit der Eigenschaft: zi := Mittelpunkt der Klasse, in der xi liegt. Bestimmen Sie die empirische Verteilungsfunktion Fz zur Stichprobe z . Aufgabe 3 In einem Experiment haben Forscher das Aufsteh- und Hinlegeverhalten von 10 Kühen untersucht. Dabei wollten sie wissen, ob die Wahrscheinlichkeit, dass eine Kuh innerhalb der nächsten 15 Minuten aufsteht, von der Zeit abhängt, die sie bereits liegend verbracht hat. Dabei ergaben sich folgende Daten (Liegedauer in Stunden): Zudem wurde auch untersucht, ob die Wahrscheinlichkeit, dass eine Kuh sich hinlegt von der Zeit abhängt, die sie bisher stehend verbracht hat. Die Ergebnisse sind in folgender Tabelle aufgeführt (Stehdauer in Stunden):

KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft

www.kit.edu

Liegedauer Aufstehw. Stehdauer Hinlegew.

0.1 0.07 0.2 0.16

0.5 0.15 0.5 0.13

0.8 0.19 0.8 0.14

1 0.23 1 0.14

1.2 0.33 1.2 0.11

1.4 0.35 1.4 0.12

1.6 0.4

2 0.51

2.2 0.5

1.6 0.11

2 0.12

2.2 0.1

2.4 0.14

2.7 0.13

3 0.16

a) Bestimmen und zeichnen Sie zu beiden Experimenten eine lineare Regressionsgerade. b) Interpretieren und vergleichen Sie die Ergebnisse aus a). Aufgabe 4 Bei der Produktion von Taschenrechnern findet eine Endkontrolle statt, wobei die Ereignisse A = “Rechner funktioniert“ und B = “Gehäuse einwandfrei“ beobachtet werden. 1. Stellen Sie das Ereignis “Der Rechner ist einwandfrei“ mit Hilfe der Ereignisse A und B dar. 2. Drücken Sie die Ereignisse Ac ,

Bc ,

(A ∪ B)c ,

A ∩ Bc ,

Ac ∩ B

in Worten aus.

Aufgabe 5 In einem Stromkreis befinden sich vier nummerierte Bauteile, die jedes für sich innerhalb eines gewissen Zeitraums intakt bleiben oder ausfallen können. Im letzteren Fall ist der Stromfluss durch das betreffende Bauteil unterbrochen. Es bezeichnet Aj das Ereignis, dass das j -te Bauteil intakt bleibt (j = 1, 2, 3, 4) und A das Ereignis, dass der Stromfluss nicht unterbrochen ist. Drücken Sie für jedes der Schaltbilder a) - d) das EreignisA durch A1 , A2 , A3 , A4 aus. c) .

a) .

2 1

2

3

4 1

b) .

3

1 2 3 4

4 d) . 1

3

2

4

Keine Abgabe. Diese Aufgaben werden in der Übung am 23.10.2019 besprochen.

www.kit.edu

Institut für Stochastik Wahrscheinlichkeitstheorie und Statistik für die Fachrichtung Maschinenbau WS 2019/2020 Dr. Sebastian Lerch M. Sc. Eva-Maria Walz

Lösungsblatt 1 Aufgabe 1 Gegeben seien zwei reellwertige Stichproben x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) vom Umfang n ∈ N mit den möglichen reellen Merkmalswerten a1, . . . , ak . Zeigen Sie die folgenden Beziehungen für die Stichprobenvarianz sx2 und den empirischen Korrelationskoeffizienten rxy : a) sx2 =

1 n−1

P

n 2 j=1 xj

 − n(x)2 =

Pk

n n−1

j=1

 2 aj − x hx (aj )

b) rxy =

1 n−1

(

Pn

j=1 xj yj

sx sy

− n·x·y )

.

Lösungsvorschlag: a) Nach Definition gilt sx2 =

1 n−1

Pn

j=1 (xj

− x)2 . Wir müssen also für die erste Gleichung nur zeigen, dass

n X

(xj − x)2 =

n X

xj2 − n(x)2

j=1

j=1

gilt: n  n  X X 2 (xj − x)2 = xj2 − 2xj x + (x) j=1

j=1

=

n X

x 2j +

j=1

=

n X j=1

=

n X j=1

=

n X j=1

n n X X (x)2 (−2)xxj + j=1

j=1

x 2j − 2x ·

n X j=1

xj + n · (x)2

x 2j − 2x · n · x + n · (x)2 x 2j − n · (x)2 .

Für die zweite Gleichung erinnern wir uns an die Definitionen n

1X hx (aj ) := 1{xi = aj } n i=1

KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft

wobei

 1, 1{E } := 0,

Aussage E trifft zu Aussage E trifft nicht zu

www.kit.edu

und erhalten somit k k n X X n X  2 1 2 n 1{xi = aj } aj − x hx (aj ) = n − 1 aj − x n n−1 j=1

=

1 n−1

j=1 k n X X i=1 j=1 n

=

i=1

 2 aj − x 1{xi = aj }

k

1 XX (xi − x)2 1{xi = aj } n−1 i=1 j=1 n

=

k

X 1 X 1{xi = aj } (xi − x)2 n−1 i=1 j=1 | {z } =1

n

1 X (xi − x)2 . = n−1 i=1

Die gleichen Aussagen gelten natürlich auch für die Stichprobenvarianz sy der Stichprobe y . b) Wir gehen genauso vor, wie in Aufgabenteil a). Nach Definition gilt 1 Pn (x − x)(y − y ) j j=1 j n−1 . rxy = sx · sy Wir müssen also nur zeigen, dass n n X X xj yj − n · x · y (xj − x)(yj − y ) = j=1

j=1

gilt: n X

(xj − x)(yj − y ) =

n X   xj yj − xj y − yj x + x · y j=1

j=1

=

n X j=1

=

n X j=1

=

n X j=1

xj yj − y ·

n X j=1

xj − x ·

n X j=1

yj + n · x · y

xj yj − y · n · x − x · n · y + n · x · y xj yj − n · x · y .

Teil 1 in Aufgabenteil a) ist also ein Spezialfall dieser Rechnung. Aufgabe 2 Es soll eine neugezüchtete Kartoffelsorte getestet werden. Dazu wird ein Testfeld ausgewählt, das auf der gesamten Fläche gleiche Wachstumsvoraussetzungen (Bodenqualität, Sonneneinstrahlung etc.) bietet. Nachdem eine gleichmäßige Pflege der Pflanzen erfolgte (Bewässerung, Düngung etc.), wurde von der ersten Ernte auf dem Versuchsfeld eine Stichprobe entnommen, die die folgenden Werte (für das Gewicht der Kartoffeln in g) lieferte: j 1 2 3 4 5 6 7 8 9 10 xj 150 121 125 125 160 180 160 130 150 125 a) Zeichnen Sie ein Histogramm dieser Daten mit den Klassengrenzen 120, 135, 150, 165, 180. b) Berechnen Sie

www.kit.edu

(1) das empirische 70%–Quantil (0.7–Quantil), (2) das arithmetische Mittel, (3) den Median, (4) das 25%–gestutzte Mittel (0.25–gestutzte Mittel), (5) die empirische Varianz, (6) die empirische Standardabweichung, (7) den Quartilsabstand. Hinweis: Benutzen Sie die in Aufgabe 1 gezeigten Beziehungen. c) Ersetzt man den 6. Wert 180 durch den Wert 810 (Schreibfehler), so ändern sich von den in b) bestimmten Größen genau 4 nicht. Welche sind dies? d) Es sei z = (z1 , z2 , . . . , z10 ) die „Stichprobe“ mit der Eigenschaft: zi := Mittelpunkt der Klasse, in der xi liegt. Bestimmen Sie die empirische Verteilungsfunktion Fz zur Stichprobe z .

Lösungsvorschlag: a) Nach Vorlesung erhalten wir die Klassen Klasse 1: (120, 135] Klasse 2: (135, 150] Klasse 3: (150, 165] Klasse 4: (165, 180]

und folgende Tabelle Klasse 1 2 3 4 Hj 5 2 2 1 hj 0.5 0.2 0.2 0.1 Mittelpunkt 127.5 142.5 157.5 172.5 Laut Vorlesung gilt für die Höhe der Balken im Histogramm dj · (tj+1 − tj ) = hj . Da hier tj+1 − tj = 15 für alle j gilt, ergibt sich dj =

hj , 15

also j dj

www.kit.edu

1 2 3 4 1/30 1/75 1/75 1/150

(1)

1 30

1 75

1 150

120

130

b) Geordnete Stichprobe: j 1 x(j) 121

2 125

150

3 125

160

4 125

170

180

5 130

6 150

p = 0.7 =⇒ n · p ∈ N =⇒ ˜x0.7 =

(1) n = 10,

(2) x =

140

7 150

8 160

9 160

10 180

 1 x(7) + x(8) = 155, 2

10 1 X xj = 142.6, 10 j=1

(3) da n gerade ist gilt x˜ =

(4) α = 0.25,

 1 x(5) + x(6) = 140, 2

[10 · 0.25] = 2 =⇒ ¯x0.25 =

10 −2 X 1 x(j) = 140, · 10 − 2 − 2 j=2+1

  10 10 X X   1 1 2 (5) s 2 = xj − x =  xj2 − 10x 2 = 407.6, 9 9 j=1

j=1

√ (6) s = + s 2 = 20.19, (7) n = 10,

p=

1 , 4

analog x˜3/4 = x(8)

5 ∈ / N, ⇒ [np] + 1 = 3 =⇒ x˜ 1/4 = x(3) , 2 =⇒ Quartilsabstand = x˜3/4 − x˜1/4 = 35, n·p =

c) Die Größen aus (1), (3), (4), (7) ändern sich nicht. d) Es ergibt sich also die Stichprobe z = (142.5, 127.5, 127.5, 127.5, 157.5, 172.5, 157.5, 127.5, 142.5, 127.5). In Tabelle (1) sind schon die relativen und absoluten Häufigkeiten der neuen Stichprobe z eingetragen. Anwenden der Definition aus den Folien der Vorlesung ergibt

Fz : R → [0, 1],

www.kit.edu

t 7→

X a6t

hz (a) =

10 1 X 1{zi 6 t}. 10 i=1

Fz (t)

1 0.9 0.7 0.5

t 127.5

142.5

157.5

172.5

Abbildung 1: empirische Verteilungsfunktion Fz (t)

Aufgabe 3 In einem Experiment haben Forscher das Aufsteh- und Hinlegeverhalten von 10 Kühen untersucht. Dabei wollten sie wissen, ob die Wahrscheinlichkeit, dass eine Kuh innerhalb der nächsten 15 Minuten aufsteht, von der Zeit abhängt, die sie bereits liegend verbracht hat. Dabei ergaben sich folgende Daten (Liegedauer in Stunden). Zudem wurde auch untersucht, ob die Wahrscheinlichkeit, dass eine Kuh sich hinlegt von der Zeit Liegedauer Aufstehw.

0.1 0.07

0.5 0.15

0.8 0.19

1 0.23

1.2 0.33

1.4 0.35

1.6 0.4

2 0.51

2.2 0.5

abhängt, die sie bisher stehend verbracht hat. Die Ergebnisse sind in folgender Tabelle aufgeführt (Stehdauer in Stunden). Stehdauer Hinlegew.

0.2 0.16

0.5 0.13

0.8 0.14

1 0.14

1.2 0.11

1.4 0.12

1.6 0.11

2 0.12

2.2 0.1

2.4 0.14

2.7 0.13

3 0.16

a) Bestimmen und zeichnen Sie zu beiden Experimenten eine lineare Regressionsgerade. b) Interpretieren und vergleichen Sie die Ergebnisse aus a).

Lösungsvorschlag: a) Wir beginnen mit dem Aufstehexperiment. Dort haben wir n = 9 Beobachtungen und wollen die Aufstehwahrscheinlichkeit y = (y1, . . ., y9) über die bisherige Liegedauer x = (x1, . . . , x 9) erklären. Die Regressionsgerade ergibt sich laut Vorlesung als y = a∗ + b∗ x mit sy sx a∗ = y − b∗ x.

b∗ = rxy

Dabei ist rxy der empirische Korrelationskoeffizient von x und y, sy bzw. sx die empirische Standardabweichung der jeweiligen Stichprobe und y bzw. x das arithmetische Mittel der Stichproben. Wir rechnen nach

www.kit.edu

und erhalten hier: 9

x=

1X xj = 1.2, 9 j=1 9

1X yj = 0.3, 9 j=1 v 9 q u u1 X (xj − x)2 = 0.6837, sx = s 2x t 8 j=1 v u 9 q u X 1 (yj − y )2 = 0.1540, sy = s 2y t 8 j=1 1 P9 (x − x)(y − y ) j j=1 j rxy = 8 = 0.9899. sx sy y=

0.8 0.6 0.4 0.2 0.0

Aufstehwahrscheinlichkeit

Damit ist dann b∗ = 0.2230 und a∗ = 0.0357. Die Regressionsgerade sehen wir in folgendem Bild

0.5

1.0

1.5

2.0

Liegedauer

Für das Hinlegeexperiment haben wir n = 12 Beobachtungen, hier soll die Hinlegewahrscheinlichkeit y = (y1, . . . , y12 ) mit Hilfe der bisherigen Stehdauer x = (x1, . . . , x12 ) erklärt werden. An den Formeln ändert sich außer der Anzahl der Summanden nichts, wir erhalten: x = 1.5833 y = 0.13 sx = 0.8892 sy = 0.0191 rxy = −0.0965 b∗ = −0.0021 a∗ = 0.1333. Die zugehörige Regressionsgerade sieht wie folgt aus:

www.kit.edu

0.20 0.15 0.10 0.05 0.00

Hinlegewahrscheinlichkeit

0.5

1.0

1.5

2.0

2.5

3.0

Stehdauer

b) Offensichtlich scheint in Experiment 1 (Aufstehwahrscheinlichkeit in Abhängigkeit von Liegedauer) ein sehr starker, linearer Zusammenhang zwischen den beiden Merkmalen zu bestehen, die Punkte liegen fast alle auf der Regressionsgeraden. Auch der sehr hohe empirische Korrelationskoeffizient stützt diese These, er liegt sehr nahe an 1 (Erinnerung: Je stärker ein ansteigender, linearer Trend vorliegt, desto näher liegt rxy an 1). Beim zweiten Experiment hingegen verläuft die Regressionsgerade sehr flach, fast waagrecht. Hier scheint die These, dass die Hinlegewahrscheinlichkeit linear von der Stehdauer abhängt, nicht zuzutreffen. Auch der Korrelationskoeffizient liegt sehr nahe bei 0, was für keinen linearen Zusammenhang spricht. Das Schlüsselwort lautet hierbei linear: Andere Abhängigkeiten (z. B. quadratischer oder exponentieller Natur) kann der Korrelationskoeffizient nicht erfassen - es wäre also durchaus möglich, dass die Merkmale trotzdem abhängig sind.

Aufgabe 4 Bei der Produktion von Taschenrechnern findet eine Endkontrolle statt, wobei die Ereignisse A = “Rechner funktioniert“ und B = “Gehäuse einwandfrei“ beobachtet werden. a) Stellen Sie das Ereignis „Der Rechner ist einwandfrei“ mit Hilfe der Ereignisse A und B dar. b) Drücken Sie die Ereignisse Ac ,

Bc ,

(A ∪ B)c ,

A ∩ Bc ,

Ac ∩ B

in Worten aus.

Lösungsvorschlag: 1. Der Rechner ist einwandfrei, wenn der Rechner funktioniert und wenn das Gehäuse einwandfrei ist, also „Rechner einwandfrei“ = A ∩ B 2.

Ac = „Der Rechner funktioniert nicht“ Bc = „Das Gehäuse ist nicht einwandfrei“ (A ∪ B)c = Ac ∩ Bc = „Der Rechner funktioniert nicht und das Gehäuse ist nicht einwandfrei“

A ∩ Bc = „Der Rechner funktioniert und (aber) das Gehäuse ist nicht einwandfrei“

Ac ∩ B = „Der Rechner funktioniert nicht und (aber) das Gehäuse ist einwandfrei“

www.kit.edu

Aufgabe 5 In einem Stromkreis befinden sich vier nummerierte Bauteile, die jedes für sich innerhalb eines gewissen Zeitraums intakt bleiben oder ausfallen können. Im letzteren Fall ist der Stromfluss durch das betreffende Bauteil unterbrochen. Es bezeichnet Aj das Ereignis, dass das j -te Bauteil intakt bleibt (j = 1, 2, 3, 4) und A das Ereignis, dass der Stromfluss nicht unterbrochen ist. Drücken Sie für jedes der Schaltbilder a) - d) das EreignisA durch A1 , A2 , A3 , A4 aus. c) . a) .

2 1

2

3

4 1

b) .

3

1 2

4 d) . 1

3

2

4

3 4 Lösungsvorschlag: a) In diesem Bild müssen alle Bauteile intakt sein, damit Strom fließt. Es ist A = A1 ∩ A2 ∩ A3 ∩ A4 . b) Hier muss mindestens eins intakt sein, damit Strom fließt, also A = A1 ∪ A2 ∪ A3 ∪ A4 . c) In diesem Bild muss das erste Bauteile intakt sein und eines von den anderen. A = A1 ∩ (A2 ∪ A3 ∪ A4 ). d) Hier muss das (1. oder 2.) und das (3. oder 4.) Bauteil intakt sein, also A = (A1 ∪ A2 ) ∩ (A3 ∪ A4 ).

www.kit.edu

Institut für Stochastik Wahrscheinlichkeitstheorie und Statistik für die Fachrichtung Informatik WS 2019/2020 Dr. Sebastian Lerch M. Sc. Eva-Maria Walz

Aufgabenblatt 2 Aufgabe 1 In einem endlichen W-Raum (Ω, A, P) seien A, B Ereignisse. Zeigen Sie: a) Gilt P(A) > 0.99 und P(B) > 0.97, so ist P(A ∩ B) > 0.96. b) P(Ac ∩ Bc ) + P (A) + P (Ac ∩ B) = 1. c) P(A ∩ B) − P(A)P(B) = P (Ac ∩ Bc ) − P(Ac )P(Bc ).

Aufgabe 2 a) Gegeben seien die 5 Buchstaben {A,B , M , N, S}. Ein Wort mit k Buchstaben ist ein k -Tupel (a1, . . . , ak ) mit ai ∈ {A, B, M, N , S} für i = 1, . . . , k . i) Wie viele verschiedene dreibuchstabige Wörter lassen sich aus diesen 5 Buchstaben bilden? ii) Wie viele verschiedene dreibuchstabige Wörter lassen sich aus diesen 5 Buchstaben bilden, wenn kein Buchstabe mehrfach auftreten darf? iii) Wie viele neue Wörter lassen sich durch Umstellen der Buchstaben aus dem Wort „ANANAS“ gewinnen? b) Eine Parkplatzanlage bestehe aus einer Reihe von 18 Parkplätzen für PKW. Sie sei durch Abstellen von 6 Opel, 2 Fiat, 4 Volvo, 5 Skoda und einem Smart belegt. Die Fahrzeuge seien durch ihr polizeiliches Kennzeichen alle unterscheidbar. Wie viele Parkmöglichkeiten gibt es, so dass i) alle Skodas nebeneinander stehen, ii) alle PKW vom gleichen Typ jeweils nebeneinander stehen?

KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft

www.kit.edu

Aufgabe 3 Zwischen 2 Punkten A und B verläuft folgendes Leitungsnetz:

Dabei sind S1 , . . . , S4 störanfällige Stellen. Die Zufallsvariablen Xi seien definiert als  0, Si ist unterbrochen, i = 1, . . . , 4. Xi = 1, Si ist nicht unterbrochen, a) Stellen Sie das Ereignis „A ist mit B verbunden“ mit Hilfe der Zufallsvariablen X1 , . . . , X4 dar. b) Stellen Sie das Ereignis „A ist mit B verbunden und S1 und S4 sind unterbrochen“ mit Hilfe der Zufallsvariablen X1 , . . . , X4 dar. Aufgabe 4 a) Zwei faire Münzen werden gleichzeitig geworfen. Im Anschluss werden die abgebildeten Symbole notiert. Geben Sie einen Wahrscheinlichkeitsraum an, um das Experiment zu modellieren. Wie groß ist die Wahrscheinlichkeit, dass beide Münzen das gleiche Symbol aufzeigen? b) Zwei faire, sechsseitige Würfel werden gleichzeitig geworfen und anschließend wird das Produkt der Augenzahlen gebildet. Geben Sie 2 verschiedene Wahrscheinlichkeitsräume und passende Zufallsvariablen an, die obiges Experiment modellieren. Bestimmen Sie die Wahrscheinlichkeit für ein gerades Produkt.

Aufgabe 5 Es sei Ω = {(i, j) : i, j ∈ {1, 2, 3, 4}}. Die Zufallsvariablen X : Ω → R bzw. Y : Ω → R seien definiert durch X (i , j ) := i

und

Y (i , j ) := j

und die gemeinsame Zähldichte fX ,Y : Ω → R von X und Y durch fX ,Y (i , j) := c · (i + j) mit einem noch zu bestimmenden c ∈ R. a) Bestimmen Sie c ∈ R so, dass fX ,Y eine Zähldichte auf Ω wird. b) Bestimmen Sie fX und fY . c) Welche Werte nimmt die Zufallsvariable Z := X · Y an? d) Berechnen Sie die Wahrscheinlichkeit P(Z 6 9).

Keine Abgabe. Diese Aufgaben werden in ...


Similar Free PDFs