Data Mining PDF

Title Data Mining
Author K. Jawa Bendi
Pages 79
File Size 5.5 MB
File Type PDF
Total Downloads 247
Total Views 732

Summary

Fungsi Deskripsi Data Mining Pertemuan 2, 3 R. Kristoforus JB, M.Cs. STT Musi Pengantar: Tinggi Badan Mahasiswa No Tinggi No Tinggi No Tinggi 1 168 11 169 21 167 2 164 12 167 22 166 3 167 13 169 23 165 4 164 14 167 24 166 5 171 15 164 25 169 6 166 16 166 26 171 7 169 17 168 27 166 8 172 18 167 28 16...


Description

Accelerat ing t he world's research.

Data Mining Kristoforus Jawa Bendi

Related papers

Download a PDF Pack of t he best relat ed papers 

MODUL DATA MINING FULL Reynaldi Moersas

Measurement and Comparison of Speed Dat a Processing In XML File by Using Naive Bayes algorit hm … Jalaludin Emilove Tugas Kelompok FP GROWT H 1. ngurah suariana

Fungsi Deskripsi

Data Mining Pertemuan 2, 3 R. Kristoforus JB, M.Cs. STT Musi

Pengantar: Tinggi Badan Mahasiswa No

Tinggi

No

Tinggi

No

Tinggi

1

168

11

169

21

167

2

164

12

167

22

166

3

167

13

169

23

165

4

164

14

167

24

166

5

171

15

164

25

169

6

166

16

166

26

171

7

169

17

168

27

166

8

172

18

167

28

167

9

166

19

165

29

164

10

166

20

164

30

165

KristoJB

DataMining

2

Pengantar • Ketika diberi sekumpulan data, terkadang agak sukar bagi kita untuk menangkap arti kumpulan data tersebut • Kumpulan data tersebut perlu dirangkum sedemikian rupa agar dapat ‘berbicara’, sehingga kita memiliki gambaran mengenai kumpulan data tersebut • Cara untuk menggambarkan data secara ringkas, disebut deskripsi • Deskripsi merupakan salah satu fungsi data mining KristoJB

DataMining

3

Pengantar Cara deskripsi: • Deskripsi grafis – Metoda dot-plot, Histogram, Pie-chart, stem-leaf

• Deskripsi lokasi – Rata-rata, Median, Modus, Kuartil, Desil, Persentil

• Deskripsi keragaman – Range, Varians, Standar Deviasi

KristoJB

DataMining

4

Dekripsi Grafis • Ada banyak cara untuk menggambarkan data dalam bentuk grafis. • Penggunaan metoda grafis sangat tergantung dari karakteristik data dan interpretasi yang diinginkan • Metoda deskripsi grafis antara lain: – – – – –

KristoJB

Dot-plot Buble-chart Histogram Pie-chart Stem-leaf

DataMining

5

Contoh: Tinggi Badan Mahasiswa No

Tinggi

No

Tinggi

No

Tinggi

1

168

11

169

21

167

2

164

12

167

22

166

3

167

13

169

23

165

4

164

14

167

24

166

5

171

15

164

25

169

6

166

16

166

26

171

7

169

17

168

27

166

8

172

18

167

28

167

9

166

19

165

29

164

10

166

20

164

30

165

KristoJB

DataMining

6

Metoda Dot-plot 173 172 171 170 169 168 167 166 165 164 163 0 KristoJB

5

10

15 DataMining

20

25

30

35 7

Metoda Dot plot • Pengetahuan apa yang dapat diperoleh dari gambaran data tersebut? – Titik cenderung berkumpul di angka 166 – 167, jadi kita dapat menyimpulkan kebanyakan mahasiswa bertinggi badan antara 166 – 167

KristoJB

DataMining

8

Metoda Buble chart 174 172

172; 1 171; 2

170 169; 4 168; 2

168 167; 6 166

166; 7 165; 3

164

164; 5

162 -1 KristoJB

0

1

2

3

4

5

DataMining

6

7

8

9

10 9

Metoda Histogram • Langkah 1: membuat beberapa interval dengan lebar yg sama • Langkah 2: hitung data yang menjadi anggota tiap interval • Langkah 3: membuat histogram • Perlu diingat bahwaa tidak semua kasus dapat menerapkan langkah yang sama. • Sangat tergantung dari kasus, data, dan interpretasi yang diinginkan

KristoJB

DataMining

10

Metoda Histogram Berdasarkan data contoh: • Langkah 1: Buat interval, misal: rentang interval 2. Interval 164 – 166 166 – 168 168 – 170 170 – 172 172 - 174

KristoJB

DataMining

11

Metoda Histogram • Langkah 2: hitung data yang menjadi anggota tiap interval

KristoJB

Interval

Frekuensi

164-166

8

166-168

13

168-170

6

170-172

2

172-174

1

DataMining

12

Metoda Histogram • Langkah 3: buat histogram 14 12 10 8 6 4 2 0 164-166 KristoJB

166-168

168-170 DataMining

170-172

172-174 13

Metoda Pie-chart • Langkah-langkah dalam metoda ini sama seperti pada histogram. • Yang berbeda hanyalah bentuk grafik data yang dihasilkan

KristoJB

DataMining

14

Metoda Pie-chart 7%

3% 27% 164-166 166-168 168-170 170-172 172-174

20%

43%

KristoJB

DataMining

15

Metoda Histogram & Pie-chart • Pengetahuan apa yang dapat diperoleh dari gambaran data tersebut? – Sebagian besar mahasiswa memliki tinggi badan antara 166 – 168 cm

KristoJB

DataMining

16

Metoda lain: Metoda Stem-leaf Tinggi

Frekuensi

164

5

165

3

166

7

167

6

168

2

169

4

171

2

172

1

KristoJB

DataMining

17

Latihan • Berikut adalah data 22 orang yang menderita aphasia dan jenisnya. – Buatlah histogram dan pie-chartnya – Interpretasikan hasil yang anda peroleh

KristoJB

DataMining

18

Latihan No

Jenis Aphasia

No

Jenis Aphasia

1

Broca

12

Broca

2 3 4 5

Anomic Anomic Conduction Broca

13 14 15 16

Anomic Broca Anomic Anomic

6 7 8 9 10 11

Conduction Conduction Anomic Conduction Anomic Conduction

17 18 19 20 21 22

Anomic Anomic Broca Anomic Conduction Anomic

KristoJB

DataMining

19

Latihan • Langkah hitung jumlah penderita untuk setiap jenis aphasia Jenis Aphasia

KristoJB

Frekuensi

Broca

5

Conduction

6

Anomic

11

DataMining

20

Latihan 12

10

8

6 Series1

4

2

0 Broca

KristoJB

Conduction

DataMining

Anomic

21

Latihan

23% Broca

50%

Conduction Anomic

27%

KristoJB

DataMining

22

Latihan • Interpretasi: – Jenis aphasia yang paling banyak diderita adalah anomic – Jenis aphasia yang paling sedikit diderita adalah broca – Penderita aphasia anomic: 50% – Dst...

KristoJB

DataMining

23

Latihan • Berikut adalah jumlah mahasiswa baru STT Musi dalam 10 tahun terakhir. – Buatlah deskripsi grafisnya – Interpretasikan hasil yang anda peroleh Tahun 2001

Jumlah 20

Tahun 2006

Jumlah 55

2002 2003 2004 2005

25 22 40 46

2007 2008 2009 2010

68 70 65 99

KristoJB

DataMining

24

Latihan

KristoJB

DataMining

25

Latihan • Interpretasi?

KristoJB

DataMining

26

Latihan Jumlah 2010

2009

2008 Jumlah

2007

2006

0

KristoJB

20

40

60

DataMining

80

100

120

27

Latihan • Interpretasi?

KristoJB

DataMining

28

Latihan

KristoJB

DataMining

29

Latihan • Interpretasi?

KristoJB

DataMining

30

Latihan

KristoJB

DataMining

31

Latihan • Interpretasi?

KristoJB

DataMining

32

KristoJB

DataMining

33

Latihan • Interpretasi?

KristoJB

DataMining

34

Latihan 120

100

80

60

40

20

0 Thn 2001

KristoJB

Thn 2002

Thn 2003

Thn 2004

Thn 2005

Thn 2006

DataMining

Thn 2007

Thn 2008

Thn 2009

Thn 2010

35

Latihan 4%

5%

19%

4% Thn 2001 8%

Thn 2002 Thn 2003 Thn 2004 Thn 2005

9%

13%

Thn 2006 Thn 2007 Thn 2008 Thn 2009

11%

Thn 2010

14% 13%

KristoJB

DataMining

36

Latihan • Berikut adalah jumlah mahasiswa baru STT Musi tahun 2009 dan 2010. – Buatlah deskripsi grafisnya – Interpretasikan hasil yang anda peroleh

Prodi TA TI IF SI

KristoJB

2009 10 15 25 20

2010

12 12 25 35

DataMining

2011 20 25 22 30

2012 25 27 20 32

37

Latihan

PRODI TA TI IF SI KristoJB

2009 10 15 25 20 DataMining

2010 12 12 25 35 38

Latihan • Berikut adalah jumlah mahasiswa baru STT Musi tahun 2009 dan 2010. – Buatlah deskripsi grafisnya – Interpretasikan hasil yang anda peroleh

2009

Prodi TA TI IF SI KristoJB

2010

Jumlah 10 15 25 20

Prodi TA TI IF SI DataMining

Jumlah 12 12 25 35 39

Latihan 40 35 30 25 Thn 2009

20

Thn 2010

15 10 5 0 TA

KristoJB

TI

IF

DataMining

SI

40

40 35 30 25 20

Tahun 2009

15

Tahun 2010

10 5 0

40 TA

TI

IF

SI

35 30 25 TA

20

TI

15

IF 10

SI

5 0 2009

2010 Tahun

KristoJB

DataMining

41

Latihan 40 35 30 25

TA TI

20

IF SI

15 10 5 0 Th 2009

KristoJB

Th 2010 DataMining

42

2009 Jumlah

TA TI IF SI

2010 Jumlah

TA TI IF SI

KristoJB

DataMining

43

Deskripsi Lokasi • Meskipun deskripsi grafis sudah menggambarkan karakteristik data, sifatnya masih terlalu kasar dan kurang praktis untuk dilakukan • Oleh karena itu kita meemerlukan sebuah angka yang cukup dapat mewakili data yang ada serta dapat diperoleh dengan cara yg lebih praktis • Deskripsi lokasi memberikan informasi tentang data berdasarkan posisi tertentu • Metoda deskripsi lokasi: mean, median, modus, kuartil, desil, persentil

KristoJB

DataMining

44

Rata-rata (Mean) • Rata-rata: membuat menjadi rata • Nilai perataan tersebut sering dianggap sebagai lokasi pusat, titik berat, atau titik kesetimbangan data • Secara matematis:

X

KristoJB

( x1



x

2

n

DataMining

xn)

n

x

i

i 1

n

45

Contoh • Data tinggi badan: – Wanita: 168, 164, 167, 164, 171, 166, 169, 172, 166, 166 – Pria: 175, 176, 183, 180, 177, 177, 182, 179, 179, 171 • Akan diperoleh: – Rerata tinggi badan wanita: 1673/10 = 167,3 – Rerata tinggi badan pria: 1779/10 = 177,9 – Rerata tinggi badan: 3452/20 = 172,6 KristoJB

DataMining

46

Contoh • Interpretasi: – Rata-rata tinggi badan wanita 167,3 – Wanita lebih pendek dari pria

KristoJB

DataMining

47

Latihan • Berikut adalah jumlah mahasiswa baru STT Musi dalam 10 tahun terakhir. – Carilah nilai rata-ratanya – Interpretasikan hasil yang anda peroleh Tahun 2001

Jumlah 20

Tahun 2006

Jumlah 55

2002 2003 2004 2005

25 22 40 46

2007 2008 2009 2010

68 70 65 99

KristoJB

DataMining

48

Latihan • Berikut adalah jumlah mahasiswa baru STT Musi tahun 2009 dan 2010. – Carilah nilai rata-ratanya berdasarkan jurusan – Carilah rata-ratanya berdasarkan tahun – Interpretasikan hasil yang anda peroleh 2009

Prodi TA TI IF SI KristoJB

2010

Jumlah 10 15 25 20

Prodi TA TI IF SI DataMining

Jumlah 12 12 25 35 49

Nilai Tengah (Median) • Dengan ukuran ini, kita mencari nilai observasi yang secara harafiah ‘bertempat di tengah-tengah’ • Langkah pertama: mengurutkan semua data dari yang terkecil sampai yang terbesar • Secara matematis: – Untuk jumlah data (n) ganjil: (n+1)/2 – Untuk jumlah data (n) genap: (data ke [n/2] + data ke [(n/2)+1])/2

KristoJB

DataMining

50

Contoh Data tinggi badan mahasiswa: • Data asli: 168, 164, 167, 164, 171, 166, 169, 172, 166, 166 • Data terurut: 164, 164, 166, 166, 166, 167, 168, 169, 171, 172 • Jumlah data genap, jadi • Median = (166+167)/2 = 166,5 • Interpretasi: ??

KristoJB

DataMining

51

Mean vs Median • Dibandingkan dengan rata-rata, penggunaan median tidak terlalu terpengaruh oleh adanya nilai ekstrem. • Sebaliknya rata-rata dapat terpengaruh oleh nilai ekstrem • Contoh, data teurut: – 164, 164, 166, 166, 166, 167, 168, 169, 171, 172

• Data termodifikasi: – 164, 164, 166, 166, 166, 167, 168, 169, 171, 1720

• Rata-rata: 332,1, median: 166,5

KristoJB

DataMining

52

Modus • Dengan ukuran ini, kita mencari nilai observasi yang paling sering muncul • Apabila terdapat dua atau lebih nilai yang jumlah kemunculannya sama, semua nilai tersebut juga disebut sebagai modus. • Contoh: – Data: 164, 164, 166, 166, 166, 167, 168, 169, 171, 172 – Modus: 166 (karena paling sering muncul) – Intepretasi??

• Modus mencerminkan lokasi kecenderungan data. KristoJB

DataMining

53

Latihan • Tentukan mean, median dan modus dari data berikut: • Interpretasikan hasil yang anda peroleh

KristoJB

DataMining

54

Latihan No

Tinggi

No

Tinggi

No

Tinggi

1

168

11

169

21

167

2

164

12

167

22

166

3

167

13

169

23

165

4

164

14

167

24

166

5

171

15

164

25

169

6

166

16

166

26

171

7

169

17

168

27

166

8

172

18

167

28

167

9

166

19

165

29

164

10

166

20

164

30

165

KristoJB

DataMining

55

Tugas No. 1 • Deskripsi lokasi (mean, median, modus) yang telah kita pelajari hanya dapat dipakai pada data yang tidak berkelompok. • Tugas anda: – Carilah rumus mean, median dan modus untuk data berkelompok. – Berikan contoh penggunaan mean, median, modus untuk data berkelompok

KristoJB

DataMining

56

Kuartil • Apabila kita berbicara tentang median, maka nilai ini seolah-olah membagi kelompok data menjadi 2 bagian yg sama. • Kuartil membagi kelompok data menjadi 4 bagian yang sama, dengan syarat jumlah data ≥ 4. • Nilai yang membagi kelompok data tersebut disebut: – Kuartil pertama (Q1) – Kuartil kedua (Q2) – Kuartil ketiga (Q3)

KristoJB

DataMining

57

Kuartil • Secara matematis:

Qi

i(n 1) nilai yang ke : , i 1,2,3 4

• Dimana n adalah jumlah data.

KristoJB

DataMining

58

Kuartil • Contoh: Berikut adalah data upah bulanan dari 13 karyawan (dalam ribu rupiah): 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100. Carilah nilai kuartilnya. • Penyelesaian: – Langkah 1: urutkan terlebih dahulu datanya: 30, 35, 40, 45, 50, 55, 60, 65, 70, 80, 85, 95, 100 – Langkah 2: hitung Q1: Q1 = nilai yg ke: i(n+1)/4 = 1(13+1)/4 = 3 ½ Jadi Q1 terletak diantara data ketiga dan keempat. Sehingga: Q1 = ½(data ke-3+data ke-4) = ½(40+45) = 42,5 – Langkah berikutnya: hitung Q2 dan Q3 (seperti Q1) KristoJB

DataMining

59

Desil • Apabila kuartil membagi kelompok data menjadi 4 bagian, maka desil membagi kelompok data menjadi 10 bagian. • Desil hanya dapat dipakai untuk kelompok data dengan jumlah data ≥ 10 • Secara matematis:

Di

KristoJB

i(n 1) nilai yang ke : , i 1,2,..,9 10 DataMining

60

Desil • Contoh: Berikut adalah data upah bulanan dari 13 karyawan (dalam ribu rupiah): 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100. Carilah nilai desilnya. • Penyelesaian: – Langkah 1: urutkan terlebih dahulu datanya: 30, 35, 40, 45, 50, 55, 60, 65, 70, 80, 85, 95, 100 – Langkah 2: hitung D1: D1 ...


Similar Free PDFs