Title | Data Mining |
---|---|
Author | K. Jawa Bendi |
Pages | 79 |
File Size | 5.5 MB |
File Type | |
Total Downloads | 247 |
Total Views | 732 |
Fungsi Deskripsi Data Mining Pertemuan 2, 3 R. Kristoforus JB, M.Cs. STT Musi Pengantar: Tinggi Badan Mahasiswa No Tinggi No Tinggi No Tinggi 1 168 11 169 21 167 2 164 12 167 22 166 3 167 13 169 23 165 4 164 14 167 24 166 5 171 15 164 25 169 6 166 16 166 26 171 7 169 17 168 27 166 8 172 18 167 28 16...
Accelerat ing t he world's research.
Data Mining Kristoforus Jawa Bendi
Related papers
Download a PDF Pack of t he best relat ed papers
MODUL DATA MINING FULL Reynaldi Moersas
Measurement and Comparison of Speed Dat a Processing In XML File by Using Naive Bayes algorit hm … Jalaludin Emilove Tugas Kelompok FP GROWT H 1. ngurah suariana
Fungsi Deskripsi
Data Mining Pertemuan 2, 3 R. Kristoforus JB, M.Cs. STT Musi
Pengantar: Tinggi Badan Mahasiswa No
Tinggi
No
Tinggi
No
Tinggi
1
168
11
169
21
167
2
164
12
167
22
166
3
167
13
169
23
165
4
164
14
167
24
166
5
171
15
164
25
169
6
166
16
166
26
171
7
169
17
168
27
166
8
172
18
167
28
167
9
166
19
165
29
164
10
166
20
164
30
165
KristoJB
DataMining
2
Pengantar • Ketika diberi sekumpulan data, terkadang agak sukar bagi kita untuk menangkap arti kumpulan data tersebut • Kumpulan data tersebut perlu dirangkum sedemikian rupa agar dapat ‘berbicara’, sehingga kita memiliki gambaran mengenai kumpulan data tersebut • Cara untuk menggambarkan data secara ringkas, disebut deskripsi • Deskripsi merupakan salah satu fungsi data mining KristoJB
DataMining
3
Pengantar Cara deskripsi: • Deskripsi grafis – Metoda dot-plot, Histogram, Pie-chart, stem-leaf
• Deskripsi lokasi – Rata-rata, Median, Modus, Kuartil, Desil, Persentil
• Deskripsi keragaman – Range, Varians, Standar Deviasi
KristoJB
DataMining
4
Dekripsi Grafis • Ada banyak cara untuk menggambarkan data dalam bentuk grafis. • Penggunaan metoda grafis sangat tergantung dari karakteristik data dan interpretasi yang diinginkan • Metoda deskripsi grafis antara lain: – – – – –
KristoJB
Dot-plot Buble-chart Histogram Pie-chart Stem-leaf
DataMining
5
Contoh: Tinggi Badan Mahasiswa No
Tinggi
No
Tinggi
No
Tinggi
1
168
11
169
21
167
2
164
12
167
22
166
3
167
13
169
23
165
4
164
14
167
24
166
5
171
15
164
25
169
6
166
16
166
26
171
7
169
17
168
27
166
8
172
18
167
28
167
9
166
19
165
29
164
10
166
20
164
30
165
KristoJB
DataMining
6
Metoda Dot-plot 173 172 171 170 169 168 167 166 165 164 163 0 KristoJB
5
10
15 DataMining
20
25
30
35 7
Metoda Dot plot • Pengetahuan apa yang dapat diperoleh dari gambaran data tersebut? – Titik cenderung berkumpul di angka 166 – 167, jadi kita dapat menyimpulkan kebanyakan mahasiswa bertinggi badan antara 166 – 167
KristoJB
DataMining
8
Metoda Buble chart 174 172
172; 1 171; 2
170 169; 4 168; 2
168 167; 6 166
166; 7 165; 3
164
164; 5
162 -1 KristoJB
0
1
2
3
4
5
DataMining
6
7
8
9
10 9
Metoda Histogram • Langkah 1: membuat beberapa interval dengan lebar yg sama • Langkah 2: hitung data yang menjadi anggota tiap interval • Langkah 3: membuat histogram • Perlu diingat bahwaa tidak semua kasus dapat menerapkan langkah yang sama. • Sangat tergantung dari kasus, data, dan interpretasi yang diinginkan
KristoJB
DataMining
10
Metoda Histogram Berdasarkan data contoh: • Langkah 1: Buat interval, misal: rentang interval 2. Interval 164 – 166 166 – 168 168 – 170 170 – 172 172 - 174
KristoJB
DataMining
11
Metoda Histogram • Langkah 2: hitung data yang menjadi anggota tiap interval
KristoJB
Interval
Frekuensi
164-166
8
166-168
13
168-170
6
170-172
2
172-174
1
DataMining
12
Metoda Histogram • Langkah 3: buat histogram 14 12 10 8 6 4 2 0 164-166 KristoJB
166-168
168-170 DataMining
170-172
172-174 13
Metoda Pie-chart • Langkah-langkah dalam metoda ini sama seperti pada histogram. • Yang berbeda hanyalah bentuk grafik data yang dihasilkan
KristoJB
DataMining
14
Metoda Pie-chart 7%
3% 27% 164-166 166-168 168-170 170-172 172-174
20%
43%
KristoJB
DataMining
15
Metoda Histogram & Pie-chart • Pengetahuan apa yang dapat diperoleh dari gambaran data tersebut? – Sebagian besar mahasiswa memliki tinggi badan antara 166 – 168 cm
KristoJB
DataMining
16
Metoda lain: Metoda Stem-leaf Tinggi
Frekuensi
164
5
165
3
166
7
167
6
168
2
169
4
171
2
172
1
KristoJB
DataMining
17
Latihan • Berikut adalah data 22 orang yang menderita aphasia dan jenisnya. – Buatlah histogram dan pie-chartnya – Interpretasikan hasil yang anda peroleh
KristoJB
DataMining
18
Latihan No
Jenis Aphasia
No
Jenis Aphasia
1
Broca
12
Broca
2 3 4 5
Anomic Anomic Conduction Broca
13 14 15 16
Anomic Broca Anomic Anomic
6 7 8 9 10 11
Conduction Conduction Anomic Conduction Anomic Conduction
17 18 19 20 21 22
Anomic Anomic Broca Anomic Conduction Anomic
KristoJB
DataMining
19
Latihan • Langkah hitung jumlah penderita untuk setiap jenis aphasia Jenis Aphasia
KristoJB
Frekuensi
Broca
5
Conduction
6
Anomic
11
DataMining
20
Latihan 12
10
8
6 Series1
4
2
0 Broca
KristoJB
Conduction
DataMining
Anomic
21
Latihan
23% Broca
50%
Conduction Anomic
27%
KristoJB
DataMining
22
Latihan • Interpretasi: – Jenis aphasia yang paling banyak diderita adalah anomic – Jenis aphasia yang paling sedikit diderita adalah broca – Penderita aphasia anomic: 50% – Dst...
KristoJB
DataMining
23
Latihan • Berikut adalah jumlah mahasiswa baru STT Musi dalam 10 tahun terakhir. – Buatlah deskripsi grafisnya – Interpretasikan hasil yang anda peroleh Tahun 2001
Jumlah 20
Tahun 2006
Jumlah 55
2002 2003 2004 2005
25 22 40 46
2007 2008 2009 2010
68 70 65 99
KristoJB
DataMining
24
Latihan
KristoJB
DataMining
25
Latihan • Interpretasi?
KristoJB
DataMining
26
Latihan Jumlah 2010
2009
2008 Jumlah
2007
2006
0
KristoJB
20
40
60
DataMining
80
100
120
27
Latihan • Interpretasi?
KristoJB
DataMining
28
Latihan
KristoJB
DataMining
29
Latihan • Interpretasi?
KristoJB
DataMining
30
Latihan
KristoJB
DataMining
31
Latihan • Interpretasi?
KristoJB
DataMining
32
KristoJB
DataMining
33
Latihan • Interpretasi?
KristoJB
DataMining
34
Latihan 120
100
80
60
40
20
0 Thn 2001
KristoJB
Thn 2002
Thn 2003
Thn 2004
Thn 2005
Thn 2006
DataMining
Thn 2007
Thn 2008
Thn 2009
Thn 2010
35
Latihan 4%
5%
19%
4% Thn 2001 8%
Thn 2002 Thn 2003 Thn 2004 Thn 2005
9%
13%
Thn 2006 Thn 2007 Thn 2008 Thn 2009
11%
Thn 2010
14% 13%
KristoJB
DataMining
36
Latihan • Berikut adalah jumlah mahasiswa baru STT Musi tahun 2009 dan 2010. – Buatlah deskripsi grafisnya – Interpretasikan hasil yang anda peroleh
Prodi TA TI IF SI
KristoJB
2009 10 15 25 20
2010
12 12 25 35
DataMining
2011 20 25 22 30
2012 25 27 20 32
37
Latihan
PRODI TA TI IF SI KristoJB
2009 10 15 25 20 DataMining
2010 12 12 25 35 38
Latihan • Berikut adalah jumlah mahasiswa baru STT Musi tahun 2009 dan 2010. – Buatlah deskripsi grafisnya – Interpretasikan hasil yang anda peroleh
2009
Prodi TA TI IF SI KristoJB
2010
Jumlah 10 15 25 20
Prodi TA TI IF SI DataMining
Jumlah 12 12 25 35 39
Latihan 40 35 30 25 Thn 2009
20
Thn 2010
15 10 5 0 TA
KristoJB
TI
IF
DataMining
SI
40
40 35 30 25 20
Tahun 2009
15
Tahun 2010
10 5 0
40 TA
TI
IF
SI
35 30 25 TA
20
TI
15
IF 10
SI
5 0 2009
2010 Tahun
KristoJB
DataMining
41
Latihan 40 35 30 25
TA TI
20
IF SI
15 10 5 0 Th 2009
KristoJB
Th 2010 DataMining
42
2009 Jumlah
TA TI IF SI
2010 Jumlah
TA TI IF SI
KristoJB
DataMining
43
Deskripsi Lokasi • Meskipun deskripsi grafis sudah menggambarkan karakteristik data, sifatnya masih terlalu kasar dan kurang praktis untuk dilakukan • Oleh karena itu kita meemerlukan sebuah angka yang cukup dapat mewakili data yang ada serta dapat diperoleh dengan cara yg lebih praktis • Deskripsi lokasi memberikan informasi tentang data berdasarkan posisi tertentu • Metoda deskripsi lokasi: mean, median, modus, kuartil, desil, persentil
KristoJB
DataMining
44
Rata-rata (Mean) • Rata-rata: membuat menjadi rata • Nilai perataan tersebut sering dianggap sebagai lokasi pusat, titik berat, atau titik kesetimbangan data • Secara matematis:
X
KristoJB
( x1
x
2
n
DataMining
xn)
n
x
i
i 1
n
45
Contoh • Data tinggi badan: – Wanita: 168, 164, 167, 164, 171, 166, 169, 172, 166, 166 – Pria: 175, 176, 183, 180, 177, 177, 182, 179, 179, 171 • Akan diperoleh: – Rerata tinggi badan wanita: 1673/10 = 167,3 – Rerata tinggi badan pria: 1779/10 = 177,9 – Rerata tinggi badan: 3452/20 = 172,6 KristoJB
DataMining
46
Contoh • Interpretasi: – Rata-rata tinggi badan wanita 167,3 – Wanita lebih pendek dari pria
KristoJB
DataMining
47
Latihan • Berikut adalah jumlah mahasiswa baru STT Musi dalam 10 tahun terakhir. – Carilah nilai rata-ratanya – Interpretasikan hasil yang anda peroleh Tahun 2001
Jumlah 20
Tahun 2006
Jumlah 55
2002 2003 2004 2005
25 22 40 46
2007 2008 2009 2010
68 70 65 99
KristoJB
DataMining
48
Latihan • Berikut adalah jumlah mahasiswa baru STT Musi tahun 2009 dan 2010. – Carilah nilai rata-ratanya berdasarkan jurusan – Carilah rata-ratanya berdasarkan tahun – Interpretasikan hasil yang anda peroleh 2009
Prodi TA TI IF SI KristoJB
2010
Jumlah 10 15 25 20
Prodi TA TI IF SI DataMining
Jumlah 12 12 25 35 49
Nilai Tengah (Median) • Dengan ukuran ini, kita mencari nilai observasi yang secara harafiah ‘bertempat di tengah-tengah’ • Langkah pertama: mengurutkan semua data dari yang terkecil sampai yang terbesar • Secara matematis: – Untuk jumlah data (n) ganjil: (n+1)/2 – Untuk jumlah data (n) genap: (data ke [n/2] + data ke [(n/2)+1])/2
KristoJB
DataMining
50
Contoh Data tinggi badan mahasiswa: • Data asli: 168, 164, 167, 164, 171, 166, 169, 172, 166, 166 • Data terurut: 164, 164, 166, 166, 166, 167, 168, 169, 171, 172 • Jumlah data genap, jadi • Median = (166+167)/2 = 166,5 • Interpretasi: ??
KristoJB
DataMining
51
Mean vs Median • Dibandingkan dengan rata-rata, penggunaan median tidak terlalu terpengaruh oleh adanya nilai ekstrem. • Sebaliknya rata-rata dapat terpengaruh oleh nilai ekstrem • Contoh, data teurut: – 164, 164, 166, 166, 166, 167, 168, 169, 171, 172
• Data termodifikasi: – 164, 164, 166, 166, 166, 167, 168, 169, 171, 1720
• Rata-rata: 332,1, median: 166,5
KristoJB
DataMining
52
Modus • Dengan ukuran ini, kita mencari nilai observasi yang paling sering muncul • Apabila terdapat dua atau lebih nilai yang jumlah kemunculannya sama, semua nilai tersebut juga disebut sebagai modus. • Contoh: – Data: 164, 164, 166, 166, 166, 167, 168, 169, 171, 172 – Modus: 166 (karena paling sering muncul) – Intepretasi??
• Modus mencerminkan lokasi kecenderungan data. KristoJB
DataMining
53
Latihan • Tentukan mean, median dan modus dari data berikut: • Interpretasikan hasil yang anda peroleh
KristoJB
DataMining
54
Latihan No
Tinggi
No
Tinggi
No
Tinggi
1
168
11
169
21
167
2
164
12
167
22
166
3
167
13
169
23
165
4
164
14
167
24
166
5
171
15
164
25
169
6
166
16
166
26
171
7
169
17
168
27
166
8
172
18
167
28
167
9
166
19
165
29
164
10
166
20
164
30
165
KristoJB
DataMining
55
Tugas No. 1 • Deskripsi lokasi (mean, median, modus) yang telah kita pelajari hanya dapat dipakai pada data yang tidak berkelompok. • Tugas anda: – Carilah rumus mean, median dan modus untuk data berkelompok. – Berikan contoh penggunaan mean, median, modus untuk data berkelompok
KristoJB
DataMining
56
Kuartil • Apabila kita berbicara tentang median, maka nilai ini seolah-olah membagi kelompok data menjadi 2 bagian yg sama. • Kuartil membagi kelompok data menjadi 4 bagian yang sama, dengan syarat jumlah data ≥ 4. • Nilai yang membagi kelompok data tersebut disebut: – Kuartil pertama (Q1) – Kuartil kedua (Q2) – Kuartil ketiga (Q3)
KristoJB
DataMining
57
Kuartil • Secara matematis:
Qi
i(n 1) nilai yang ke : , i 1,2,3 4
• Dimana n adalah jumlah data.
KristoJB
DataMining
58
Kuartil • Contoh: Berikut adalah data upah bulanan dari 13 karyawan (dalam ribu rupiah): 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100. Carilah nilai kuartilnya. • Penyelesaian: – Langkah 1: urutkan terlebih dahulu datanya: 30, 35, 40, 45, 50, 55, 60, 65, 70, 80, 85, 95, 100 – Langkah 2: hitung Q1: Q1 = nilai yg ke: i(n+1)/4 = 1(13+1)/4 = 3 ½ Jadi Q1 terletak diantara data ketiga dan keempat. Sehingga: Q1 = ½(data ke-3+data ke-4) = ½(40+45) = 42,5 – Langkah berikutnya: hitung Q2 dan Q3 (seperti Q1) KristoJB
DataMining
59
Desil • Apabila kuartil membagi kelompok data menjadi 4 bagian, maka desil membagi kelompok data menjadi 10 bagian. • Desil hanya dapat dipakai untuk kelompok data dengan jumlah data ≥ 10 • Secara matematis:
Di
KristoJB
i(n 1) nilai yang ke : , i 1,2,..,9 10 DataMining
60
Desil • Contoh: Berikut adalah data upah bulanan dari 13 karyawan (dalam ribu rupiah): 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100. Carilah nilai desilnya. • Penyelesaian: – Langkah 1: urutkan terlebih dahulu datanya: 30, 35, 40, 45, 50, 55, 60, 65, 70, 80, 85, 95, 100 – Langkah 2: hitung D1: D1 ...