IMPLEMENTASI DATA MINING DALAM PENYUSUNAN BUKU DI PERPUSTAKAAN DENGAN METODE ASSOCIATION RULE PDF

Title IMPLEMENTASI DATA MINING DALAM PENYUSUNAN BUKU DI PERPUSTAKAAN DENGAN METODE ASSOCIATION RULE
Author A. Hastaka
Pages 17
File Size 137.1 KB
File Type PDF
Total Downloads 228
Total Views 261

Summary

IMPLEMENTASI DATA MINING DALAM PENYUSUNAN BUKU DI PERPUSTAKAAN DENGAN METODE ASSOCIATION RULE Ardiant Yosa Hastaka – A11.2012.07102 Ernanda Hananto Seno – A11.2012.07109 Program Studi Teknik Informatika Fakultas Ilmu Komputer Universitas Dian Nuswantoro [email protected]/ [email protected] A...


Description

IMPLEMENTASI DATA MINING DALAM PENYUSUNAN BUKU DI PERPUSTAKAAN DENGAN METODE ASSOCIATION RULE Ardiant Yosa Hastaka – A11.2012.07102 Ernanda Hananto Seno – A11.2012.07109 Program Studi Teknik Informatika Fakultas Ilmu Komputer Universitas Dian Nuswantoro [email protected]/ [email protected]

Abstrak: Akumul asi data yang saat ini sangat cepat dan signifikan, hanya saja persoalan yang diperoleh adalah karena kuranganya informasi yang digunakan dalam pengolahannya. Data mining adalah sebuah proses penggalian data dan mengolahnya dengan metode-metode tertentu yang akan digunakan untuk mengolah data yang besar agar memperoleh sebuah hasil yang optimah atau diinginkan. Penggalian data akan dimulai dari sample peminjaman buku perpustakaan yang saling berkaitan satu sama lain sehingga akan memperoleh hasil sebuah penyusunan buku yang sesuai dengan tingkat support dan confidence. Keyword : data mining, association rule, support and confidence.

A. PENDAHULUAN Kemajuan teknologi saat ini sangatlah cepat, keakuratan dalam pengumpulan informasi menjadi kebutuhan penting dalam keseharian atau rutinitas yang dijalani, sehingga informasi dapat menjadi kebutuhan yang dapat digunakan dalam wantu yang mendatang sebagai data cadangan dalam proses membuat sebuah evolusi dari sebuah sistem informasi. Hanya saja dalam pengumpulan datanya tidak seimbang dengan informasi yang didapat, sehingga informasi yang diperlukan perlu digali ulang demi menemukan sebuah kesimpulan yang nyata, sebab itulah diperlukan teknologi informasi yang dapat menampung data yang besar untuk mengolah informasi secara cepat dan ringkas. Berbeda dengan pengolahan informasi secara tradisional yang tidak dapat mengolah data yang besar. Penggunaan data yang akan diterapkan dalam proses pengambilan keputusan tidak hanya harus dengan data operasional saja, melainkan proses analisis suatu data untuk menggali sebuah informasi baru untuk mengoptimalkan sebuah pengambilan keputusan. Dalam pengolahan analisis yang dibutuhkan akan menggunakan teknik-yeknik yang dibutuhkan. Teknik-teknik yang sangat banyak itu akan dipilih salah satu yang sesuai untuk menentukan hasil akhir dalam pengambilan keputusan. Ilmu yang digunakan untuk

Ardiant Yosa H dan Ernanda HS : Implementasi Data Mining . . . . .

mengambil keputusan yang akan memberikan pola-pola penting sehingga akan menghasilkan sebuah data yang sesuai adalah Data Mining. Dalam perpustakaan, disediakan berbagai buku-buku yang digunakan oleh semua orang dalam mencari informasi. Hanya saja terkadang dalam perncarian bukunya mengalami kendala dalam letak buku yang susah untuk ditemukan. Oleh sebab itu diperlukan data mining dalam menentukan susunan buku di perpustakaan yang pada akhirnya akan memudahkan peminjam untuk menemukan buku-buku yang dibutuhkan.

1.1 Rumusan Masalah Permasalahan yang akan dibahas dalam hal ini adalah : 1. Bagaimana mengolah data peminjaman buku di perpustakaan sehingga menjadikannya sebuah informasi yang berguna. 2. Bagaimana cara mengukur tingkat support dan confidence dari data peminjaman buku yang pada akhirnya akan menjadi pola penyusunan buku yang lebih baik.

1.2 Tujuan Penelitian Tujuan yang akan dicapai dalam penelitian ini adalah : 1. Mengolah data peminjaman buku diperpustakaan sehingga menjadikannya sebuah informasi yang berguna. 2. Pengukuran tingkat support dan confidence dari data peminjaman buku yang akan merubah pola penyusunan buku di perpustakaan menjadi lebih baik.

B. DATA WAREHOUSE Data warehouse merupakan penyimpanan data yang berorientasi objek, terintegrasi, mempunyai varian wantu dan menyimpan data dalam bentuk nonvolatile sebagai pendukung manajemen dalam proses pengambilan keputusan. (Han. 2006). Data warehouse adalah sebuah sistem yang mengambil dan menggabungkan data secara periodik dari sistem sumber data ke penyimpanan data bentuk dimensional atau normal (Reinardi, 2008). Data warehouse mempunyai berbagai dimendi yang berjalan langsung dalam penyatuan dan penggambungan datanya, atau bisa disebut sebagai multidimensi. Pembangunan datanya meliputi pembersihan data, penyatuan data dan tranformasi data, serta dapat dilihat sebagai praproses yang sangat penting untuk digunakan dalam data mining. 2

Ardiant Yosa H dan Ernanda HS : Implementasi Data Mining . . . . .

Data warehouse memiliki empat karakteristik meliputi : 1. Subject Oriented : data warehouse disusun dalam subjek utama, seperti pelanggan, suplier, produk, dan sales. Data warehous fokus pada permodelan dan analisis data untuk pembuat keputusan, meskipun data warehouse terkonsentrasi pada operasi harian dan proses transaksi dalam perusahaan. Oleh karena ini data warehouse mempunyai karakter yang menyediakan secara singkat dan sederhana gambaran seputar subjact lebih detail yang dibuat dari data luar yang tidak berguna dalam proses pendukung keputusan. 2. Integrated : data warehouse biasanya dibangun dari bermacam-macam sumber yang berbeda, seperti database relasional, flat files, dan on-line transaction record. Pembersihan dan penyatuan data diterapkan untuk menjamin konsistensi dalam penamaan, struktur kode, ukuran atribut, dan yang lainnya. 3. Time Varian : data disimpan untuk menyajikan informasi dari sudut pandang masa lampau (misal 4 – 6 tahun yang lalu). Setiam struktur kunci dalam data warehouse mempunyai elemen waktu baik secara implisit maupun eksplisit. 4. Nonvolatile : sebuah data warehouse secara fisik selalu disimpan terpisah dari data aplikasi operasional. Penyimpanan yang terpisah ini, data warehouse tidak memerlukan proses transaksi, recovery dan mekanisme pengendalian konkurensi. Biasanya memerlukan dua operasi dalam akses data yaitu initial load of data dan access of data. Dari pengertian tersebut, sebuah data warehouse merupakan penyimpanan data tetap sebagai implementasi fisik dari pendukung keputusan model data. Data warehouse juga biasanya dilihat sebagai arsitektur, pembangunan dan penyatuan data dari bermacammacam sumber data yang berbeda untuk mendukung struktur dan atau query tertentu, laporan analisis, dan pembuatan keputusan.

C. DATA MINING Data mining adalah aktifitas menggali data dari kumpulan data yang sangat besar untuk membangun sebuag informasi yang memiliki kegunaan tersendiri sesuai kebutuhan. Data mining juga disebut sebagai serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data (Pramudiono, 2007). Data mining sering juga disebut sebagai Knowlegde Discovery In Database (KDD). KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk 3

Ardiant Yosa H dan Ernanda HS : Implementasi Data Mining . . . . .

menemukan keteraturan, pola atau hubungan dalam set data yang berukuran besar (Santoso, 2007). Data mining adalah kegiatan menemukan pola yang menarik dari data dalam jumlah besar, data dapat disimoan dalam database, data warehouse , atau penyimpanan informasi lainnya. Data mining berkaitan dengan bidang ilmu-ilmu lain, seperti database system, data warehouseing, statistik, machine learning, information retrival, dan komputasi tingkat tinggi. Selain itu, data mining didukung oleh ilmu lain seperti neural network, pengenalan pola, spatian data analys, image database, sihnal processing (HAN, 2006). Data mining didefinisikan sebagai proses menemukan pola-pola dalam data. Proses ini otomatis atau seringnya semiotomatis (Witten, 2005). Pola yang ditemukan harus berarti dan memberikan keuntungan yang beragam. Data meining memiliki karakteristik sebagai berikut : 1. Data mining berhubungan dengan menemuan sesuatu yang tersembunyi dan pola tertentu yang tidak diketahui sebelumnya. 2. Data mining biasa menggunakan data besat. Biasanya data yang besar digunakan untuk membuat hasil lebih dipercaya. 3. Data mining berguna untuk membuat keputusan yang kritis, terutama dalam strategi (Davies, 2004). Dari beberapa pengertian tersebut dapat ditarik kesimpulan bahwa data mining adalah teknik menggali informasi dari sesuatu data yang tersembunyi terhadap suatu data yang besar sehingga akan memberikan sebuah pola yang akhirnya akan digunakan dalam negolah data yang lebih baik lagi berpacu dalam berbagai lmu-ilmu yang dibutuhkan untuk mengolah datanya.

D. TAHAP-TAHAP DATA MINING Tahap-tahap data ming ada 7 (tujuh) yaitu : 1. Pembersihan Data (data cleaning) Pembersihan data adalah proses untuk mneghilangkan data-data yang tidak relevan. Data-data yang dibuang terkadang dibandingkan terlebih dahulu dengan hipotesa yang telah dibuat. Sehingga pada proses selanjutnya dapat dengan mudah menemukan hasil yang diinginkan. 2. Integrasi data (data integration)

4

Ardiant Yosa H dan Ernanda HS : Implementasi Data Mining . . . . .

Integrasi data merupakan penggabungan data dari berbagai database kedalam satu database baru. Tidak jarang data yang diperlukan diambil dari beberapa database atau teks file. 3. Seleksi data (data selection) Data yang sudah ada di database seringkali tidak semuanya dibutuhkan, maka dari itu dibutuhkan penyeleksian data untuk data yang benar-benar dibutuhkan dalam proses selanjutnya. 4. Transformasi data (data trasnformation) Data digabung atau diubah sesuai dengan proses yang digunakan dalam data mining. Karena beberapa format data mining membutuhkan format data yang khusus dalam pemrosesannya. 5. Proses mining Adalah proses menggali data dari sebuah database atau kumpulan data untuk memperoleh informasi yang tersembunyi dari data yang diolah. 6. Evaluasi Pola (pattern evaluation) Dalam proses ini adalah hasil dari teknin data mining berupa pola-pola yang akan diujia pada hipotesa yang sudah dibuat sebelumnya. Sehingga akan memperoleh kesimpulan-kesimpulan yang mendekati hasil atau hipotesa untuk proses selanjutnya. 7. Presentasi pengetahuan (knowlegde presentation) Adalah visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperolah pengetahuan yang peroleh pengguna. Termasuk dalam langkah akhir dari data mining adalah mengimplementasikan analisis yang didapat. Sehingga akan memperoleh kesimpulan real. (Han, 2006).

E. SUPPORT DAN CONFIDENCE a. Support, adalah suatu ukurang yang menunjukan seberapa besar tingkat dominasi suatu item atau ItemSet dari s=keseluruhan transaksi. b. Confidence, suatu ukuran yang menunjukan hubungan antar dua item secara conditional.

F. ASSOCIATION RULES METHOD Association rule (aturan asosiasi) atau affinity analysis (analisis afinitas) berkenaan dengan studi tentang “apa bersama apa”. Sebagai contoh dapat berupa studi kasus di 5

Ardiant Yosa H dan Ernanda HS : Implementasi Data Mining . . . . .

perpustakaan, misalnya seorang mahasiswa yang meminjam komik juga meminjam novel. Pada kasus ini berarti komik bersama dengan novel. Karena awalnya berasal dari studi tentang database transaksi peminjaman untuk menentukan kebiasaan suatu buku yang dipinjam bersama buku yang lainnya, maka aturan asosiasi juga sering dinamakan market basket analysis(Santoso, 2007). Informasi yang diberikan dalam Association rule adalah dalam bentuk “if-then” atau “jika-maka”. Aturan ini dihitung dari data yang sifatnya probabilistik analisis asosiasi, dikenal juga sebagai salah satu metode data mining yang menjadi dasar dari berbagai metode data mining lainnya. Salah satu tahap dari analisis asosiasi yang disebut analisis pola frekuensi tinggi (frequent pattert mining) menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien. Penting tidaknya suatu association rule dapat diketahui dengan dua parameter, support (penunjang) yaitu prosentase kombinasi item tersebut, dan confitence (nilai kepastian) yaitu kuatnya hubungan antar item dalam association rule. Associsation analysis didefinisikan suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence) (Pramudiono, 2007). Dalam asosiasi terdapat istilah antesendent dan consequent, antecendent untuk mewakili bagian “jika” dan consequent untuk mewakili bagian “maka”. Sehingga antesendent dan consequent adalah sekelompok item yang tidak punya hubungan secara bersama (Santosa, 2007).

=





�+

�=�





�+

∑ �

=

∑ ��+�� . . . . . . . . (2.1) ∑�

= Jumlah transaksi yang mengandung antacendent dan consequent

= Jumlah Transaksi



�=

∑ ��+�� . . . . . . . . (2.2) ∑ ��

= Jumlah transaksi yang mengandung antacendent dan consequent

= Jumlah Transaksi yang mengandung antecendent 6

Ardiant Yosa H dan Ernanda HS : Implementasi Data Mining . . . . .

G. ANALISIS DAN PERANCANGAN Tabel 1 berikut merupakan tebel contoh transaksi peminjaman buku menggunakan data fiktif. Hal ini dimaksudkan untuk memberikan gambaran bagaimana malakukan penggalian data sehingga menghasilkan association rule.

Tabel 1 . Tabel Transaksi Peminjaman Buku di Perpustakaan No

Nama

1

ARDIANT

2

YOSA

3

ERNANDA NANDA

4

ANANG SIANANG

5

EKO PIEREKO

6

YUNINDYO

7

FARHAN GHIFARI

8

DIMAS

9

DIKA BUDI

10

ANDHIKA RIDHO

Buku yang dipinjam Teknik Dasar

Pemrograman

Pemrograman C

Informatika

Java

dan C++

Pemrograman

Teknik Dasar

Animasi SDL

C dan C++

Informatika

2D

Animasi SDL

Teknik Dasar

2D

Informatika

Pemrograman

Pemrograman

Teknik Dasar

Internet

C dan C++

Informatika

Pemrograman

Pemrograman

Pemrograman

C dan C++

Java

Internet

Animasi SDL

Teknik Dasar

Pemrograman

2D

Informatika

Internet

Pemrograman

Pemrograman

Pemrograman

Java

C dan C++

Internet

Komputer

Animasi SDL

Tutorial Adobe

Grafik

2D

After Effect

Tutorial Adobe

Animasi SDL

Komputer

After Effect

2D

Grafik

Pemrograman

Pemrograman

Pemrograman

Java

C dan C++

Internet

Komik

Untuk melakukan penggalian dari data transaksi peminjaman buku diatas, penulis menggunakan sebuah algoritma yang menjadi dasar dari algoritma-algoritma yang lain yaitu algoritma Market Basket Analysis (MBA). Ada tiga langkah besar.

7

Ardiant Yosa H dan Ernanda HS : Implementasi Data Mining . . . . .

1. Langkah pertama dalam algoritma MBA yaitu menetapkan besarnya besaran nilai minimum support dan confidence. Dalam hal ini penulis menetapkan besaran support = 3 dan confidence = 50%. 2. Langkah kedua yaitu dengan menyusuri semua frequent ItemSet yaitu ItemSet yang memiliki minimum support = 3 yang telah ditetapkan sebelumnya. Kita akan memulai dengan membahas setiap frequent 1 – ItemSet yang terdapat pada Tabel 2 berikut ini. Tabel 2. Daftar 1 ItemSet No

ItemSet

Support

1

Teknik Dasar Informatika

5

2

Pemrograman Java

4

3

Pemrograman C dan C++

6

4

Pemrograman Internet

5

5

Komik

1

6

Animasi SDL 2D

5

7

Tutorial Adobe Afterefect

2

8

Komputer Grafik

2

Dari Tabel 2 diatas dapat dilihat item apa saja yang memiliki support = 3. Itemitem yang memenuhi minimum support disebut frequenty 1-ItemSet. Yang ada pada Tabel 3 berikut . Tabel 3. Daftar Frequent 1 ItemSet No

ItemSet

Support

1

Teknik Dasar Informatika

5

2

Pemrograman Java

4

3

Pemrograman C dan C++

6

4

Pemrograman Internet

5

5

Animasi SDL 2D

5

Dari daftar frequent diatas akan dibuat lagi menjadi daftar calon frequent 2 – ItemSet, seperti pada Tabel 4 dibawah ini.

8

Ardiant Yosa H dan Ernanda HS : Implementasi Data Mining . . . . .

Tabel 4. Calon Daftar frequent 2 - ItemSet No 1

2

3

4

5

6

7

8

9

10

ItemSet

Support

Teknik Dasar Informatika,

1

Pemrograman Java Teknik Dasar Informatika,

3

Pemrograman C dan C++ Teknik Dasar Informatika,

1

Pemrograman Internet Teknik Dasar Informatika,

3

Animasi SDL 2D Pemrograman Java,

4

Pemrograman C dan C++ Pemrograman Java,

3

Pemrograman Internet Pemrograman Java,

0

Animasi SDL 2D Pemrograman C dan C++,

4

Pemrograman Internet Pemrograman C dan C++,

1

Animasi SDL 2D Pemrograman Internet,

1

Animasi SDL 2D

Dari calon diatas dapat dibuat frequent 2 – ItemSet sebagai Tabel 5 berikut . Tabel 5. Daftar frequent 2 - ItemSet No 1

2

3

ItemSet Teknik Dasar Informatika, Pemrograman C dan C++ Teknik Dasar Informatika, Animasi SDL 2D Pemrograman Java, Pemrograman C dan C++

Support 3

3

4

9

Ardiant Yosa H dan Ernanda HS : Implementasi Data Mining . . . . .

4

5

Pemrograman Java,

3

Pemrograman Internet Pemrograman C dan C++,

4

Pemrograman Internet

Kemudian dibuat kembali calon daftar frequent 3 ItemSet seperti Tabel 6 berikut . Tabel 6. Daftar frequent 3 - ItemSet No

ItemSet

Support

Teknik Dasar Informatika, 1

Pemrograman Java,

1

Pemrograman C dan C++ Teknik Dasar Informatika, 2

Pemrograman Java,

0

Pemrograman Internet Teknik Dasar Informatika, 3

Pemrograman Java,

0

Animasi SDL 2D Teknik Dasar Informatika, 4

Pemrograman C dan C++,

1

Pemrograman Internet Teknik Dasar Informatika, 5

Pemrograman C dan C++,

1

Animasi SDL 2D Teknik Dasar Informatika, 6

Pemrograman Internet,

1

Animasi SDL 2D Pemrograman Java, 7

Pemrograman C dan C++,

3

Pemrograman Internet Pemrograman Java, 8

Pemrograman C dan C++,

0

Animasi SDL 2D

10

Ardiant Yosa H dan Ernanda HS : Implementasi Data Mining . . . . .

Pemrograman Java, 9

0

Pemrograman C dan C++, Animasi SDL 2D Pemrograman C dan C++,

10

0

Pemrograman Internet, Animasi SDL 2D

Dari calon daftar diatas akan mendapatkan hasil menjadi frequent 3 ItemSet pada Tabel 7 berikut . Tabel 6. Daftar frequent 3 - ItemSet No

ItemSet

Support

Pemrograman Java, Pemrograman C dan C++,

1
...


Similar Free PDFs