DATA MINING UNTUK ANALISA TINGKAT KEJAHATAN JALANAN DENGAN ALGORITMA ASSOCIATION RULE METODE APRIORI PDF

Title	DATA MINING UNTUK ANALISA TINGKAT KEJAHATAN JALANAN DENGAN ALGORITMA ASSOCIATION RULE METODE APRIORI
Author	Elek Yo Ben
Pages	11
File Size	1.8 MB
File Type	PDF
Total Downloads	541
Total Views	777

Preview

CLICK TO PREVIEW PDF

Summary

Description

Volume : III, Nomor : 1, Mei 2014

Majalah Ilmiah

Informasi dan Teknologi Ilmiah (INTI) ISSN : 2339-210X

DATA MINING UNTUK ANALISA TINGKAT KEJAHATAN JALANAN DENGAN ALGORITMA ASSOCIATION RULE METODE APRIORI (Studi Kasus Di Polsekta Medan Sunggal) Fadlina Pasca Sarjana Ilmu Komputer Universitas Putra Indonesia “YPTK” PADANG Alamat : Jl. Raya Lubuk Begalung Padang, Sumatera Barat No. Telepon : (0751) 776666-72472-730000, Fax : (0751) 71973 Website : http://upi-yptk.ac.id // Email : [email protected] Abstrack Data mining, or often referred to as knowledge discovery in databases (KDD) is acollection of activities that include, the use of historical data to discoverregularities,patterns or relationships in large data. In this thesis data mining is used to analyze the level of street crime. This technique aims to provide information about the area and the potential for street crime that can assist the police in anticipation of a crime that often appears, was done by using analysis of habit how often do street crimes. Detection of crime which often occur simultaneously called association rule (association rules). Algorithm that can be used to find Apriori association rule is. Apriori algorithm is the association rule mining through multiple scan data sets, find a relationship between the variables and present a strong rule in a large database. The data is taken as a case study of street crime data Polsekta Sunggal Medan. Test data using data mining software Tanagra and Microsoft Excel for data storage. Results from a combination of patterns and rules obtained to provide information that could be followed up or contain important information that can be utilized to enhance the security and sensitivity of street crime. Keywords: Data mining, Association rules, Apriori, Knowledge Discovery in Database 1. Pendahuluan 1.1. Latar Belakang Masalah Perkembangan jaman berdampak pada perkembangan masyarakat, perilaku, maupun pergeseran budaya. Terjadinya peningkatan kepadatan penduduk, pengangguran bertambah, kemiskinan yang mengakibatkan tingginya angka kriminalitas terutama di daerah urban yang padat. Makaampoh, (2013) dalam penelitiannya menyatakan tindak kekerasan dalam KUHP salah satunya adalah aksi kejahatan jalanan (Street Crime) seperti pencurian, pemerasan, pemerkosaan, penganiayaan, tindak kekerasan terhadap orang atau barang, perilaku Mabuk dimuka umum, yang tentunya dapat mengganggu ketertiban umum serta menimbulkan keresahan di masyarakat Kepolisian berkaitan dengan fungsinya sebagai pengayom masyarakat diharapkan mampu mengambil tindakan dalam menyikapi fenomena kejahatan jalanan dengan melakukan operasi razia dalam mengungkap kejahatan yang dapat dilakukan dengan menggunakan teknik analisis dari kebiasaan seberapa sering kejahatan jalanan dilakukan. Pendeteksian kejahatan yang sering terjadi secara bersamaan disebut association rule (aturan asosiasi). Wakabi-Waiswa dan Baryamureeba, (2008) menggunakan Association rule untuk mengekstrak atau menarik korelasi dari pola yang sering muncul atau struktur kasual antara set item dalam transaksi database atau repository data lainnya. Umarani dan Punithavalli, (2011) menggunakan Proses pertambangan aturan asosiasi

dari database yang besar menjadi dua langkah yaitu generasi itemset sering yang disebut minsupport dan association rule generation dari itemset sering, menghasilkan semua aturan asosiasi yang disebut minconfidence. Algoritma yang dapat digunakan untuk menemukan association rule adalah Apriori. Algoritma Apriori adalah aturan asosiasi pertambangan melalui beberapa scan set data, menemukan hubungan antara variabel dan menyajikan aturan yang kuat dalam database yang besar (Padmaja dan Poongodai, 2011). Dalam penelitian Prasad dan Malik, (2011) juga mengimplementasikan algoritma apriori untuk aturan dari dataset yang berisi transaksi penjualan toko ritel. Sedangkan dalam penelitian ini akan dilakukan pengujian apakah metode Association Rule dapat digunakan untuk menyelesaikan permasalahan pada data kejahatan jalanan. Data yang digunakan adalah daerah dan jenis kejahatan jalanan dari data statistik Polsek Medan Sunggal. Hasil dari penelitian ini diharapkan dapat memberikan informasi mengenai daerah dan potensi kejahatan jalanan yang dapat membantu pihak kepolisian dalam mengantisipasi kejahatan yang sering muncul. 1.2. Perumusan Masalah Berdasarkan uraian latar belakang, maka penulis merumuskan suatu permasalahan yaitu sebagai berikut: 1. Bagaimana menganalisa tingkat kejahatan jalanan untuk menemukan aturan assosiatif antara suatu kombinasi item dan membentuk

Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule   Metode Apriori. Oleh : Fadlina

144

Volume : III, Nomor : 1, Mei 2014

Majalah Ilmiah

Informasi dan Teknologi Ilmiah (INTI) ISSN : 2339-210X

2.

3.

pola kombinasi itemsets dengan menggunakan algoritma apriori? Bagaimana mengimplementasikan Data Mining dengan algoritma Association Rule untuk menganalisa tingkat kejahatan jalanan? Bagaimana faktor pendukung tersebut bisa dijadikan sebagai informasi dalam meningkatkan kewaspadaan masyarakat agar terhindar dari kejahatan di jalanan (Street Crime)?

1.3 Batasan Masalah Agar penulisan tesis tidak lepas dari latar belakang dan perumusan masalah, maka penulis membuat batasan masalahnya yaitu sebagai berikut : 1. Menggunakan data mining Association Rule untuk menghasilkan rules dan algoritma Apriori untuk menemukan pola kombinasi itemset 2. Data yang digunakan adalah data kejahatan jalanan (Street Crime) dan daerah kejahatan pada Polsekta Medan Sunggal. 3. Menggunakan aplikasi atau tools data mining Tanagra sebagai pengujian data. 1.4 Tujuan Penelitian Beberapa tujuan yang ingin dicapai dalam penelitian ini yaitu sebagai berikut: 1. Mengimplementasikan data mining Association Rule dan Algoritma Apriori pada kejahatan jalanan untuk mengekstrak ilmu pengetahuan, informasi penting dan menarik dari database. 2. Membentuk pola kombinasi itemsets dari data kejahatan jalanan dengan menggunakan algoritma Apriori . 3. Menghasilkan rules dari pola kombinasi itemsets yang interesting, sehingga dapat diketahui tingkat kejahatan jalanan apa yang sering dilakukan. 4. Merancang metode Association Rule untuk penanganan kejahatan jalanan sehingga dapat meningkatkan efektifitas dan efesiensi kinerja kepolisian. 5. Membangun suatu pengetahuan baru dalam menganalisa tingkat kejahatan sehingga dapat meningkatkan keamanan dan sensitifitas kejahatan. 6. Menguji Data kejahatan jalanan dengan menggunakan Tools Tanagra sehingga informasi ini dapat membantu kepolisian dalam mengatasi tingkat kriminaliatas. 2. Landasan Teori Landasan teori merupakan panduan untuk membahas tentang teori pemecahan masalah yang dihadapi. Dalam hal ini akan dikemukakan beberapa teori yang berhubungan dan relevan dengan masalah yang dibahas dalam penelitian ini. Teori-teori yang menjadi landasan dalam penulisan tesis ini antara lain teori Data Mining, Algoritma Appriori, dan pada tesis ini juga penulis

juga menyampaikan jenis dan bentuk dari algoritma Association Rule. 2.1 Data Mining Tahun 90-an telah melahirkan “gunungan” data di bidang ilmu pengetahuan, bisnis dan pemerintah. Kemampuan teknologi informasi untuk mengumpulkan dan menyimpan berbagai tipe data jauh meninggalkan kemampuan untuk menganalisis, meringkas dan mengekstraksi “pengetahuan” dari data. Metodologi tradisional untuk menganalisis data yang ada, tidak dapat menangani data dalam jumlah besar. Sementara para pelaku bisnis memiliki kebutuhan-kebutuhan untuk memanfaatkan gudang data yang sudah dimiliki, para peneliti melihat peluang untuk melahirkan sebuah teknologi baru yang menjawab kebutuhan ini, yaitu data mining. Teknologi ini sekarang sudah ada dan diaplikasikan oleh perusahaan perusahaan untuk memecahkan berbagai permasalahan bisnis dan juga untuk menggali pengetahuan baru dari bongkahan data 2.2. Defenisi Data Mining Data mining atau sering disebut sebagai knowledge discovery in database (KDD) adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam data berukuran besar. Keluaran data mining ini bisa dipakai untuk membantu pengambilan keputusan di masa depan. Pengembangan KDD ini menyebabkan penggunaan pattern recognition semakin berkurang karena telah menjadi bagian data mining (Subekti Mujiasih, 2011). Metode ini merupakan gabungan 4 (empat) disiplin ilmu yakni statistik, visualisasi, database, dan machine learning). Adapun machine learning adalah suatu area dalam artificial intelligence atau kecerdasan buatan yang berhubungan dengan pengembangan teknik-teknik pemrograman berdasarkan pembelajaran masa lalu dan bersinggungan dengan ilmu statistika dan juga optimasi. 2.3. Pengelompokan Data Mining Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan, yaitu (Kusrini dan Emha Taufiq Luthfi, 2009): 1. Deskripsi Terkadang peneliti dan analis secara sederhana ingin mencoba mencari data untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai contoh, petugas pengumpulan suara mungkin tidak dapat menentukan keterangan atau fakta bahwa siapa yang tidak cukup profesional akan sedikit didukung dalam pemilihan presiden. 2. Estimasi Estimasi hampir sama dengan klasifikasi, kecuali variabel target estimasi lebih kearah numerik dari

Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule   Metode Apriori. Oleh : Fadlina

145

Volume : III, Nomor : 1, Mei 2014

Majalah Ilmiah

Informasi dan Teknologi Ilmiah (INTI) ISSN : 2339-210X

pada kearah kategori. Model dibangun menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai prediksi. Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat berdasarkan nilai variabel predikasi. Sebagai contoh akan dilakukan estimasi tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis kelamin, indeks berat badan, dan level sodium darah. Hubungan antara tekanan darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan menghasilkan model estimasi. Model estimasi yang dihasilkan dapat digunakan untuk kasus baru lainnya. 3. Prediksi. Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari hasil akan ada di masa mendatang. Contoh prediksi bisnis dan penelitian adalah: a. Prediksi harga beras dalam tiga bulan yang akan datang. b. Prediksi persentasi kenaikan kecelakaan lalu lintas tahun depan jika batas bawah kecepatan dinaikkan. Beberapa metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula digunakan (untuk keadaan yang tepat) untuk prediksi. 4. Klasifikasi Klasifikasi adalah fungsi pembelajaran yang memetakan (mengklasifikasi) sebuah unsur (item) data ke dalam salah satu dari beberapa kelas yang sudah didefinisikan. Contoh lain klasifikasi dalam bisnis dan penelitian adalah: a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau tidak. b. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan suatu kredit yang baik atau buruk. c. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk kategori penyakit apa. 5. Pengklusteran Pengelompokan (clustering) merupakan tugas deskripsi yang banyak digunakan dalam mengidentifikasi sebuah himpunan terbatas pada kategori atau cluster untuk mendeskripsikan data yang ditelaah. Kategori-kategori ini dapat bersifat eksklusif dan ekshaustif mutual, atau mengandung representasi yang lebih kaya seperti kategori yang hirarkis atau saling menumpu (overlapping). Contoh pengklusteran dalam bisnis dan penelitian adalah: a. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari satu suatu produk bagi perusahaan yang tidak memiliki dana pemasaran yang besar.

b.

Untuk tujuan audit akuntansi, yaitu melakukan pemisahan terhadap perilaku financial dalam baik dan mencurigakan. c. Melakukan pengklusteran terhadap ekspresi dari gen, untuk mendapatkan kemiripan perilaku dari gen dalam jumlah besar. 6. Asosiasi. Tugas asosiasi dalam data mining adalah menemukan attribut yang muncul dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisis keranjang belanja. Contoh asosiasi dalam bisnis dan penelitian adalah: a. Meneliti jumlah pelanggan dari perusahaan telekomunikasi seluler yang diharapkan untuk memberikan respon positif terhadap penawaran upgrade layanan yang diberikan. b. Menentukan barang dalam supermarket yang dibeli secara bersamaan dan yang tidak pernah dibeli secara bersamaan. 2.4. Association Rule Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Algoritma aturan asosiasi akan menggunakan data latihan, sesuai dengan pengertian data mining, untuk menghasilkan pengetahuan. Pengetahuan apakah yang hendak dihasilkan dalam aturan asosiasi? Pengetahuan untuk mengetahuan item-item belanja yang sering dibeli secara bersamaan dalam suatu waktu. Aturan asosiasi yang berbentuk “if…then…” atau “jika…maka…” merupakan pengetahuan yang dihasilkan dari fungsi aturan asosiasi (Seni Susanto dan Dedy Suryadi, 2010). 2.5. Tahapan Association Rules Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya. Khususnya salah satu tahap dari analisis asosiasi yang disebut analisis pola frequensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien. Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support (nilai penunjang) yaitu persentase kombinasi item tersebut dalam database dan confidence (Nugroho Wandi, et al. 2012). A. Data Preparation. Pada banyak bidang keilmuan, terutama komputer sains, diperlukan data yang berkualitas melalui proses preparation dari data mentah. Dalam prakteknya, ditemukan bahwa data cleaning dan preparation membutuhkan total usaha 80% dari usaha untuk merekayasa data, sehingga menjadikan data preparation sebagai proses yang krusial. Pentingnya proses ini dapat dilihat dari tiga aspek, yakni:

Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule   Metode Apriori. Oleh : Fadlina

146

Volume : III, Nomor : 1, Mei 2014

Majalah Ilmiah

Informasi dan Teknologi Ilmiah (INTI) ISSN : 2339-210X

1.

Data real world merupakan data kotor. Data real world bisa mengandung data yang tidak, terdapat noise, tidak konsisten, yang dikarenakan: a. Tidak lengkap (incomplete), yaitu kekurangan nilai atribut atau hanya mengandung agregat data (contoh : address = " ") b. Noise, yaitu masih mengandung error dan outliers. c. Tidak konsisten (inconsistent), yaitu data yang mengandung discrepansi dalam code dan nama atau singkatnya datanya tidak konsisten. 2. Sistem mining dengan performa tinggi membutuhkan data yang berkualitas. Data preparation atau preparation menghasilkan dataset yang lebih sedikit daripada dataset yang asli, ini bias meningkatkan efisiensi dari data mining. Langkah ini mengandung: a. Memilih data yang relevan b. Mengurangi data 3. Data yang berkualitas menghasilkan pola yang berkualitas. Dengan data preparation, maka data yang dihasilkan adalah data yang berkualitas, yang mengarah pada pola yang berkualitas pula, dengan: a. Mengembalikan data yang tidak lengkap b. Membenarkan eror, atau menghilangkan outliers c. Membenahi data yang bertentangan. B. Association Rules Association rule merupakan salah satu metode yang bertujuan mencari pola yang sering muncul di antara banyak transaksi, dimana setiap transaksi terdiri dari beberapa item sehingga metode ini akan mendukung system rekomendasi melalui penemuan pola antar item dalam transaksi-transaksi yang terjadi Metodologi dasar analisis asosiasi terbagi menjadi dua tahap : 1. Analisa pola frekuensi tinggi Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Nilai support sebuah item diperoleh dengan rumus berikut:

C. Frequent Itemset Langkah pertama pada association rule adalah menghasilkan semua itemset yang memungkinkan dengan kemungkinan itemset yang muncul dengan m-item adalah 2m. Karena besarnya komputasi untuk menghitung frequent itemset, yang membandingkan setiap kandidat itemset dengan setiap transaksi, maka ada beberapa pendekatan untuk mengurangi komputasi tersebut, salah satunya dengan algoritma apriori. D. Apriori Algoritma apriori digunakan untuk mencari frequent itemset yang memenuhi minsup kemudian mendapatkan rule yang memenuhi minconf dari frequent itemset tadi. Algoritma ini mengontrol berkembangnya kandidat itemset dari hasil frequent itemset dengan support-based pruning untuk menghilangkan itemset yang tidak menarik dengan menetapkan minsup. Prinsip dari apriori ini adalah bila itemset digolongkan sebagai frequent itemset, yang memiliki support lebih dari yang ditetapkan sebelumnya, maka semua subsetnya juga termasuk golongan frequent itemset, dan sebaliknya. E. Rule Generation Setelah mendapatkan frequent itemset menggunakan algoritma apriori, langkah selanjutnya adalah mendapatkan rule yang memenuhi confidence. Karena rule yang dihasilkan berasal dari frequent itemset, dengan kata lain, dalam menghitung rule menggunakan confidence, tidak perlu lagi menghitung supportnya karena semua calon rules yang dihasilkan telah memenuhi minsup sesuai yang ditentukan. Penghitungan ini juga tidak perlu melakukan perulangan scanning pada database untuk menghitung confidence, cukup dengan mengambil itemset dari hasil support.

1.5. Algoritma Apriori Algoritma apriori yaitu langkah yang membutuhkan pemrosesan lebih adalah frequent itemset berdasarkan sifat frequent itemset yaitu setiap subset frequent itemset harus menjadi frequent itemset (Dana Sulistiyo Kusumo, et al. 2003). . Algoritma ini mengontrol berkembangnya kandidat itemset dari hasil frequent itemset dengan support-based pruning untuk menghilangkan itemset 2. Pembentukan aturan assosiatif yang tidak menarik dengan menetapkan minsup. Setelah semua pola frekuensi tinggi Prinsip dari apriori ini adalah bila itemset ditemukan, barulah dicari aturan assosiatif yang digolongkan sebagai frequent itemset, yang memiliki memenuhi syarat minimum untuk confidence dengan support lebih dari yang ditetapkan sebelumnya, maka menghitung confidence aturan assosiatif A _B Nilai semua subsetnya juga termasuk golongan frequent confidence dari aturan A _B diperoleh dari rumus itemset, dan sebaliknya. Cara algoritma ini bekerja berikut: adalah algoritma akan menghasilkan kandidat baru Data Mining Untuk Analisa Tingkat Kejahatan Jalanan Dengan Algoritma Association Rule   147 Metode Apriori. Oleh : Fadlina

Volume : III, Nomor : 1, Mei 2014

Majalah Ilmiah

Informasi dan Teknologi Ilmiah (INTI) ISSN : 2339-210X

dari k-itemset dari frequent itemset pada langkah sebelumnya dan menghitung nilai support k-itemset tersebut. Itemset yang memiliki nilai support di bawah dari minsup akan dihapus. Algortima berhenti ketika tidak ada lagi frequent itemset baru yang dihasilkan. Kedua, dari hasil frequent itemset tersebut, langkah selanjutnya dihitung minconf mengikuti rumus sesuai yang telah ditentukan. Support tidak perlu dilihat lagi, karena generate frequent itemset didapatkan dari melihat minsup-nya. Bila rule yang didapatkan memenuhi batasan yang ditentukan dan batasan itu tinggi, maka rule tersebut tergolong strong rules. Prinsip algoritma apriori terbagi dalam beberapa tahap (Leo Wilyanto Santoso, 2003) 1. Kumpulkan jumlah item tunggal, dapatkan item besar 2. Dapatkan candidate pairs, hitung => large paris dari item-item 3. Dapatkan candidate triplets, hitung => large triplets dari item-item seterusnya. 4. Sebagai petunjuk : setiap subset dari sebuah frequent itemsets harus menjadi frequent. Contoh dari penerapan algoritma apriori adalah diilustrasikan digambar berikut:

Gambar 1 : Ilustrasi Algoritma Apriori Gambar 1menunjukkan bahwa algoritma akan menghasilkan kandidat ba...