PROPOSAL SKRIPSI IMPLEMENTASI METODE K-MEANS CLUSTERING DALAM PENAMBANGAN PDF

Title PROPOSAL SKRIPSI IMPLEMENTASI METODE K-MEANS CLUSTERING DALAM PENAMBANGAN
Author Widia Oktarianti
Pages 15
File Size 740.6 KB
File Type PDF
Total Downloads 463
Total Views 595

Summary

PROPOSAL SKRIPSI IMPLEMENTASI METODE K-MEANS CLUSTERING DALAM PENAMBANGAN DATA HOTSPOT (TITIK API) DENGAN PEMROGRAMAN R (Studi Kasus : Kepulauan Nusa Tenggara, Tahun 2013-2018) Diajukan Oleh : Nama : Widia Oktarianti NPM : G1A015013 PROGRAM STUDI INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS BENGKULU 2018...


Description

PROPOSAL SKRIPSI IMPLEMENTASI METODE K-MEANS CLUSTERING DALAM PENAMBANGAN DATA HOTSPOT (TITIK API) DENGAN PEMROGRAMAN R (Studi Kasus : Kepulauan Nusa Tenggara, Tahun 2013-2018)

Diajukan Oleh : Nama

: Widia Oktarianti

NPM

: G1A015013

PROGRAM STUDI INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS BENGKULU 2018

1. Judul Penelitian “Implementasi Metode K-Means Clustering Dalam Penambangan Data Hotspot (Titik api) Dengan Pemrograman R (Studi Kasus : Kepulauan Nusa Tenggara, Tahun 2013-2018 )” 2. Bidang Ilmu Bidang ilmu yang berkaitan dengan penelitian ini adalah Sistem Informasi Geografis dan Data Mining.

3. Latar Belakang Kebakaran hutan yang dilakukan secara sengaja menjadi salah satu masalah yang kini banyak terjadi di Indonesia. Hutan Indonesia sebenarnya termasuk dalam kategori hutan hujan basah yang mana sangat kecil kemungkinan terjadi kebakaran dengan sendirinya atau yang disebabkan karena faktor alam.

Faktanya, kawasan yang

terbakar adalah kawasan yang telah telah dibersihkan melalui proses land clearing sebagai salah satu persiapan pembangunan kawasan perkebunan. Artinya, kebakaran hutan secara nyata dipicu oleh api yang sengaja dimunculkan. Data yang dimiliki oleh wahana lingkungan hidup (WALHI) menunjukkan bahwa tindakan kesengajaan secara khusus di wilayah Sumatera dan Kalimantan dipicu oleh pembakaran lahan untuk perkebunan sawit dan Hutan Tanaman Industri (HTI) oleh perusahaan dan proyek lahan sejuta hektar yang berbuntut ekspor asap ke wilayah negara lain, antara lain Malaysia dan Singapura (Tuhulele, 2014)

Hotspot merupakan titik-titik panas di permukaan bumi yang dapat digunakan sebagai indikator terjadinya kebakaran hutan yang mengindikasikan suatu lokasi yang memiliki suhu relatif tinggi dibandingkan suhu disekitarnya. Setiap titik panas akan dicatat pada suatu dataset yang meliputi data spasial (latitude, longitude), data temporal (waktu dan tanggal pemantauan) dan data nonspasial (suhu udara, curah hujan, dsb). Persebaran hotspot biasanya menggerombol secara alami, sehingga apabila penggerombolan lokasi hotspot diketahui maka dapat digunakan dalam analisis terjadinya kebakaran hutan. (Mardhiyyah, 2014)

Salah satu satelit yang memantau titik api yaitu satelit Terra yang diluncurkan pada 18 Desember 1999 dan satelit Aqua yang diluncurkan pada 4 Mei 2002 (Giglio, 2010) Satelit-satelit ini bekerja dengan mengamati titik api, yaitu area yang memiliki 1

temperatur yang tinggi dibandingkan dengan lingkungan sekitarnya. Pengamatan yang dilakukan satelit ini dilakukan secara berulang-ulang sehingga memiliki urutan waktu. Satelit tersebut disebut Moderate Resolution Imaging Spectro Radio Meter (MODIS).

Kepulauan Nusa Tenggara atau Kepulauan Sunda Kecil adalah gugusan pulau-pulau di sebelah timur Pulau Jawa, dari Pulau Bali di sebelah barat, hingga Pulau Timor di sebelah timur (Shulgin, H.Kopp , & C. Mueller, 2009) . Tercatat bahwa kepulauan ini sering terjadi munculnya titik api selama rentang 5 tahun belakangan ini. Seperti pada tanggal 21 bulan oktober tahun 2015 CNN Indonesia melaporkan bahwa Badan Nasional Penanggulangan Bencanaencatat pada daerah Maluku terdeteksi memiliki 88 titik api, Maluku Utara 36 titik api, Nusa Tenggara Timur 13 titik,

dan Nusa

Tenggara Barat 11 titik. Kondisi cuaca yang kering menyebabkan kebakaran hutan dan lahan berpotensi meningkat pada saat itu. Antara News melaporkan pada bulan oktober 2018 Badan Meterologi, Klimatologi dan Geofisika (BMKG) Stasiun El Tari Kupang, melaporkan

terdapat sembilan titik panas (hotspot) di wilayah Nusa

Tenggara Timur (NTT), yang berpotensi menimbulkan kebakaran hutan dan lahan.

R adalah suatu suite perangkat lunak yang digunakan untuk manipulasi data, perhitungan, simulasi, penayangan grafik, dan sekaligus sebagai bahasa pemograman yang bersifat interpreter. R memungkinkan pengguna untuk memrogramkan algoritma dan menggunakan alat yang telah dikembangkan melalui R oleh pengguna lainnya (Wiharto, 2013). Pemrograman R terdiri atas package library seperti Shiny yang dapat menampilkan hasil ringkasan data melalui web browser dengan mudah. Shiny memiliki berbagai macam widget yang dapat menunjang dalam pembangunan sebuah web. Selain itu juga dapat dikembangkan dan diintegrasikan dengan aplikasi web lain seperti HTML, CSS, dan jQuery (Beeley 2013). Dan package DBI yang mendefinisikan suatu antarmuka untuk komunikasi antara R dan sistem manajemen basis data relasional.

K-means clustering merupakan salah satu metode pengelompokan nonhirarki yang bertujuan mengelompokkan objek sedemikian hingga jarak-jarak tiap objek ke pusat kelompok di dalam satu kelompok adalah minimum. K-means termasuk kedalam clustering unsupervised learning tidak menggunakan data latih atau data training untuk melakukan prediksi maupun klasifikasi. Berdasarkan model matematisnya, 2

algoritma ini tidak memiliki target variabel. Salah satu tujuan dari algoritma ini adalah mengelompokkan objek yang hampir sama dalam suatu area tertentu. (Alfiandi, 2018)

Pergerakan pengelompokkan hotspot dapat dianalisis dengan memanfaatkan hasil dari amatan sensor MODIS

sehingga dapat dibuat sebuah model untuk menganalisis

kejadian titik api sebagai indikator kebakaran hutan pada waktu mendatang. Salah satu analisis yang dilakukan adalah analisis pencilan (outlier) untuk melihat anomali kemunculan titik api. Dalam penelitian ini melakukan pendeteksian pergerakan pengelompokkan hotspot yang terjadi di Kepulauan Nusa Tenggara selama 5 tahun dengan rentang waktu 2013 sampai dengan 2018 dengan menerapkan metode Kmeans Clustering serta pemrograman R. Penelitian ini diharapkan dapat memberikan informasi pergerakan pengelompokkan hotspot serta mengetahui indikator penyebab munculnya hotspot dengan berbasis web agar hasil clustering dapat diakses dengan mudah oleh siapapun.

4. Perumusan Masalah Berdasarkan latar belakang yang telah di sebutkan di atas, maka rumusan masalah yang sesuai adalah sebagai berikut : 1. Bagaimana cara mengetahui pergerakan pengelompokkan hotspot selama rentang tahun 2013 hingga tahun 2018 di Kepulauan Nusa Tenggara. 2. Bagaimana penerapan algoritma k-means clustering dalam mengelompokkan hotspot menggunakan pemrograman R.

5. Batasan Masalah Batasan masalah yang diberikan pada penelitian ini adalah : 1. Data yang digunakan adalah data kemunculan hotspot selama lima tahun dengan rentang tahun 2013 hingga 2018 di Kepulauan Nusa Tenggara 2. Metode yang digunakan adalah K-Means Clustering 3. Pemrograman yang digunakan adalah R dengan packages R yang digunakan terutamanya adalah Shiny dan DBI. 4. Input dari penelitian ini adalah database kemunculan hotspot

yang data

tersebut terdiri dari atribut latitude, longitude, acq_date dan acq_time. 5. Output dari penelitian ini menghasilkan data pengelompokkan titik api harian bulanan serta tahunan dan akan di implementasikan kedalam Web-GIS 3

6. Tujuan Penelitian Adapun tujuan dari penelitian ini adalah : 1. Mengetahui pergerakan pengelompokkan hotspot selama rentang tahun 2013 hingga tahun 2018 di Kepulauan Nusa Tenggara. 2. Menerapkan algoritma k-means clustering dalam pengelompokkan hotspot menggunakan pemrograman R.

7. Manfaat Penelitian Manfaat penelitian yang dilakukan adalah memberikan informasi mengenai pergerakan pengelompokkan hotspot selama rentang tahun 2013 hingga tahun 2018 di Kepulauan Nusa Tenggara dan kemudian data tersebut dapat dimamfaatkan untuk mengetahui faktor yang sebenarnya yang menyebabkan munculnya hotspot tersebut.

8. Tinjauan pustaka 8.1 Titik api (Hotspot) Titik api (hotspot) adalah indikator kebakaran hutan yang mengindikasikan suatu lokasi yang memiliki suhu relatif tinggi dibandingkan suhu disekitarnya. Definisi tersebut tertulis dalam pasal 1 angka 9 Permenhut No.P 12//P Menhut-II/2009. Titik api dapat dideteksi dengan satelit NOAA (National Oceanic and Atmospheric Administration) yang dilengkapi sensor AVHRR (Advanced Very Hight Resulation Radiometer). Sensor AVHRR bekerja berdasarkan pancaran energi thermal dari objek yang diamati dari suatu areal yang bersuhu 42°C. Satelit ini sering digunakan untuk pendeteksian wilayah tersebut karena salah satu sensornya yang dapat membedakan suhu permukaan di darat atau di laut dan satelit-satelit tersebut mengunjungi tempat yang sama dua kali sehari siang dan malam. (Fire Fight South East Asia, 2002)

Setiap hotspot akan dicatat pada suatu dataset yang meliputi data spasial (latitude, longitude), data temporal (waktu dan tanggal pemantauan) dan data nonspasial (suhu udara, curah hujan, dsb). Persebaran hotspot biasanya menggerombol secara alami, sehingga apabila penggerombolan lokasi hotspot diketahui maka dapat digunakan dalam analisis terjadinya kebakaran hutan. (Mardhiyyah, 2014)

8.2 Kepulauan Nusa Tenggara 4

Kepulauan Nusa Tenggara atau Kepulauan Sunda Kecil adalah gugusan pulau-pulau di sebelah timur Pulau Jawa, dari Pulau Bali di sebelah barat, hingga Pulau Timor di sebelah timur. Secara administratif, Kepulauan Nusa Tenggara termasuk wilayah negara Indonesia, kecuali bagian timur Pulau Timor termasuk wilayah negara Timor Leste. Pulau-pulau utama dalam kepulauan ini sebagai berikut (Shulgin, H.Kopp , & C. Mueller, 2009) : Bali 1. Pulau Bali 2. Pulau Nusa Penida 3. Pulau Nusa Lembongan 4. Pulau Nusa Ceningan Nusa Tenggara Barat 1. Pulau Lombok 2. Pulau Sumbawa 3. Pulau Sangeang 4. Pulau Moyo

Nusa Tenggara Timur 1. Pulau Komodo 2. Pulau Flores 3. Pulau Palue 4. Pulau Adonara 5. Pulau Solor 6. Pulau Lomblen (Pulau Lembata) 7. Pulau Pantar 8. Pulau Alor 9. Pulau Sumba 10. Pulau Timor 11. Pulau Sawu 12. Pulau Rote

Maluku 1. Pulau Babar 2. Pulau Damar 3. Pulau Leti 4. Pulau Moa 5. Pulau Roma 6. Pulau Sermata 7. Pulau Wetar 8. Pulau Yamdena 9. Pulau Kisar

8.3 Satelit Untuk Pemantauan Titik api 8.3.1

Satelit AQUA/TERRA MODIS Satelit AQUA diluncurkan pada tanggal 4 Mei 2004 pukul 02:55a.m di

Vandenberg Air

Force

Bone,CA.

MODIS

(Moderare

Resolution

Imaging

Spectroradiometer) dilengkapi oleh high radiometric sensitivity (12 bit) dalam 36 kanal spektral yang mempunyai gelombang antara 0,4 μm sampai 14,4 μm. Deteksi Hotspot (titik api) menggunakan sensor MODIS pada satelit TERRA dan AQUA memberikan gambaran lokasi wilayah yang mengalami kebakaran hutan. Satelit akan mendeteksi anomali suhu panas dalam luasan 1 km persegi. Pada suatu lokasi di permukaan bumi akan diobservasi 2-4 kali per hari. Pada wilayah yang tertutup awan, maka hotspot tidak dapat terdeteksi.. Setiap kali melintas satelit menyediakan luas pandang 2330 km dan mengorbit bumi 1-2 hari pada ketinggian 705 km di atas permukaan bumi. (Rahadian, 2016)

8.3.2

Satelit NOAA-18/AVHRR 5

Satelit NOAA adalah satelit cuaca yang dioperasikan oleh National Ocean and Atmospheric Administration (NOAA) yang merupakan badan induk dari dinas udara Amerika Serikat (U.S Weather Service). Menurut orbitnya satelit NOAA bisa dibagi menjadi dua macam yaitu orbit geostationer dan orbit polar. Satelit NOAA dengan orbit polar adalah satelit yang memonitoring bumi pada ketinggian 540 mil di atas permukaan bumi. AVHRR adalah sensor yang terpasang pada satelit NOAA/AVHRR untuk pemantauan iklim dan kelautan global. Saat ini citra satelit NOAA mulai diolah untuk mendeteksi adanya anomali panas permukaan bumi untuk mendapatkan titik api. AVHRR mempunyai 5 saluran pada spektrum tampak, inframerah dekat, dan inframerah termal, dengan resolusi 1.1 kilometer serta dapat mengirimkan data minimal satu kali dalam sehari (Rahadian, 2016)

8.4 Algoritma K-Means Clustering K-means clustering merupakan salah satu metode pengelompokan nonhirarki yang bertujuan mengelompokkan objek sedemikian hingga jarak-jarak tiap objek ke pusat kelompok di dalam satu kelompok adalah minimum (Alfiandi, 2018)

K-means

termasuk kedalam clustering unsupervised learning tidak menggunakan data latih atau data training untuk melakukan prediksi maupun klasifikasi. Berdasarkan model matematisnya, algoritma ini tidak memiliki target variabel. Salah satu tujuan dari algoritma ini adalah mengelompokkan objek yang hampir sama dalam suatu area tertentu.

Proses clustering dimulai dengan mengidentifikasi data yang akan di-cluster. Pada awal iterasi, pusat setiap cluster ditetapkan secara bebas. Kemudian dihitung jarak antar data dengan tiap pusat cluster. Untuk melakukan penghitungan jarak data ke-i pada pusat kluster ke-j diberi nama (𝐷𝑙2), dapat digunakan formula Euclidean seperti pada persamaan 1, yaitu (Alfiandi, 2018) :

𝐷 (

)





√∑

Keterangan: 𝐷𝑙2( 1, 2) = jarak antara data ke-i dan data ke-j 2𝑗 = koordinat data x2 pada dimensi j 1𝑗 = koordinat data x1 pada dimensi j

6

{

} .......(1)

P = dimensi data X1 = koordinat kolom X1 X2 = koordinat kolom X2

Pengolahan Data K-Means Clustering dapat dilakukan dengan langkah-langkah berikut ini (Rahmah, 2017) : a) Secara subyektif pilih sejumlah data dari sebagai nilai awal centroid. b) Ulangi hingga tidak ada perubahan cluster atau hingga masa/epoch yang ditentukan: i) Masukkan setiap item data kedalam cluster yang memiliki nilai centroid terdekat ii) Hitung nilai rata-rata yang baru untuk tiap cluster sampai kriteria konvergensi dipenuhi.

Kriteria konvergensi yang paling sering digunakan pada algoritma K-Means adalah dengan meminimasi SSE (Sum of Square Error). SSE didefinisikan sebagai berikut (Baehaki, 2014) :





(

) .......(2)

Dengan : K: jumlah kelas, x : objek data, : objek dalam kelas i, : centroid atau titik pusat kelas i, dan dist : fungsi jarak, yaitu jarak Euclidian.

8.5 Pemrograman R R adalah suatu suite perangkat lunak yang digunakan untuk manipulasi data, perhitungan, simulasi, penayangan grafik, dan sekaligus sebagai bahasa pemograman yang bersifat interpreter. R memungkinkan pengguna untuk memrogramkan algoritme dan menggunakan alat yang telah dikembangkan melalui R oleh pengguna lainnya (Wiharto, 2013). R bukan saja bahasa tetapi juga lingkungan/environment untuk komputasi statistik dan grafik. R menyediakan berbagai macam tool statistik dari linier dan memodelan non linier, uji statistik klasik, analisis time-series, klasifikasi, 7

clustering dan lain-lain. R juga menyediakan tool teknik grafis yang bertujuan untuk menampilkan data yang telah diolah secara visual dalam bentuk grafik. R merupakan project open-source yang memungkinkan banyak pihak untuk memberikan kontribusi dalam proses pengembangan (Kesuma, 2016)

8.5.1

Packages Shiny Shiny merupakan sebuah package dari perangkat lunak Rstudio yang dapat

menampilkan hasil ringkasan data melalui web browser. Shiny memiliki berbagai macam widget yang dapat menunjang dalam pembangunan sebuah web. Kelebihan dari framework Shiny adalah sifatnya yang sangat fleksibel dalam pembuatan interface yaitu dapat menggunakan kerangka dasar HTML dengan penggunaan syntax yang cukup mudah atau bagi yang memiliki pengetahuan yang baik dalam web development dapat membuat interface yang dinamis dan elegan sesuai dengan mengintegrasikan aplikasi web lain seperti CSS dan jQuery (Beeley, 2013). Selain itu framework Shiny juga dapat dipasangkan dengan package R lainnya.

8.5.2

Packages DBI DBI mendefinisikan suatu antarmuka untuk komunikasi antara R dan sistem

manajemen basis data relasional. Semua kelas dalam paket ini bersifat virtual dan perlu diperpanjang oleh berbagai implementasi R / DBMS yang disebut backend DBI (R-SIG-DB, 2018). Packages DBI dan digunakan untuk mengakses data dari basis data. Dalam

packages ini terdapat Fungsi dbDriver dan dbConnect digunakan untuk

konfigurasi basis data. Fungsi ts untuk membuat data deret waktu sedangkan fungsi decompose berfungsi untuk mendekomposisi data deret waktu. (Baehaki, 2014)

9.

Metode Penelitian

9.1 Metode Pengumpulan Data Metode pengumpulan data yang digunakan pada penelitian ini adalah. 1. Studi Pustaka Studi pustaka dilakukan dengan cara menelaah beberapa yaitu buku-buku, jurnal, prosiding dan internet yang menyajikan informasi tentang penelitian ini. 2. Studi Analisis Metode ini dilakukan dengan cara melakukan analisis terhadap masalah yaitu mengetahui tingkat munculnya dan pengelompokkan dari suatu titik api. 8

9.2 Metode Pengembangan Sistem Metode dalam penelitian ini adalah metode Increment (Incremental development model). Incremental model dipilih karena metode ini dapat meminalisir ketidak sesuaian dalam pengembangan perangkat lunak. Pada metode incement,setiap tahapan yang ada dalam metodologi terdapat masukan (input) dan keluaran (output). Output dari increment akan dijadikan masukan (input) untuk increment selanjutnya. Adapun tahapan tahapan dalam metode incremental adalah:

1. Requirement , Requirment adalah proses tahapan awal yang dilakukan pada incremental model adalah penentuan kebutuhan atau analisis kebutuhan. Kebutuhan dalam penelitian ini adalah data citra satelit hotspot (titik api) yang ada di Kepulauan Nusa Tenggara dari tahun 2013-2018 menggunakan satelit AQUA MODIS dan NOAA. Adapun kebutuhan perangkat keras dan perangkat lunak untuk pembuatan sistem ini adalah : a. Perangkat Lunak 1. 2. 3. 4. 5. 6.

Sistem Operasi Windows 10 R Studio Microsoft Office 2010 Database management system (DBMS) PostgreSQL dengan ekstensi PostGIS, PostGIS 2.0 shapefile and DBF loader exporter Web browser

b. Perangkat Keras 1. 2. 3.

Laptop dengan Processor Intel(R) i3-5200U CPU @2.20GHz RAM 4 GB Mouse

2. Specification, Specification adalah proses spesifikasi dimana menggunakan analisis kebutuhan sebagai acuannya. 3. Architecture Design, adalah tahap perancangan sistem. Dalam merancang sistem, peneliti menggunakan model perancangan berupa Unified Modeling Language (UML) yaitu terdiri dari 13 diagram serta diagram Flow Chart. Berikut ini adalah diagram flow chart metode K-Means Clustering dalam pada sistem ini :

9

Gambar 1 diagram flow chart metode K-Means Clustering

4. Code setelah melakukan proses desain selanjutnya ada pengkodean. Kode program akan dibuat dalam aplikasi pemrograman R studio dengan menggunakaan bahasa pemrogramana R dan ditampilkan ke dalam web browser.

5. Test merupakan tahap pengujian dalam model ini. Proses pengujian yang dilakukan pada aplikasi yang dibuat menggunakan dua metode pengujian yaitu white box testing dan black box testing.

White Box Testingmenguji kode-kode program yang ada dan akan menganalisis apakah ada kesalahan atau tidak. Jika terdapat bagian dari kode yang menghasilkan output yang tidak sesuai maka peneliti akan mengecek satu per satu dan memperbaikinya. Sedangkan pada pengujian Black Box Testing, dilakukan dengan mengamati hasil eksekusi melalui data uji dan memeriksa fungsional dari aplikasi yang telah dibuat.

10

10. Penelitian Terkait No

Peneliti

Judul

1.

Dhiya Aulia Deteksi Pencilan Data Titik Muhamad Api Di Provinsi Riau Baehaki Menggunakan Algoritme Clustering K-Means

2.

Ansari Saleh Ahmar

3.

Barik Kresna Amijaya, Muh. Tanzil Furqon, Candra Dewi

Tahun 2014

Metode/ objek

Hasil

K-Means Clustering / Titik api di Riau tahun 2000-2013.

Penelitian ini berhasil menampilkan sejumlah titik api yang ada di Riau dari tahun 2000-2013 dengan menggunakan pemrograman R dengan paket DBI .

Using K-Means Clustering 2018 to Cluster Provinces in Indonesia

Clustering KMeans / Provinsi di Indonesia


Similar Free PDFs