Title | Contoh Sistematika Penulisan latar belakang masalah menggunakan pola OMKKMASASOLTU |
---|---|
Author | Irfan Abbas |
Pages | 7 |
File Size | 372.5 KB |
File Type | |
Total Downloads | 321 |
Total Views | 990 |
JUDUL: PENGOLAHAN AWAL DATA DAN PENERAPAN ALGORITMA SINGULAR VALUE DECOMPOSITION (SVD) UNTUK MEMAKSIMALKAN VARIANCE SCORES PRINCIPAL COMPONENT DAN EFISIENSI PROSES PADA ALGORITMA PRINCIPAL COMPONENT ANALYSIS (PCA) Commented [i1]: PADA JUDUL PENELITIAN HARUS DIJAWAB “WHY” / Mengapa.? Seperti contoh j...
JUDUL: PENGOLAHAN AWAL DATA DAN PENERAPAN ALGORITMA SINGULAR VALUE DECOMPOSITION (SVD) UNTUK MEMAKSIMALKAN VARIANCE SCORES PRINCIPAL COMPONENT DAN EFISIENSI PROSES PADA ALGORITMA PRINCIPAL Commented [i1]: PADA JUDUL PENELITIAN HARUS DIJAWAB “WHY” / Mengapa.? Seperti contoh judul ini. 1.Harus dijawab Mengapa Pengolahan Data 2.Mengapa Algorima SVD 3.Mengapa Memaksimalkan Variance Score Principal Component 4.Mengapa efisiensi Proses , dan 5.Mengapa Algoritma PCA.
COMPONENT ANALYSIS (PCA)
1.1
Latar Belakang Masalah
Dewasa ini bidang informatika biomedis telah
menunjukkan peningkatan
popularitas dan perhatian, serta telah berkembang dengan cepat selama dua dekade. Namun para peneliti dan praktisi biomedis menghadapi masalah “info-
Commented [i2]: Menyusun Latar Belakang Masalah mengikuti pola OMKKMASASOLTU 1. O (Objek) Membahas Objek secara Umum 2.. M (Metode) Membahas Metode2 yang ada 3. KK (kelebihan-kekurangan) pada metode yang ada 4. MASA (Masalah) pada Objek PENELITIAN 5. SOL (Solusi) pemecahan masalah pada objek, pilih salah satu METODE pada nomor 2 6. TU (Tujuan) membahas tentang Tujuan Penelitian anda
glut”, yaitu berlimpah informasi yang belum terorganisir, disebabkan sejumlah besar data penelitian biomedis dihasilkan setiap hari, dimulai dari usaha-usaha penelitian individu dan praktek-praktek klinik, dan juga data biomedis ini tersedia dalam ratusan basis data publik dan pribadi. Tersedia juga berupa digitisasi informasi medis seperti laporan lab, data pasien, paper penelitian, gambar anatomik dan sejumlah data perawatan pasien. [1]. Dimana data ini harus diorganisir dan dianalisis secara efektif untuk membantu peneliti dan praktisi di Commented [i3]: 1. O (Objek( Membahas Objek Secara Umum
bidang biomedis, agar dapat bermanfaat bagi masyarakat umum.
Pada data di bidang biomedis memiliki ribuan atribut serta ribuan jumlah record yang saling berkorelasi (multicolinearity) dan menghasilkan data yang kompleks [2]. Data yang kompleks memiliki banyak kebisingan (noise), anomali (outlier), elemen yang hilang (missing value), tidak konsisten dan juga entitas data tidak berhubungan
[3]
[4]
sehingga membutuhkan
pengolahan
awal data [5].
Pengolahan awal data diterapkan sebelum masuk ke model datamining yang sesungguhnya
dan secara substansial dapat meningkatkan kualitas keseluruhan
dari pola datamining [6].
Commented [i4]: Menjawab mengapa perlu Pra Pengolahan data
Teknik pengurangan dimensi merupakan bagian dari pengolahan awal data, yang merupakan teknik penting dan menjadi teknik mendasar dalam sebagian besar proses data mining ketika menghadapi data yang kompleks [7] [8]. Tujuan dari teknik pengurangan dimensi adalah untuk mendapatkan representasi data baru yang dikelola menjadi dimensi lebih rendah [9]. Representasi data baru ditinjau dari sudut waktu dan kompleksitas komputasi yang jauh lebih efektif untuk pengolahan data berikutnya, misalnya untuk klasifikasi, assosiasi, prediksi, Commented [i5]: 1. Mengapa perlu efisiensi waktu 2.Teknik yang diapakai dalam pra pengolahan data
estimasi dan analisis pengelompokan [10].
Teknik pengurangan dimensi dapat dikelompokkan menjadi seleksi atribut dan ekstraksi atribut
[11] [12]. Seleksi atribut bertujuan untuk menemukan atribut
terbaik (k) pada (d) dimensi untuk mendapatkan informasi dan membuang atribut yang tidak signifikan pada dimensi lain [13] [14] namun kelemahan seleksi atribut memerlukan pelatihan satu set data besar untuk mendapatkan transformasi yang dapat diandalkan [15] [16]. Ekstraksi atribut bertujuan untuk mencari satu set atribut yang baru di (k) dimensi yang merupakan kombinasi dari ukuran asli [13] [14] dengan cara mengubah dimensi tinggi ke dalam dimensi yang lebih rendah Commented [i6]: Membahas Teknik Pengurangan Dimensi
[17] [16].
Ekstraksi atribut secara umum diklasifikasikan menjadi linier dan nonlinier [13]. ISOM AP (Isometric Feature M apping) LLE
(Local
Linear
Embedded) [5]
kernelPCA, Generalised Singular Value Decomposition (GSVD), Generaised Partial Leat Square (GPLS)
dan Maximum
Variancesce Unfolded
(M VU)
tergolong algoritma nonlinier
[18] [19]. Principal component analysis (PCA),
linear discriminant analysis (LDA), independent component analysis (ICA) singular value decomposition (SVD) [13] Canonical Correletion Analysis (CCA), Partial Least Square (PLS) dan Latent Semantic Indexing (LSI) tergolong algoritma linier
[20] [21] .
Algoritma Latent Semantic Indexing (LSI), adalah teknik aljabar linier yang menggunakan algoritma Singular value decomposition (SVD) untuk menguraikan matriks [18] [19]. Algoritma Canonical Correlation Analysis (CCA)
adalah
eksplorasi korelasi antara dua set sampel variabel kuantitatif, namun kekurangan algoritma CCA kurang akurat ketika jumlah unit data kurang dari jumlah variable terbesar dari kedua data set [21]. Algoritma Partial Least Squares (PLS) adalah teknik yang terkenal untuk ektraksi atribut, metode untuk menganalisis hubungan antara data set melalui variabel laten, namun lemah di proyeksi linier
[22].
Algoritma Linear Discriminant Analysis (LDA) termasuk teknik ekstraksi atribut yang banyak digunakan [20] namun LDA tidak stabil pada data yang berdimensi tinggi pada kasus class scetter matrix untuk dijadikan nlai matrix singular (matriks tunggal) [23]. Algoritma Independent Component Analysis (ICA) dan FastICA (extension of ICA) termasuk teknik analisa komponen dasar sama seperti PCA, namun lemah di teknik pengurangan dimensi [24].
Commented [i7]: Membahas METODE-METODE /MODEL yang ada termasuk kelebihan dan kekuurangan Metode/model
Teknik aljabar linier secara signifikan lebih sederhana dari Canonical Correlation Analysis (CCA), Partial Least Square (PLS) dan Linear Discriminant Analysis (LDA) [7]. Algoritma yang termasuk teknik aljabar linier adalah algoritma Singular Value Decomposition (SVD) dan Principal Component Analysis (PCA)
Algoritma Singular Value Decomposition (SVD) pertama kali diusulkan oleh Eckartand Young [25] termasuk metode eksplorasi statistik multidimensi dengan latar belakang metematika aljabar linier. Termasuk algoritma teknik pengurangan dimensi yang paling cepat proses kerjanya dibanding teknik pengurangan dimensi lainnya seperti PCA, ICA dan fastICA (extensionICA) [26] dan merupakan metode matematis untuk menguraikan matriks tunggal [27], dengan mengkompres menjadi tiga matriks yang lebih kecil dengan
ukuran yang sama [28]. Cara
kerjanya mengurangi data pada kolom dan baris [29] [30]. Salah satu alat analisis numerik yang efektif digunakan untuk menganalisis matriks [27] beroperasi di jantung algoritma seperti pada algoritma PCA dan LSI dan tergolong metode machine learning yang banyak dipakai [5] dan banyak diterapkan pada berbagai
Commented [i8]: Mengapa Memilih Algoritma PCA dan SVD
bidang, termasuk clustering pada data klinik [31], image compresing [32], wetermarking, [33] [34], klasifikasi dokumen [35], mapping gen [2] dan pencarian data series [36].
Algoritma Singular Value Decomposition (SVD) mempunyai kelebihan pada efisiensi waktu proses [26] untuk digunakan pada dataset yang berskala besar [37] [38], dapat digunakan untuk memaksimalkan data ekstraksi pada algoritma PCA [31] serta dapat beroperasi dijantung algoritma PCA untuk mendapatkan nilai left eigenvector [37] [38]. Namun kekurangan
SVD selain tidak dapat melakukan
perhitungan jika dataset memiliki elemen yang hilang (missing value) [31] juga hasil data ekstraknya kurang maksimal disebabkan korelasi antar atribut belum bersih 100%
dibanding dengan algoritma Principal Component Analysis (PCA)
[39] [40].
Commented [i9]: Mengapa Memilih Algoritma SVD dan menjawab mengapa perlu memaksimalkan Varince score pada algoritma PCA serta masalah pada METODE
Algoritma Principal Component Analysis (PCA) diperkenalkan oleh Pearson dan
CATATAN: UNTUK ANAK Strata 1 (S1) CUKUP MASALAH PADA OBJEK PENELITIAN
Hotelling termasuk
metode eksplorasi statistik
multidimensi dengan latar
belakang matematika aljabar linier dan eigen analysis. Cara kerja PCA adalah menemukan himpunan bilangan orthogonal dengan menggunakan teknik SVD [37]] [38] dari proyeksi matriks vektor pada atribut ekstraksi dengan memaksimalkan
variancess
data,
kemudian
mengurangi
dimensi
melalui
kombinasi linear dari variabel awal tanpa mengorbankan akurasi [17] [3].
Kelebihan algoritma Principal Component Analysis (PCA) mampu menghasilkan data ekstrak
yang lebih signifikan dibandingkan dengan SVD, menghilangkan
korelasi 100% [39] [40] dan mampu mengolah hasil data ekstrak algoritma SVD dengan cara meningkatkan pemisahan antara sampel dari kelas yang berbeda serta mengurangi
pemisahan
antara sampel
dari kelas yang sama [40] [25],
menghasilkan variable baru (principal component) yang berisi scores principal component hasil kombinasi linier dari variable asli, namun kekurangan algoritma Principal Component Analysis (PCA) lambat memproses dataset dibanding dengan algoritma SVD [26] [38].
Commented [i10]: Mengapa Meilih PCA
Berdasarkan dari paparan kelebihan dan kekurangan dari metode yang ada pada teknik pengurangan dimensi, maka dapat dirangkumkan bahwa teknik aljabar linier secara signifikan lebih sederhana dari beberapa teknik pengurangan dimensi yang ada seperti Canonical Correlation Analysis (CCA), Partial Least Square (PLS) dan Linear Discriminant Analysis (LDA).
Algoritma
Principal
Component
Analysis
(PCA)
dan
Singular
Value
Decomposition (SVD) adalah dua algoritma yang menggunakan teknik aljabar linier, kedua keunggulan algoritma ini dapat digabungkan untuk memproses data yang kompleks dan berskala besar.
Algoritma Singular Value Decomposition (SVD) memiliki kelebihan pada efisiensi waktu proses, dan menghasilkan data ekstrak (left eigenvectors), dimana pada algoritma PCA disebut sebagai principal component, namun kurang maksimal hasil data ekstraknya dibanding dengan algoritma PCA, dan juga kekurangan algoritma SVD tidak dapat melakukan perhitungan jika dataset memiliki elemen yang hilang (missing value), oleh karena itu memerlukan proses pengolahan awal data.
Algoritma Principal Component Analysis (PCA) mampu memproses data ekstrak dari algoritma SVD, dengan menghasilkan variable baru (principal component) yang berisi scores principal component, namun kekurangan algoritma PCA sangat lambat memproses dataset yang berskala besar dibanding dengan algoritma SVD.
Commented [i11]: SOLUSI PADA MASALAH
Berdasarkan dari paparan pada rangkuman diatas, maka pada penelitian ini mengusulkan “Pengolahan Awal Data dan Penerapan Algoritma Singular Value Decomposition (SVD) untuk M emaksimalkan Variances Score Principal Analysis dan Efisiensi Waktu pada Algoritma Principal Component Analysis (PCA)”.
Commented [i12]: TUJUAN penelitian,..pada tahap inilah muncul JUDUL/THEMA JADI JUDUL/THEMA MUNCUL PADA LATAR BELAKANG MASALAH...
1.2 Rumusan Masalah Dari latar belakang masalah, maka permasalahan yang dirumuskan yaitu:
Masalah umum: Tersedianya jumlah basis data biomedis yang berlimpah, berupa basis data publik (internet) dimana datasetnya dari peneliti-peneliti individu dan dari praktekpraktek klinik, dan juga tersedia berupa digitisasi informasi, seperti laporan lab, data pasien, paper penelitian, gambar anatomik dan sejumlah data perawatan pasien. Namun dataset biomedis memiliki ribuan atribut serta ribuan jumlah record yang saling berinteraksi yang menghasilkan data kompleks dan berskala Commented [i13]: Masalah umum yang dijabarkan adalah obejk penelitian,.masalah umum ini untuk anak S1 diterapkan MASALAH pada OBJEK ATAU masalah ini yang digarap oleh ANAK STRATA 1 (SI)
besar.
Masalah spesifik: Algoritma Singular
Value Decomposition
(SVD)
tepat
digunakan
untuk
memproses dataset yang berskala besar dan kompleks, dan cepat dalam memproses dataset yang berskala besar, namun hasil data ekstrak SVD kurang maksimal dibanding dengan PCA.
Algoritma Principal Component Analysis (PCA) mampu memproses score left eigenvector (data ekstrak ) dari algoritma SVD, yang disebut sebagai score principal component, namun algoritma PCA sangat lambat memproses dataset Commented [i14]: MASALAH SPESIFIK ini yang digarap oleh anak S2
berskala besar.
Pertanyaan penelitian ini yaitu, seberapa cepat waktu proses dan seberapa maksimal nilai variances score principal component pada algoritma PCA, jika dataset
diproses
terlebih
Decomposition (SVD).
dahulu
menggunakan
algoritma
Singular
Value Commented [i15]: Pertanyaan Penelitian yang harus dijawan pada BAB V Kesimpulan dan saran.
1.3 Tujuan Penelitian Tujuan dari penelitian ini adalah untuk memaksimalkan variances score principal component dan efisiensi waktu proses pada algoritma Principal Component Commented [i16]: 1.Tujuan Penelitian nyambung dengan TUJUAN pada latar belakang masalah 2. Tujuan penelitian sama dengan JUDUL/Thema yang anglat diteliti.
Analysis (PCA)
Commented [i17R16]:
1.4 Manfaat Penelitian M anfaat dari penelitian ini adalah: 1.
M anfaat Umum:
Penelitian ini sangat membantu para peneliti dan praktisi biomedis, untuk memproses
informasi
yang
belum
terorganisir,
dimana
penelitian
ini
menghasilkan data yang telah siap pakai atau siap diproses pada model datamining, agar nantinya bermanfaaat pada masyarakat umum. 2.
M anfaat ilmu pengetahuan
Jumlah atribut yang telah dikurangi dan hasil nilai varian pada scores principal component yang lebih maksimal serta atribut yang tidak saling berkorelasi dapat dijadikan sebagai input variable, dan sangat berpengaruh pada efisiensi waktu proses serta dapat meningkatkan akurasi, antara lain: a) M odel cluster b) Analisa regresi berganda c) Analisa diskriminan d) Analisa factor e) Klasifikasi dengan menggunakan Neural Net
Commented [i18]: MANFAAT adalah setelah TUJUAN TERCAPAI,.manfaat kepada masyarakat tidak bisa diukur,..jadi yang diukur adalah Hasil pada Penerapan METODE...