Contoh Sistematika Penulisan latar belakang masalah menggunakan pola OMKKMASASOLTU PDF

Title	Contoh Sistematika Penulisan latar belakang masalah menggunakan pola OMKKMASASOLTU
Author	Irfan Abbas
Pages	7
File Size	372.5 KB
File Type	PDF
Total Downloads	321
Total Views	990

Preview

CLICK TO PREVIEW PDF

Summary

Description

JUDUL: PENGOLAHAN AWAL DATA DAN PENERAPAN ALGORITMA SINGULAR VALUE DECOMPOSITION (SVD) UNTUK MEMAKSIMALKAN VARIANCE SCORES PRINCIPAL COMPONENT DAN EFISIENSI PROSES PADA ALGORITMA PRINCIPAL Commented [i1]: PADA JUDUL PENELITIAN HARUS DIJAWAB “WHY” / Mengapa.? Seperti contoh judul ini. 1.Harus dijawab Mengapa Pengolahan Data 2.Mengapa Algorima SVD 3.Mengapa Memaksimalkan Variance Score Principal Component 4.Mengapa efisiensi Proses , dan 5.Mengapa Algoritma PCA.

COMPONENT ANALYSIS (PCA)

1.1

Latar Belakang Masalah

Dewasa ini bidang informatika biomedis telah

menunjukkan peningkatan

popularitas dan perhatian, serta telah berkembang dengan cepat selama dua dekade. Namun para peneliti dan praktisi biomedis menghadapi masalah “info-

Commented [i2]: Menyusun Latar Belakang Masalah mengikuti pola OMKKMASASOLTU 1. O (Objek) Membahas Objek secara Umum 2.. M (Metode) Membahas Metode2 yang ada 3. KK (kelebihan-kekurangan) pada metode yang ada 4. MASA (Masalah) pada Objek PENELITIAN 5. SOL (Solusi) pemecahan masalah pada objek, pilih salah satu METODE pada nomor 2 6. TU (Tujuan) membahas tentang Tujuan Penelitian anda

glut”, yaitu berlimpah informasi yang belum terorganisir, disebabkan sejumlah besar data penelitian biomedis dihasilkan setiap hari, dimulai dari usaha-usaha penelitian individu dan praktek-praktek klinik, dan juga data biomedis ini tersedia dalam ratusan basis data publik dan pribadi. Tersedia juga berupa digitisasi informasi medis seperti laporan lab, data pasien, paper penelitian, gambar anatomik dan sejumlah data perawatan pasien. [1]. Dimana data ini harus diorganisir dan dianalisis secara efektif untuk membantu peneliti dan praktisi di Commented [i3]: 1. O (Objek( Membahas Objek Secara Umum

bidang biomedis, agar dapat bermanfaat bagi masyarakat umum.

Pada data di bidang biomedis memiliki ribuan atribut serta ribuan jumlah record yang saling berkorelasi (multicolinearity) dan menghasilkan data yang kompleks [2]. Data yang kompleks memiliki banyak kebisingan (noise), anomali (outlier), elemen yang hilang (missing value), tidak konsisten dan juga entitas data tidak berhubungan

[3]

[4]

sehingga membutuhkan

pengolahan

awal data [5].

Pengolahan awal data diterapkan sebelum masuk ke model datamining yang sesungguhnya

dan secara substansial dapat meningkatkan kualitas keseluruhan

dari pola datamining [6].

Commented [i4]: Menjawab mengapa perlu Pra Pengolahan data

Teknik pengurangan dimensi merupakan bagian dari pengolahan awal data, yang merupakan teknik penting dan menjadi teknik mendasar dalam sebagian besar proses data mining ketika menghadapi data yang kompleks [7] [8]. Tujuan dari teknik pengurangan dimensi adalah untuk mendapatkan representasi data baru yang dikelola menjadi dimensi lebih rendah [9]. Representasi data baru ditinjau dari sudut waktu dan kompleksitas komputasi yang jauh lebih efektif untuk pengolahan data berikutnya, misalnya untuk klasifikasi, assosiasi, prediksi, Commented [i5]: 1. Mengapa perlu efisiensi waktu 2.Teknik yang diapakai dalam pra pengolahan data

estimasi dan analisis pengelompokan [10].

Teknik pengurangan dimensi dapat dikelompokkan menjadi seleksi atribut dan ekstraksi atribut

[11] [12]. Seleksi atribut bertujuan untuk menemukan atribut

terbaik (k) pada (d) dimensi untuk mendapatkan informasi dan membuang atribut yang tidak signifikan pada dimensi lain [13] [14] namun kelemahan seleksi atribut memerlukan pelatihan satu set data besar untuk mendapatkan transformasi yang dapat diandalkan [15] [16]. Ekstraksi atribut bertujuan untuk mencari satu set atribut yang baru di (k) dimensi yang merupakan kombinasi dari ukuran asli [13] [14] dengan cara mengubah dimensi tinggi ke dalam dimensi yang lebih rendah Commented [i6]: Membahas Teknik Pengurangan Dimensi

[17] [16].

Ekstraksi atribut secara umum diklasifikasikan menjadi linier dan nonlinier [13]. ISOM AP (Isometric Feature M apping) LLE

(Local

Linear

Embedded) [5]

kernelPCA, Generalised Singular Value Decomposition (GSVD), Generaised Partial Leat Square (GPLS)

dan Maximum

Variancesce Unfolded

(M VU)

tergolong algoritma nonlinier

[18] [19]. Principal component analysis (PCA),

linear discriminant analysis (LDA), independent component analysis (ICA) singular value decomposition (SVD) [13] Canonical Correletion Analysis (CCA), Partial Least Square (PLS) dan Latent Semantic Indexing (LSI) tergolong algoritma linier

[20] [21] .

Algoritma Latent Semantic Indexing (LSI), adalah teknik aljabar linier yang menggunakan algoritma Singular value decomposition (SVD) untuk menguraikan matriks [18] [19]. Algoritma Canonical Correlation Analysis (CCA)

adalah

eksplorasi korelasi antara dua set sampel variabel kuantitatif, namun kekurangan algoritma CCA kurang akurat ketika jumlah unit data kurang dari jumlah variable terbesar dari kedua data set [21]. Algoritma Partial Least Squares (PLS) adalah teknik yang terkenal untuk ektraksi atribut, metode untuk menganalisis hubungan antara data set melalui variabel laten, namun lemah di proyeksi linier

[22].

Algoritma Linear Discriminant Analysis (LDA) termasuk teknik ekstraksi atribut yang banyak digunakan [20] namun LDA tidak stabil pada data yang berdimensi tinggi pada kasus class scetter matrix untuk dijadikan nlai matrix singular (matriks tunggal) [23]. Algoritma Independent Component Analysis (ICA) dan FastICA (extension of ICA) termasuk teknik analisa komponen dasar sama seperti PCA, namun lemah di teknik pengurangan dimensi [24].

Commented [i7]: Membahas METODE-METODE /MODEL yang ada termasuk kelebihan dan kekuurangan Metode/model

Teknik aljabar linier secara signifikan lebih sederhana dari Canonical Correlation Analysis (CCA), Partial Least Square (PLS) dan Linear Discriminant Analysis (LDA) [7]. Algoritma yang termasuk teknik aljabar linier adalah algoritma Singular Value Decomposition (SVD) dan Principal Component Analysis (PCA)

Algoritma Singular Value Decomposition (SVD) pertama kali diusulkan oleh Eckartand Young [25] termasuk metode eksplorasi statistik multidimensi dengan latar belakang metematika aljabar linier. Termasuk algoritma teknik pengurangan dimensi yang paling cepat proses kerjanya dibanding teknik pengurangan dimensi lainnya seperti PCA, ICA dan fastICA (extensionICA) [26] dan merupakan metode matematis untuk menguraikan matriks tunggal [27], dengan mengkompres menjadi tiga matriks yang lebih kecil dengan

ukuran yang sama [28]. Cara

kerjanya mengurangi data pada kolom dan baris [29] [30]. Salah satu alat analisis numerik yang efektif digunakan untuk menganalisis matriks [27] beroperasi di jantung algoritma seperti pada algoritma PCA dan LSI dan tergolong metode machine learning yang banyak dipakai [5] dan banyak diterapkan pada berbagai

Commented [i8]: Mengapa Memilih Algoritma PCA dan SVD

bidang, termasuk clustering pada data klinik [31], image compresing [32], wetermarking, [33] [34], klasifikasi dokumen [35], mapping gen [2] dan pencarian data series [36].

Algoritma Singular Value Decomposition (SVD) mempunyai kelebihan pada efisiensi waktu proses [26] untuk digunakan pada dataset yang berskala besar [37] [38], dapat digunakan untuk memaksimalkan data ekstraksi pada algoritma PCA [31] serta dapat beroperasi dijantung algoritma PCA untuk mendapatkan nilai left eigenvector [37] [38]. Namun kekurangan

SVD selain tidak dapat melakukan

perhitungan jika dataset memiliki elemen yang hilang (missing value) [31] juga hasil data ekstraknya kurang maksimal disebabkan korelasi antar atribut belum bersih 100%

dibanding dengan algoritma Principal Component Analysis (PCA)

[39] [40].

Commented [i9]: Mengapa Memilih Algoritma SVD dan menjawab mengapa perlu memaksimalkan Varince score pada algoritma PCA serta masalah pada METODE

Algoritma Principal Component Analysis (PCA) diperkenalkan oleh Pearson dan

CATATAN: UNTUK ANAK Strata 1 (S1) CUKUP MASALAH PADA OBJEK PENELITIAN

Hotelling termasuk

metode eksplorasi statistik

multidimensi dengan latar

belakang matematika aljabar linier dan eigen analysis. Cara kerja PCA adalah menemukan himpunan bilangan orthogonal dengan menggunakan teknik SVD [37]] [38] dari proyeksi matriks vektor pada atribut ekstraksi dengan memaksimalkan

variancess

data,

kemudian

mengurangi

dimensi

melalui

kombinasi linear dari variabel awal tanpa mengorbankan akurasi [17] [3].

Kelebihan algoritma Principal Component Analysis (PCA) mampu menghasilkan data ekstrak

yang lebih signifikan dibandingkan dengan SVD, menghilangkan

korelasi 100% [39] [40] dan mampu mengolah hasil data ekstrak algoritma SVD dengan cara meningkatkan pemisahan antara sampel dari kelas yang berbeda serta mengurangi

pemisahan

antara sampel

dari kelas yang sama [40] [25],

menghasilkan variable baru (principal component) yang berisi scores principal component hasil kombinasi linier dari variable asli, namun kekurangan algoritma Principal Component Analysis (PCA) lambat memproses dataset dibanding dengan algoritma SVD [26] [38].

Commented [i10]: Mengapa Meilih PCA

Berdasarkan dari paparan kelebihan dan kekurangan dari metode yang ada pada teknik pengurangan dimensi, maka dapat dirangkumkan bahwa teknik aljabar linier secara signifikan lebih sederhana dari beberapa teknik pengurangan dimensi yang ada seperti Canonical Correlation Analysis (CCA), Partial Least Square (PLS) dan Linear Discriminant Analysis (LDA).

Algoritma

Principal

Component

Analysis

(PCA)

dan

Singular

Value

Decomposition (SVD) adalah dua algoritma yang menggunakan teknik aljabar linier, kedua keunggulan algoritma ini dapat digabungkan untuk memproses data yang kompleks dan berskala besar.

Algoritma Singular Value Decomposition (SVD) memiliki kelebihan pada efisiensi waktu proses, dan menghasilkan data ekstrak (left eigenvectors), dimana pada algoritma PCA disebut sebagai principal component, namun kurang maksimal hasil data ekstraknya dibanding dengan algoritma PCA, dan juga kekurangan algoritma SVD tidak dapat melakukan perhitungan jika dataset memiliki elemen yang hilang (missing value), oleh karena itu memerlukan proses pengolahan awal data.

Algoritma Principal Component Analysis (PCA) mampu memproses data ekstrak dari algoritma SVD, dengan menghasilkan variable baru (principal component) yang berisi scores principal component, namun kekurangan algoritma PCA sangat lambat memproses dataset yang berskala besar dibanding dengan algoritma SVD.

Commented [i11]: SOLUSI PADA MASALAH

Berdasarkan dari paparan pada rangkuman diatas, maka pada penelitian ini mengusulkan “Pengolahan Awal Data dan Penerapan Algoritma Singular Value Decomposition (SVD) untuk M emaksimalkan Variances Score Principal Analysis dan Efisiensi Waktu pada Algoritma Principal Component Analysis (PCA)”.

Commented [i12]: TUJUAN penelitian,..pada tahap inilah muncul JUDUL/THEMA JADI JUDUL/THEMA MUNCUL PADA LATAR BELAKANG MASALAH...

1.2 Rumusan Masalah Dari latar belakang masalah, maka permasalahan yang dirumuskan yaitu:

Masalah umum: Tersedianya jumlah basis data biomedis yang berlimpah, berupa basis data publik (internet) dimana datasetnya dari peneliti-peneliti individu dan dari praktekpraktek klinik, dan juga tersedia berupa digitisasi informasi, seperti laporan lab, data pasien, paper penelitian, gambar anatomik dan sejumlah data perawatan pasien. Namun dataset biomedis memiliki ribuan atribut serta ribuan jumlah record yang saling berinteraksi yang menghasilkan data kompleks dan berskala Commented [i13]: Masalah umum yang dijabarkan adalah obejk penelitian,.masalah umum ini untuk anak S1 diterapkan MASALAH pada OBJEK ATAU masalah ini yang digarap oleh ANAK STRATA 1 (SI)

besar.

Masalah spesifik: Algoritma Singular

Value Decomposition

(SVD)

tepat

digunakan

untuk

memproses dataset yang berskala besar dan kompleks, dan cepat dalam memproses dataset yang berskala besar, namun hasil data ekstrak SVD kurang maksimal dibanding dengan PCA.

Algoritma Principal Component Analysis (PCA) mampu memproses score left eigenvector (data ekstrak ) dari algoritma SVD, yang disebut sebagai score principal component, namun algoritma PCA sangat lambat memproses dataset Commented [i14]: MASALAH SPESIFIK ini yang digarap oleh anak S2

berskala besar.

Pertanyaan penelitian ini yaitu, seberapa cepat waktu proses dan seberapa maksimal nilai variances score principal component pada algoritma PCA, jika dataset

diproses

terlebih

Decomposition (SVD).

dahulu

menggunakan

algoritma

Singular

Value Commented [i15]: Pertanyaan Penelitian yang harus dijawan pada BAB V Kesimpulan dan saran.

1.3 Tujuan Penelitian Tujuan dari penelitian ini adalah untuk memaksimalkan variances score principal component dan efisiensi waktu proses pada algoritma Principal Component Commented [i16]: 1.Tujuan Penelitian nyambung dengan TUJUAN pada latar belakang masalah 2. Tujuan penelitian sama dengan JUDUL/Thema yang anglat diteliti.

Analysis (PCA)

Commented [i17R16]:

1.4 Manfaat Penelitian M anfaat dari penelitian ini adalah: 1.

M anfaat Umum:

Penelitian ini sangat membantu para peneliti dan praktisi biomedis, untuk memproses

informasi

yang

belum

terorganisir,

dimana

penelitian

ini

menghasilkan data yang telah siap pakai atau siap diproses pada model datamining, agar nantinya bermanfaaat pada masyarakat umum. 2.

M anfaat ilmu pengetahuan

Jumlah atribut yang telah dikurangi dan hasil nilai varian pada scores principal component yang lebih maksimal serta atribut yang tidak saling berkorelasi dapat dijadikan sebagai input variable, dan sangat berpengaruh pada efisiensi waktu proses serta dapat meningkatkan akurasi, antara lain: a) M odel cluster b) Analisa regresi berganda c) Analisa diskriminan d) Analisa factor e) Klasifikasi dengan menggunakan Neural Net

Commented [i18]: MANFAAT adalah setelah TUJUAN TERCAPAI,.manfaat kepada masyarakat tidak bisa diukur,..jadi yang diukur adalah Hasil pada Penerapan METODE...