Analisis Kanonik PDF

Title Analisis Kanonik
Author Tami Nur Herawati
Course Statistika
Institution Universitas Padjadjaran
Pages 20
File Size 454.7 KB
File Type PDF
Total Downloads 196
Total Views 737

Summary

TUGASANALISIS DATA MULTIVARIAT II“Analisis Kanonik”Diajukan sebagai salah satu syarat untuk memenuhi nilai mata kuliah Analisis Data Multivariat IIDosen : Titi Purwandari , Dra., MS.Disusun oleh : Tami Nur Herawati (140610190045)Kelas : ADEPARTEMEN STATISTIKAFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ...


Description

TUGAS ANALISIS DATA MULTIVARIAT II “Analisis Kanonik” Diajukan sebagai salah satu syarat untuk memenuhi nilai mata kuliah Analisis Data Multivariat II Dosen : Titi Purwandari , Dra., MS.

Disusun oleh : Tami Nur Herawati (140610190045)

Kelas : A

DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PADJADJARAN 2021

I.

TEORI Analisis korelasi kanonik merupakan analisis statistika multivariat yang mengidentifikasi serta menyelidiki keeratan hubungan antara dua kelompok variabel. Salah satu kelompok variabel berperan sebagai kelompok variabel predictor (x1, x2, …, xp) sedangkan kelompok variabel lainnya merupakan sekelompok peubah respon ( y1, y2, …, yp). Dependency antara kedua kelompok variabel dapat menjelaskan pengaruh dari satu kelompok variabel terhadap kelompok variabel lainnya. Prinsip dasar analisis ini adalah mencari fungsi kanonik yang merupakan pasangan variat kanonik ( Um, Vm) dan memaksimumkan kombinasi linear yang terbentuk dari kedua himpunan variabel tersebut. Bentuk dari kombinasi linear pada analisis korelasi kanonik sebagai berikut: u= a' x= a1 x 1 +…+ a p x p '

v =b x =b1 x 1 +…+ bq x q

Di mana a' = (a1, a2, …, ap) merupakan vektor konstanta, x ' = (X1, X2, …, Xp) merupakan kelompok peubah, vektor b' = (b1, b2, …, bq), dan kelompok peubah ' ' ' y = (Y1, Y2, …, Yq). Kemudian a dan b merupakan bobot kanonik atau koefisien kanonik. Dalam menggunakan analisis ini, terdapat sejumlah asumsi yang perlu dipenuhi, diantaranya adalah:

1. Himpunan peubah prediktor x dengan peubah respon y bersifat linear atau memiliki hubungan yang linear. 2. Data dari kedua himpunan variabel bersifat normal multivariat. 3. Data bersifat homokedastisitas, yaitu varian dan error terlihat konstan melewati batas nilai dari peubah prediktor. 4. Data bersifat nonmultikolinearitas, yaitu peubah tidak mempunyai korelasi yang tinggi dengan peubah prediktor yang lain. Terdapat 3 metode dalam menginterpretasikan fungsi kanonik, yaitu: 1. Bobot Kanonik (Canonical Weight) Bobot kanonik merupakan koefisien kanonik yang telah dibakukan, bobot ini dapat diinterpretasikan sebagai besarnya keeratan peubah asal terhadap peubah kanonik. Semakin besar nilai koefisien pada bobot kanonik menyatakan semakin tinggi tingkat keeratan peubah yang bersangkutan terhadap peubah kanonik dan berlaku sebaliknya. 2. Struktur Kanonik (Canonical Loading) Korelasi struktur kanonik merupakan korelasi linear sederhana antara peubah asal dengan masing-masing peubah kanoniknya. 3. Struktur Silang Kanonik (Canonical Cross-loading)

Muatan silang kanonik memberikan sebuah ukuran yang lebih tepat untuk hubungan peubah respond an predictor, muatan ini dapat dihitung dari perkalian nilai korelasi kanonik dengan nilai muatan kanonik. II.

ALGORITMA 1. Tentukan tujuan dan spesifikasi dari masing-masing variabel dari data 2. Lakukanlah pengujian asumsi, antara lain:  Data memiliki distribusi normal multivariat,  Tidak terjadi fenomena multikolinearitas pada data,  Data bersifat homoskedastis,  Terdapat hubungan yang linear antara peubah predictor x dengan peubah respon y. 3. Memilih fungsi kanonik Langkah ini dilakukan untuk mengetahui maksimum fungsi kanonik yang terbentuk. Penentuan fungsi yang akan dipilih dilakukan dengan melihat tingkat signifikansinya. 4. Menginterpretasikan peubah kanonik menggunakan salah satu dari ketiga metode yang telah dijelaskan pada bagian teori, antara lain :  Bobot Kanonik (Canonical Weight)  Struktur Kanonik (Canonical Loading)  Struktur Silang Kanonik (Canonical Cross-Loading) 5. Melakukan uji signifikansi wilks-lambda

III.

FLOWCHART

Gambar 3.1. Flowchart Algoritma Korelasi Kanonik

IV.

FUNGSI R Dengan syntax pada software R kor.kanonik=function(data,p,q,type=c("kovarians","korela si"),alpha){ if (type=="kovarians"){ ##MATRIX KOVARIANS cat("KORELASI KANONIK DENGAN MATRIX KOVARIANS\n") cat("\n") n=nrow(data) matkov=cov(data) cat("Matrix Kovarians\n") print(matkov) cat("\n") yy=matkov[1:q,1:q] yx=matkov[1:q,(q+1):(q+p)] xx=matkov[(q+1):(q+p),(q+1):(q+p)] xy=matkov[(q+1):(q+p),1:q] k=min(p,q)

ve.yy.u=eigen(yy)$vectors[1:q,1:k] cat("Variabel Kanonik U (kolom)\n") print(ve.yy.u) cat("\n") ve.xx.v=eigen(xx)$vectors[1:p,1:k] cat("Variabel Kanonik V (kolom)\n") print(ve.xx.v) cat("\n")

ro2=solve(yy)%*%yx%*%solve(xx)%*%xy eigen(ro2) ne.ro2=eigen(ro2)$values kor.uv=rep(k,1) for (i in 1:k){ kor.uv[i]=sqrt(ne.ro2[i]) } cat("Korelasi antar Variabel Kanonik\n") print(data.frame(Korelasi.UV=kor.uv)) cat("\n")

cat("Korelasi antar Variabel Y (baris) dengan Variabel U (kolom)\n") ne.yy=eigen(yy)$values ve.yy=eigen(yy)$vectors output.yu=matrix(nrow=q,ncol=q) for (i in 1:q){ for (j in 1:q){ output.yu[i,j]=(ve.yy[j,i]*(sqrt(ne.yy[i])))/ (sqrt(yy[j,j])) } } print(t(output.yu[1:k,1:q])) cat("\n") cat("Korelasi antar Variabel X (baris) dengan Variabel V (kolom)\n") ne.xx=eigen(xx)$values ve.xx=eigen(xx)$vectors output.xv=matrix(nrow=p,ncol=p) for (i in 1:p){ for (j in 1:p){ output.xv[i,j]=(ve.xx[j,i]*(sqrt(ne.xx[i])))/ (sqrt(xx[j,j])) } } print(t(output.xv[1:k,1:p])) cat("\n")

cat("UJI SIGNIFIKANSI\n") cat("Hipotesis\n") cat("H0 : Korelasi Kanonik yang dihasilkan TIDAK Signifikan\n") cat("H1 : Korelasi Kanonik yang dihasilkan Signifikan\n") cat("Taraf Signifikan (alpha) = ") print(alpha) cat("\n") A=(det(matkov))/(det(yy)*det(xx)) chi.hitung=-(n-(0.5*(p+q+2)))*log(A) chi.tabel=qchisq((1-alpha),p+q) cat("UJI Wilks' Lambda\n") cat("Hasil Uji:")

if (chi.hitung>=chi.tabel)"H0 DITOLAK" else"H0 DITERIMA" } else { ##MATRIX KORELASI cat("KORELASI KANONIK DENGAN MATRIX KOVARIANS\n") cat("\n") n=nrow(data) matkor=cor(data) cat("Matrix Korelasi\n") print(matkor) cat("\n") yy=matkor[1:q,1:q] yx=matkor[1:q,(q+1):(q+p)] xx=matkor[(q+1):(q+p),(q+1):(q+p)] xy=matkor[(q+1):(q+p),1:q] k=min(p,q)

ve.yy.u=eigen(yy)$vectors[1:q,1:k] cat("Variabel Kanonik U (kolom)\n") print(ve.yy.u) cat("\n") ve.xx.v=eigen(xx)$vectors[1:p,1:k] cat("Variabel Kanonik V (kolom)\n") print(ve.xx.v) cat("\n")

ro2=solve(yy)%*%yx%*%solve(xx)%*%xy eigen(ro2) ne.ro2=eigen(ro2)$values kor.uv=rep(k,1) for (i in 1:k){ kor.uv[i]=sqrt(ne.ro2[i]) } cat("Korelasi antar Variabel Kanonik\n") print(data.frame(Korelasi.UV=kor.uv)) cat("\n")

cat("Korelasi antar Variabel Zy (baris) dengan

Variabel U (kolom)\n") ne.yy=eigen(yy)$values ve.yy=eigen(yy)$vectors output.yu=matrix(nrow=q,ncol=q) for (i in 1:q){ for (j in 1:q){ output.yu[i,j]=(ve.yy[j,i]*(sqrt(ne.yy[i])))/ (sqrt(yy[j,j])) } } print(t(output.yu[1:k,1:q])) cat("\n") cat("Korelasi antar Variabel Zx (baris) dengan Variabel V (kolom)\n") ne.xx=eigen(xx)$values ve.xx=eigen(xx)$vectors output.xv=matrix(nrow=p,ncol=p) for (i in 1:p){ for (j in 1:p){ output.xv[i,j]=(ve.xx[j,i]*(sqrt(ne.xx[i])))/ (sqrt(xx[j,j])) } } print(t(output.xv[1:k,1:p])) cat("\n")

cat("UJI SIGNIFIKANSI\n") cat("Hipotesis\n") cat("H0 : Korelasi Kanonik yang dihasilkan TIDAK Signifikan\n") cat("H1 : Korelasi Kanonik yang dihasilkan Signifikan\n") cat("Taraf Signifikan (alpha) = ") print(alpha) cat("\n") A=(det(matkor))/(det(yy)*det(xx)) chi.hitung=-(n-(0.5*(p+q+2)))*log(A) chi.tabel=qchisq((1-alpha),p+q) cat("UJI Wilks' Lambda\n") cat("Hasil Uji:") if (chi.hitung>=chi.tabel)"H0 DITOLAK" else"H0 DITERIMA"

} }

V.

CONTOH KASUS

Provinsi ACEH SUMATERA UTARA SUMATERA BARAT

Y1 6.59 6.91 6.88

Y2 15.43 9.14 6.56

X1 9.33 9.54 8.99

X2 0.07 0.20 0.12

RIAU JAMBI SUMATERA SELATAN BENGKULU LAMPUNG KEP. BANGKA BELITUNG KEP. RIAU DKI JAKARTA JAWA BARAT JAWA TENGAH DI YOGYAKARTA JAWA TIMUR BANTEN BALI NUSA TENGGARA BARAT NUSA TENGGARA TIMUR KALIMANTAN BARAT KALIMANTAN TENGAH KALIMANTAN SELATAN KALIMANTAN TIMUR KALIMANTAN UTARA SULAWESI UTARA SULAWESI TENGAH SULAWESI SELATAN SULAWESI TENGGARA GORONTALO SULAWESI BARAT MALUKU MALUKU UTARA PAPUA BARAT PAPUA

6.32 5.13 5.51 4.07 4.67 5.25 10.34 10.95 10.46 6.48 4.57 5.84 10.64 5.63 4.22 4.28 5.81 4.58 4.74 6.87 4.97 7.37 3.77 6.31 4.58 4.28 3.32 7.57 5.15 6.80 26.80

7.04 7.97 12.98 15.30 12.76 4.89 6.13 4.69 8.43 11.84 12.80 11.46 6.63 4.45 14.23 21.21 7.24 5.26 4.83 6.64 7.41 7.78 13.06 8.99 11.69 15.59 11.50 17.99 6.97 21.70 6.69

9.14 8.55 8.24 8.84 8.05 8.06 10.12 11.13 8.55 7.69 9.55 7.78 8.89 8.95 7.31 7.63 7.37 8.59 8.29 9.77 9 9.49 8.83 8.38 9.04 7.82 7.89 9.93 9.04 7.6 20.38

0.09 0.26 0.23 0.19 0.12 0.68 0.14 0.10 0.13 0.30 0.06 1.00 0.13 0.13 2.82 2.73 1.58 0.12 0.17 0.20 0.72 0.10 0.71 1.88 1.16 0.34 3.08 0.55 0.29 1.82 4.28

Sumber www.bps.go.id

Data yang diambil terdiri dari sampel sebanyak 34 provinsi, mengenai Persentase Pengangguran Terbuka (Y1), Persentase Kemiskinan (Y2) yang merupakan variabel dependen, Persentase Rata rata lama sekolah (X1), dan Persentase penduduk buta huruf (X4). Dari data tersebut akan dilakukan analisis hubungan/korelasi antara himpunan variabel dependen Y (Y1 dan Y2) dengan himpunan variabel independen X (X1, X2).

Sebelumya akan dilakukan pengujian asumsi yaitu uji normalitas multivariat dan uji multikolinearitas, yaitu sebagai berikut.

Uji Asumsi Pada metode analisis korelasi kanonik terdapat asumsi yang harus terpenuhi, asumsi tersebut diantaranya sebagai berikut: 1. Linearitas. 2. Normalitas Multivariat 3. Non Multikoleniaritas 

Uji Linearitas

Linearitas, yaitu hubungan antara himpunan variabel independen x dengan variabel dependen y bersifat linear. Linieritas dapat dikatakan penting untuk analisis korelasi kanonik dan mempengaruhi dua aspek hasil korelasi kanonik. Pertama, jika variabel yang berhubungan tidak linier, maka hubungan tidak akan dapat dijelaskan oleh koefisien korelasi kanonik. Kedua, analisis korelasi kanonik memaksimalkan hubungan linier antar himpunan variabel. Berikut uji linieritas dengan menggunakan software R. Hipotesis H0: �� = �� = ⋯ = �� ; tidak ada kesalahan spesifikasi terhadap model linear. H1: �� ≠ ��, dimana � = 1,2, … , � ; terdapat kesalahan spesifikasi terhadap model linear. Taraf Signifikansi: α = 0.05 Statistik Uji: Ramsey Reset Test. Berikut output yang dihasilkan dari Ramsey Reset Test menggunakan software R : > library(lmtest) > attach(data) The following objects are masked from data (pos = 5):

X1, X2, Y1, Y2

> resettest((Y1+Y2)~(X1+X2))

RESET test

data:

(Y1 + Y2) ~ (X1 + X2)

RESET = 0.37862, df1 = 2, df2 = 29, p-value = 0.6881 Kriteria Uji: Tolak H0, jika p-value ≤ α Kesimpulan Berdasarkan hasil pengujian tersebut, diketahui bahwa nilai p- value sebesar 0.6881 dimana nilai tersebut lebih besar dari α = 0.05. Maka, hasil pengujian dapat dikatakan nonsignifikan atau gagal menolak H 0. Artinya, tidak ada kesalahan spesifikasi terhadap model linear. Maka asumsi linieritas terpenuhi.



Normalitas Multivariat

Berikut uji asumsi normalitas multivariat dengan menggunakan software R. Hipotesis H0: data mengikuti distribusi normal multivariat. H1: data tidak mengikuti distribusi normal multivariat. Taraf Signifikansi: α = 0.05 Statistik Uji: Kolmogorov-smirnov. Berikut output yang dihasilkan menggunakan software R : > y=data > mu=colMeans(y) > n=row(y) > p=ncol(y) > cov=cov(y) > d=sort(mahalanobis(y,mu,cov)) > j=qchisq(ppoints(n),df=p) > ks.test(d,j,df=p)

Two-sample Kolmogorov-Smirnov test data: d and j D = 0.25, p-value = 0.05974 alternative hypothesis: two-sided

Kriteria Uji: Tolak H0, jika p-value ≤ α Kesimpulan Berdasarkan hasil pengujian tersebut, diketahui bahwa nilai p- value sebesar 0.06 dimana nilai tersebut lebih besar dari α = 0.05. Maka, hasil pengujian dapat dikatakan nonsignifikan atau gagal menolak H0. Artinya, data mengikuti distribusi normal multivariat. Maka asumsi normalitas multivariat terpenuhi.



Non Multikoleniaritas

Multikolinieritas terjadi ketika beberapa variabel independen mempunyai korelasi yang tinggi dengan variabel independen yang lain. Dalam hal ini, asumsi yang harus terjadi adalah tidak adanya multikolinieritas antar anggota kelompok variabel, baik itu variabel dependen maupun variabel independen. Berikut uji asumsi multikolinieritas dengan menggunakan software R.

Hipotesis H0: tidak terdapat korelasi antar variabel. H1: terdapat korelasi antar variabel. Taraf Signifikansi: α = 0.05 Statistik Uji: Ramsey Reset Test. Berikut output yang dihasilkan menggunakan software R :

> r=cor(y) > diag(solve(r)) Y1

Y2

X1

X2

X2 1.463205 1.707372 1.818513 1.727670

Semua variabel di atas memiliki nilai VIF yang kurang dari 10 yaitu: Variabel y1 = 1.463205 Variabel y2 = 1.707372 Variabel x1 = 1.818513 Variabel x2 = 1.727670

Kriteria Uji : Jika nilai VIF

¿ 10 maka gagal tolak

H0

artinya tidak terjadi korelasi antara variabel

independen atau No Multikolinieritas. Kesimpulan Berdasarkan hasil pengujian tersebut, diketahui bahwa nilai variance inflation factor (VIF) semua variabel kurang dari 10 artinya tidak terdapat korelasi antar variabel. Maka asumsi non multikolinieritas terpenuhi.

KESIMPULAN Setelah dilakukan ketiga uji asumsi diatas, dapat disimpulkan bahwa asumsi linearitas, normal multivariat, dan non multikoleniaritas terpenuhi. Dengan demikian, maka data diatas dapat dianalisis menggunakan analisis korelasi kanonik

Analisis Korelasi Kanonik Hasil pengujian asumsi yang dilakukan memenuhi semua asumsi untuk analisis koralasi kanonik, oleh karena itu akan dilakukan analisis kanonik dengan function yang telah dibuat sebelumnya. > kor.kanonik(data,2,2,type="kovarians",0.05) KORELASI KANONIK DENGAN MATRIX KOVARIANS

Matrix Kovarians Y1 Y1

Y2

4.052690 -3.732699

X1

X2

1.0228699 -1.685099

Y2 -3.732699 29.300492 -2.3768464 11.299653 X1

1.022870 -2.376846

0.8617719 -1.590473

X2 -1.685099 11.299653 -1.5904731 12.152797

Variabel Kanonik U (kolom) [,1]

[,2]

[1,] -0.1432522 -0.9896862 [2,]

0.9896862 -0.1432522

Variabel Kanonik V (kolom) [,1]

[,2]

[1,] -0.1368721 -0.9905887 [2,]

0.9905887 -0.1368721

Korelasi antar Variabel Kanonik Korelasi.UV 1

0.6733027

2

0.3887695

Korelasi antar Variabel Y (baris) dengan Variabel U (kolom) [,1]

[,2]

[1,] -0.3887180 -0.92135676 [2,]

0.9987693 -0.04959819

Korelasi antar Variabel X (baris) dengan Variabel V (kolom) [,1]

[,2]

[1,] -0.5186189 -0.85500552 [2,]

0.9995050 -0.03145925

OUTPUT Dari output diatas, dapat dilihat variabel kanonik yang dihasilkan dari masing-masing himpunan variabel dependen Y yaitu variabel/kombinasi linear U, dan himpunan variabel independen X yaitu variabel V, dengan masing-masing kombinasi linear yang dihasilkan sebagai berikut : �� = �� � Y = -0.143 Y1 + 0.990 Y2 �� = �TY = -0.990Y1 - 0.143 Y2 2

�� = �� � X = -0.137 X1 + 0.990 X2 �� = �� � X = -990 X1 – 0.137 X2 Selain itu, dapat dilihat korelasi antar variabel kanonik yang dihasilkan sebagai berikut :  

Korelasi variabel kanonik antara variabel U1 dengan V1 r1 = cor (U1,V1) = 0.6733027 Korelasi variabel kanonik antara variabel U2 dengan V2 r2 = cor (U2,V2) = 0.3887695

Setelah diperoleh nilai koefisien dari fungsi kanonik, langkah selanjutnya adalah



melakukan pengujian apakah koefisien yang didapatkan signifikan secara nyata atau tidak. Salah satu statistik uji yang sering digunakan ialah Statistik Uji Wilks Lambda. Dalam hal ini, akan dilakukan perhitungan menggunakan dengan pendekatan Distribusi Chi-Kuadrat dan Distribusi F dimana statistik Wilks Lambda dapat dicari dengan rumus perkalian dari (1 − �2 ) dari kanonik ke-j hingga ke-k, dengan rumusan hipotesis sebagai berikut : Hipotesis �0∶

r k =0 , artinya koefisien korelas i kanonik tidak signifikan.

�1 ∶ minimal satu signifikan

r k ≠ 0 , artinya paling tidak ada satu korelasi kanonik yang

Taraf Signifikansi : α = 0.05 Statistik Uji : Wilks Lambda Berikut output yang dihasilkan menggunakan software R : UJI SIGNIFIKANSI Hipotesis H0 : Korelasi Kanonik yang dihasilkan TIDAK Signifikan H1 : Korelasi Kanonik yang dihasilkan Signifikan Taraf Signifikan (alpha) = [1] 0.05 UJI Wilks' Lambda Hasil Uji:[1] "H0 DITOLAK"

Kriteria Uji : Tolak H0, jika p-value ≤ α Kesimpulan : Berdasarkan output diatas menghasilkan pengujian yang monolak H 0, artinya dengan taraf signifikan 5% pendapat mendukung bahwa fungsi kanonik yang dihasilkan pada analisis korelasi kanonik tersebut adalah signifikan atau dapat digunakan....


Similar Free PDFs