Title | Topic 4-Case Study (Multiple Linear Regression) |
---|---|
Course | Data Mining |
Institution | Universitas Pelita Harapan |
Pages | 9 |
File Size | 875.4 KB |
File Type | |
Total Downloads | 91 |
Total Views | 121 |
Topic 4-Case Study (Multiple Linear Regression)
Data mining...
Topic 4 - MLR: Case Study
Var. y: HOAO Var. x: JNK,….,HYG
Pt :harga hariini Pt +1 :harga besok
Pt =log Korelasi
( )
Pt +1 = log Pt +1−log Pt Pt
JNK: sangat signifikan VGLT & VGSH: signifikannya kecil Cuma di level 10% p-value cukup kecil
Tdk terlihat ada heterodescacity, namun homodescacity cukup kurang
Variansi dari residu tdk terlalu besar → masih bisa diterima
Cukup berdistribusi normal
Tahap 1: mencari dr ke-10 variable itu, variable mana yg menghasilkan
R2 paling tinggi
Tahap 2: menambah variable lain sebagai regressor untuk model yg baru Ingin tahu apakah penambahan variable akan memperbaiki R2
2
R =0,4711413
Adj-R-square yg di dpt tidak lebih baik drpd adj-R-squared full model Kelemahan variable selection: 1. Algoritma ini tdk mencari dr semua kemungkinan 210 , hanya bbrp aja yg di consider 2. Tdk memperhitungkan transformasi atau kombinasi linear dr bbrp variable regressor 3. Tdk memperhitungkan researcher knowledge Tdk tau arti JNK, VGSH, dll
Cuma 1 point yg high leverage: pada data ke-245
Buat model tanpa data 245
Adj- R2 tidak lebih baik
Ada perubahan yg cukup signifikan dr setiap koefisien variabel2nya Kesimpulan: high leverage itu adalah poin yg unusual dan bukan representasi dr populasi sehingga bisa dibuang
Ada 10 model regresi
BIV: variable dgn VIF tertinggi shg bisa dibuang...