"Ini jawaban versi saya, belum tentu benar.
Untuk menghasilkan estimasi yang BLUE (best linear unbiased estimator), maka asumsi-asumsi melandasi parameternya harus dipenuhi. Salah satu asumsi yang harus dipenuhi adalah mengenai variabel independen yang fixed atau nilai X independen terhadap nilai gangguan u.
Nilai X yang fixed pada sampling berulang
merupakan konsekuensi dari konsep regresi yang mengandalkan pada nilai
rata-rata kondisional atau conditional
mean (E(Y|X). Garis regresi pada dasarnya merupakan gabungan dari nilai
rata-rata variabel acak Y pada nilai X yang fixed. Secara intuitif, alasan
mengapa nilai X seharusnya fixed pada sampling berulang adalah sebagai berikut.
Kita mengetahui bahwa nilai parameter OLS
menyatakan bahwa bervariasinya nilai Y pada setiap nilai X adalah akibat adanya
gangguan u. Sehingga, ketika nilai gangguan u berubah, hal tersebut akan
mengubah juga nilai Y. Maka, parameter regresi tidak semestinya menjelaskan
perubahan Y tersebut akibat X, karena perubahan disebabkan gangguan u. Namun
karena kita tidak mengetahui nilai u (hanya distribusi probabilitasnya saja),
ketika X tidak mengikuti nilai fixed, atau stokastik dengan distribusi
probabilitas tertentu, maka peningkatan u dapat saja juga diikuti peningkatan
X.. Hal tersebut tidak akan terjadi selama cov(Xi,ui)=0.
Maka, parameter regresi akan menjelaskan perubahan nilai Y disebabkan variasi
pada nilai u, sekaligus nilai X jika gangguan u dan nilai X tidak independen.
Sehingga, kita dapat menetapkan nilai X berapa saja tanpa memengaruhi properti
dari gangguan u.
Dalam ilmu semacam ekonomika, sulit untuk
melakukan eksperimen yang bisa membuat nilai X tersebut fixed, kemudian untuk
mencari beberapa nilai Y pada satu X. Misalnya untuk melihat pengaruh investasi
terhadap peningkatan output. Bukankah data investasi bukan fixed pada sampling
berulang, namun sebuah variabel acak? Hal tersebut banyak berlaku pada ilmu
ekonomi yang data-datanya merupakan hasil observasi, berbeda dengan data eksperimen
yang mana nilai X dapat dikontrol. Seperti yang telah disebutkan bahwa variabel
X boleh saja tidak fixed pada repeated sampling (jadi ia stokastik berdasarkan
distribusi probabilitas tertentu) asalkan ia memenuhi asumsi bahwa ia
independen terhadap nilai gangguan u, sehingga muncul asumsi bahwa cov(Xi,ui)=0.
Secara matematis, nilai variabel X yang
independen terhadap gangguan u dapat dijelaskan pada sebagai berikut. Parameter
BLUE jika nilai parameter estimasi sama dengan parameter population regression
function-nya (PRF)Dengan menuliskan kembali persamaan parameternya
Persamaan
regresi dituliskan kembali dan disubtitusikan pada persamaan
Maka diperoleh
Berdasarkan
persamaan tersebut, untuk memperoleh nilai parameter yang tidak bias maka,
nilai X haruslah non-stokastik. Nilai X yang non-stokastik akan berimplikasi
pada nilai harapan pada bagian kedua persamaan di sebelah kanan sama dengan
nol, sehingga nilai parameter tidak bias.
Namun, jika X adalah suatu variabel acak yang nilainya berdasarkan
distribusi probabilitas tertentu, maka ada kemungkinan bahwa nilai X dan
gangguan u tidak independen, sehingga nilai harapan dari X dan u tidak sama
dengan nol.
Kasus
pada model simultan yang mana nilai salah satu variabel independen yang pada
persamaan lain merupakan variabel endogen, maka variabel indepeden tersebut memiliki
sifat variabel endogen, yaitu stokastik. Sifat variabel endogen yang melekat
pada dirinya, menyebabkan masalah ketika ia berada di barisan variabel
independen karena ada kemungkinan cov(Xi,ui)≠0.
Update: persamaan-persamaan pertama saya dengan menggunakan LaTeX hehe, yang penasaran bisa cek link ini
Tidak ada komentar:
Posting Komentar