Langsung ke konten utama

Analisis Regresi Sederhana

Analisis Regresi Sederhana adalah sebuah metode pendekatan untuk pemodelan hubungan antara satu variabel dependen dan satu variabel independen. Dalam model regresi, variabel independen menerangkan variabel dependennya. Dalam analisis regresi sederhana, hubungan antara variabel bersifat linier, dimana perubahan pada variabel X akan diikuti oleh perubahan pada variabel Y secara tetap. Sementara pada hubungan non linier, perubahaan variabel X tidak diikuti dengan perubahaan variabel y secara proporsional. seperti pada model kuadratik, perubahan x diikuti oleh kuadrat dari variabel x. Hubungan demikian tidak bersifat linier.
Secara matematis model analisis regresi linier sederhana dapat digambarkan sebagai berikut:
Y = A + BX + e
Y adalah variabel dependen atau respon
A adalah intercept atau konstanta
B adalah koefisien regresi atau slope
e adalah residual atau error
Secara praktis analisis regresi linier sederhana memiliki kegunaan sebagai berikut:
1. Model regresi sederhana dapat digunakan untuk forecast atau memprediksi nilai Y. Namun sebelum melakukan forecasting, terlebih dahulu harus dibuat model atau persamaan regresi linier. Ketika model yang fit sudah terbentuk maka model tersebut memiliki kemampuan untuk memprediksi nilai Y berdasarkan variabel Y yang diketahui. Katakanlah sebuah model regresi digunakan untuk membuat persamaan antara pendapatan (X) dan konsumsi (Y). Ketika sudah diperoleh model yang fit antara pendapatan dengan konsumsi, maka kita dapat memprediksi berapa tingkat konsumsi masyarakat ketika kita sudah mengetahui pendapatan masyarakat.
2. Mengukur pengaruh variabel X terhadap variabel Y. Misalkan kita memiliki satu serial data variabel Y, melalui analisis regresi linier sederhana kita dapat membuat model variabel-variabel yang memiliki pengaruh terhadap variabel Y. Hubungan antara variabel dalam analisis regresi bersifat kausalitas atau sebab akibat. Berbeda halnya dengan analisis korelasi yang hanya melihat hubungan asosiatif tanpa mengetahui apa variabel yang menjadi sebab dan apa variabel yang menjadi akibat.
Model regresi linier sederhana yang baik harus memenuhi asumsi-asumsi berikut:
1. Eksogenitas yang lemah, kita harus memahami secara mendasar sebelum menggunakan analisis regresi bahwa analisis ini mensyaratkan bahwa variabel X bersifat fixed atau tetap, sementara variabel Y bersifat random. Maksudnya adalah satu nilai variabel X akan memprediksi variabel Y sehingga ada kemungkinan beberapa variabel Y. dengan demikian harus ada nilai error atau kesalahan pada variabel Y. Sebagai contoh ketika pendapatan (X) seseorang sebesar Rp 1 juta rupiah, maka pengeluarannya bisa saja, Rp 500 ribu, Rp 600 ribu, Rp 700 ribu dan seterusnya.
2. Linieritas, seperti sudah dijelaskan sebelumnya bahwa model analisis regresi bersifat linier. artinya kenaikan variabel X harus diikuti secara proporsional oleh kenaikan variabel Y. Jika dalam pengujian linieritas tidak terpenuhi, maka kita dapat melakukan transformasi data atau menggunakan model kuadratik, eksponensial atau model lainnya yang sesuai dengan pola hubungan non-linier.
3. Varians error yang konstan, ini menjelaskan bahwa varians error atau varians residual yang tidak berubah-ubah pada respon yang berbeda. asumsi ini lebih dikenal dengan asumsi homoskedastisitas. Mengapa varians error perlu konstan? karena jika konstan maka variabel error dapat membentuk model sendiri dan mengganggu model. Oleh karena itu, penanggulangan permasalahan heteroskedastisitas/non-homoskedastisitas dapat diatasi dengan menambahkan model varians error ke dalam model atau model ARCH/GARCH.
4. Autokorelasi untuk data time series, jika kita menggunakan analisis regresi sederhana untuk data time series atau data yang disusun berdasarkan urutan waktu, maka ada satu asumsi yang harus dipenuhi yaitu asumsi autokorelasi. Asumsi ini melihat pengaruh variabel lag waktu sebelumnya terhadap variabel Y. Jika ada gangguan autokorelasi artinya ada pengaruh variabel lag waktu sebelumnya terhadap variabel Y. sebagai contoh, model kenaikan harga BBM terhadap inflasi, jika ditemukan atukorelasi artinya terdapat pengaruh lag waktu terhadap inflasi. Artinya inflasi hari ini atau bulan ini bukan dipengaruhi oleh kenaikan BBM hari ini namun dipengaruhi oleh kenaikan BBM sebelumnya (satu hari atau satu bulan tergantung data yang dikumpulkan).Sebuah penelitian terhadap pohon Mahoni, dimana akan diteliti apakah ada hubungan antara tinggi pohon dengan diameter batang pohon, dengan artian apakah ada pengaruh diameter batang pohon terhadap tinggi pohon tersebut.
Diambil sampel secara acak sejumlah delapan pohon mahoni.Dapat dilihat dari Tabel 1 pada kolom X dan Y.

Hal pertama yang akan kita lakukan adalah membentuk persamaan regresi, yaitu :
Y' = a + bX

Selanjutnya adalah menentukan konstanta a dan koefisien b, kita ikuti langkah sebagai berikut :


maka diperoleh :

Persamaan regresi diperoleh :
Y' = -1,3147 + 4,5413X

dimana :
Y' = Tinggi pohon mahoni yang diprediksi
X  = Diameter batang pohon mahoni

Interpretasi dari koefisien regresi :
  • Nilai a = -1,3147 artinya tidak ada diameter batang pohon maka tidak ada tinggi pohon. (karena tidak ada tinggi yang bernilai negatif sehingga dianggap nol).
  • Nilai b = 4,5413 artinya jika terjadi peningkatan diameter batang pohon mahoni satu satuan maka akan terjadi peningkatan tinggi pohon mahoni sebesar 4,5413 satuan.
Koefisien Determinasi R2 :
r = 0,886 bernilai positif dan kuat
artinya terdapat hubungan atau korelasi yang kuat antara tinggi pohon mahoni dengan diameter batang pohon mahoni. Semakin besar diameter batang pohon mahoni maka semakin tinggi batang pohon mahoni.

R= 0,886= 0,785
artinya sekitar 78,5% variasi dari variabel diameter batang pohon mahoni dapat menjelaskan variasi dari variabel tinggi pohon mahoni.
(cukup tinggi)

Standar Error Estimate Persamaan Regresi:
Jadi besarnya standar error estimate persamaan regresi adalah 6,6364. Hal ini menunjukkan penyimpangan data-data terhadap garis regresi, atau bagaimana penyimpangan data yang menyebar disekitar garis regresi.
(cukup kecil).

Pengujian Koefisien Regresi :

> Hipotesis Uji
Ho : b =  0
Ha : b ≠ 0

> Taraf Signifikansi
Pilih nilai signifikansi a = 5%

> Daerah Kritis
dengan nilai a = 5% dan derajat bebas n-2=8-2=6, maka diperoleh nilai t-tabel pada 5%/2 = 2,5% yaitu 2,447.

> Statistik Uji

> Keputusan
nilai t-hitung = 4,6805 > t-tabel = 2,447 sehingga Ho ditolak dan Ha diterima.

> Kesimpulan
Dengan tingkat signifikansi 5% cukup menjelaskan bahwa ada pengaruh diameter batang pohon mahoni terhadap tinggi pohon mahoni.

by MEYF


Reference:
- Mendenhall, Sincinch. 1996. A Second Course In Statistics. Regression Analysis. Fifth Edition. Prentice Hall Internatiomal Edition. 
- Priyatno, Duwi. 2010. Paham Analisa Statistik Data dengan SPSS. Mediakom. Yogyakarta.
- Sugiyono. 2008. Metode Penelitian Bisnis. Alfabeta. Bandung.
- Sugiyono. 2009. Metode Penelitian Kuantitatif Kualitatif dan R & B. Bandung.
- Sugiyono, 2008. Statistik Nonparametris untuk Penelitian. Alfabeta. Bandung.
-Supranto, J. 2004. Analisis Multivariat : Arti dan Interpretasi. Rineka Cipta. Jakarta.
-Walpole, Ronald E. 1992. Pengantar Statistika Edisi ke-3. PT Gramedia Pustaka Utama. Jakarta.



Komentar

Postingan populer dari blog ini

Uji Anova(Uji F)

Anova adalah sebuah analisis statistik yang menguji perbedaan rerata antar grup. Grup disini bisa berarti kelompok atau jenis perlakuan. Anova ditemukan dan diperkenalkan oleh seorang ahli statistik bernama Ronald Fisher. Anova merupakan singkatan dari Analysis of variance. Merupakan prosedur uji statistik yang mirip dengan t test. Namun kelebihan dari Anova adalah dapat menguji perbedaan lebih dari dua kelompok. Berbeda dengan  independent sample t test  yang hanya bisa menguji perbedaan rerata dari dua kelompok saja. Dalam kesempatan bahasan kali ini, statistikian  akan menjelaskannya secara singkat namun dengan penuh harapan agar para pembaca mudah memahami dan mempraktekkannya dalam penelitian di lapangan nantinya. Kegunaan Anova Anova digunakan sebagai alat analisis untuk menguji hipotesis penelitian yang mana menilai adakah perbedaan rerata antara kelompok. Hasil akhir dari analisis ANOVA adalah nilai F test atau F hitung. Nilai F Hitung ini yang nantin...

Penyimpangan Data

PENGUKURAN PENYIMPANGAN DATA Pengukuran penyimpangan data adalah suatu ukuran yang menunjukkan tinggi  rendahnya perbedaan data yang diperoleh dari rata-ratanya. Ukuran penyimpangan digunakan untuk mengetahui luas penyimpangan data atau homogenitas data. Dua variabel data yang memiliki mean sama belum tentu memiliki kualitas yang sama, tergantung dari besar atau kecil ukuran penyebaran datanya. Ada bebarapa macam ukuran penyebaran data, namun yang umum digunakan adalah standar deviasi. Macam-macam ukuran penyimpangan data adalah : Jangkauan ( range ) Simpangan rata-rata ( mean deviation ) Simpangan baku ( standard deviation ) Varians ( variance ) Koefisien variasi ( Coefficient of variation ) 1. Jangkauan ( range ) Range adalah salah satu ukuran statistik yang menunjukan jarak penyebaran data antara nilai terendah (Xmin) dengan nilai tertinggi (Xmax). Ukuran ini sudah digunakan pada pembahasan daftar distribusi frek...

Besar Sampel dan Sumber Data

Dalam statistik inferensial, besar  sampel sangat menentukan representasi sampel yang diambil dalam menggambarkan  populasi penelitian. Oleh karena itu menjadi satu kebutuhan bagi setiap peneliti untuk memahami kaidah-kaidah yang benar dalam menentukan sampel minimal dalam sebuah penelitian. Cara menghitung besar sampel suatu penelitian sangat ditentukan oleh desain penelitian  yang digunakan dan data yang diambil. Jenis penelitian observasional dengan menggunakan disain cross-sectional akan berbeda dengan case-control study dan khohor, demikian pula jika data yang dikumpulkan adalah proporsi akan beda dengan jika data yang digunakan adalah data continue. Pada penelitian di bidang kesehatan masyarakat, kebanyakan menggunakan disain atau pendekatan  cross-sectional  atau belah lintang, meskipun ada beberapa yang menggunakan  case control ataupun khohor . Terdapat banyak rumus untuk menghitung besar sampel ...