Beberapa waktu yang lalu ketika menguji sidang skripsi mahasiswa, saya menemukan adanya kesalahan dalam pemilihan metode regresi. Dimana dalam skripsi yang diuji tersebut menggunakan regresi linear atau ordinary least square, sedangkan seharusnya model penelitian seperti itu menggunakan regresi logistik atau binary logit. Hal ini sangat disayangkan, karena sebenarnya penelitian yang dilakukan mahasiswa tersebut sudah baik, penulisannya rapi dan teratur. Kesalahan dalam pemilihan model regresi yang seharusnya logistik tetapi dibuat linear, membuat seluruh hasil di Bab 4 harus dirubah seluruhnya, dilakukan olah data ulang dan mengakibatkan revisi major. Hal ini mendorong saya untuk menulis tentang regresi linear dan regresi logistic, dengan harapan di masa yang akan datang, rekan – rekan mahasiswa maupun rekan peneliti dapat paham dan tidak keliru lagi dalam menentukan antara kedua metode olah data regresi ini.

Sebelum kita membahas lebih lanjut, pertama kita akan membahas apa itu regresi terlebih dahulu. Model regresi sering digunakan dalam penelitian kuantitatif. Regresi dilakukan dalam pengujian pengaruh, biasanya menguji antara pengaruh variable independen terhadap variable dependen (Sekaran & Bougie, 2016). Dikarenakan memiliki banyak manfaat, analisis regresi digunakan hampir pada semua bidang kehidupan, baik dalam bidang ekonomi, industri dan ketenagakerjaan, sejarah, pemerintahan, ilmu lingkungan, dan lain sebagainya.

Kegunaan analisis regresi adalah untuk mengetahui variabel-variabel kunci yang memiliki pengaruh terhadap suatu variabel bergantung, pemodelan, serta pendugaan (estimation) atau peramalan (forecasting). Selain itu, masih ada beberapa kegunaan lainnya, yakni:

  1. Membuat estimasi rata-rata dan nilai variabel tergantung dengan didasarkan pada nilai variabel bebas.
  2. Untuk menguji hipotesis karakteristik dependensi.
  3. Meramalkan nilai rata-rata variabel bebas yang didasari nilai variabel bebas diluar jangkauan sample.

Kemudian kita membahas bahwa terdapat regresi linear sederhana dan regresi linear berganda. Analisis regresi sederhana adalah sebuah metode pendekatan untuk pemodelan hubungan antara satu variabel dependen dan satu variabel independen. Dalam model regresi, variabel independen menerangkan variabel dependennya. Dalam analisis regresi sederhana, hubungan antara variabel bersifat linier, di mana perubahan pada variabel X akan diikuti oleh perubahan pada variabel Y secara tetap. Sedangkan regresi linear berganda adalah apabila variable independennya lebih dari satu, dalam artian dua, tiga, dan seterusnya.

Sementara kalau regresi logistik, digunakan untuk model regresi yang variable dependennya merupakan variable dummy. Apa itu variable dummy? Variable dummy adalah dikotomus variable, yaitu variable yang hanya menggunakan dua kemungkinan nilai. Biasa dilambangkan dengan nilai 0 dan 1. Contohnya dalam penelitian di rumpun keilmuan auditing, misalnya untuk variable pergantian auditor, nilai 0 bila tidak melakukan pergantian auditor, nilai 1 bila melakukan pergantian auditor. Contoh lain untuk variable restatement atau penyajian kembali. Nilai 0 untuk yang tidak melakukan restatement, nilai 1 untuk yang melakukan penyajian kembali. Contoh lain di bidang akuntansi forensik, misalnya untuk menghitung kemungkinan terjadinya fraud menggunakan F-Score (Dechow et al., 2011). F-score lebih besar dari 1, maka perusahaan diduga melakukan fraud diberikan kode angka 1. Sedangkan jika F-score lebih kecil dari 1, maka perusahaan tidak diduga melakukan fraud diberikan kode angka 0.

Untuk uji regresi logistik, uji prasyarat regresinya juga berbeda dengan regresi linear. Bila regresi linear misalnya menggunakan uji asumsi klasik, yang antara lain terdiri dari: uji normalitas, uji heteroskedastisitas, uji auto korelasi, dan uji multikolinearitas (Sarjono dan Julianita, 2011). Maka dalam uji regresi logistik, uji prasyarat atau kualitas data yang dilakukan antara lain: uji keseluruhan model (overall model fit), uji kelayakan model menggunakan Hosmer and Lemeshow Test.

Demikian penjelasan mengenai kapan kita harus menggunakan regresi linear dan regresi logistic, semoga bermanfaat untuk rekan – rekan yang sedang mempersiapkan proposal penelitian atau skripsi. Ataupun rekan – rekan yang sudah menyusun skripsi. Semoga di masa yang akan datang, rekan – rekan tidak lagi tertukar antara kedua metode regresi tersebut.

Referensi:

  • Dechow, P. M., Ge, W., Larson, C. R., & Sloan, R. G. (2011). Predicting Material Accounting Misstatements. Contemporary Accounting Research, 28(1), 17–82. https://doi.org/10.1111/j.1911-3846.2010.01041.x
  • Sarjono, H., Julianita W. (2011). SPSS vs Lisrell Sebuah Pengantar Aplikasi untuk Riset. Salemba Empat
  • Sekaran, U., & Bougie, R. (2016). Research Methods For Business. A Skill Builing Approch. 7th Edition. Book. https://doi.org/10.1007/978-94-007-0753-5_102084

Image Sources: Google Images