Regresi: Pengertian, Rumus, dan Contoh Analisis
Apa Itu Regresi? (Pengertian dan Konsep Dasar)
Dalam dunia statistik dan sains data, regresi adalah salah satu metode analisis paling penting yang digunakan untuk memahami hubungan antara dua atau lebih variabel. Tujuan utama dari regresi adalah untuk memprediksi nilai suatu variabel dependen (terikat) berdasarkan nilai dari satu atau lebih variabel independen (bebas).
Secara sederhana, jika ingin mengetahui seberapa besar pengaruh pengeluaran iklan terhadap penjualan produk, regresi dapat memberikan jawabannya. Dengan menggunakan data historis, metode ini akan membentuk sebuah persamaan matematis yang dapat memprediksi nilai penjualan berdasarkan jumlah pengeluaran iklan.
Contoh sederhana: Bayangkan sebuah toko online ingin memperkirakan berapa banyak produk yang akan terjual berdasarkan jumlah uang yang mereka keluarkan untuk iklan digital. Dengan melakukan analisis regresi terhadap data penjualan sebelumnya, toko tersebut dapat menemukan pola hubungan dan menggunakannya untuk memprediksi penjualan di masa depan.
Perlu dipahami bahwa analisis regresi adalah bagian dari statistik inferensial, artinya ia tidak hanya mendeskripsikan data, tetapi juga membantu membuat kesimpulan atau prediksi berdasarkan data tersebut. Metode ini menjadi dasar dari banyak algoritma dalam machine learning dan data science karena kemampuannya dalam mengidentifikasi hubungan sebab-akibat dan memprediksi nilai baru.
Perbedaan Regresi dan Korelasi:
Meskipun keduanya berkaitan dengan hubungan antarvariabel, ada perbedaan mendasar. Analisis korelasi hanya mengukur seberapa kuat dan arah hubungan antarvariabel tanpa menentukan variabel mana yang memengaruhi yang lain. Sedangkan regresi menunjukkan hubungan sebab-akibat dan memungkinkan kita memprediksi nilai suatu variabel dari variabel lainnya.
Jenis-Jenis Analisis Regresi dan Fungsinya
Analisis regresi tidak hanya terbatas pada satu bentuk saja. Ada beberapa jenis regresi yang dapat digunakan tergantung pada karakteristik data dan tujuan analisis. Berikut ini beberapa jenis analisis regresi yang paling umum:
1. Regresi Linear Sederhana
Regresi linear adalah bentuk paling dasar dari analisis regresi yang melibatkan satu variabel bebas (X) dan satu variabel terikat (Y). Hubungan antara kedua variabel ini direpresentasikan sebagai garis lurus pada grafik.
Contoh kasus:
- Memprediksi penjualan berdasarkan anggaran iklan.
- Memprediksi tinggi badan berdasarkan usia anak.
Model regresi linear sederhana digunakan ketika hubungan antara variabel tampak linear, artinya jika satu variabel meningkat, variabel lainnya juga meningkat (atau sebaliknya).
2. Regresi Linear Berganda
Regresi linear berganda digunakan jika terdapat lebih dari satu variabel independen yang memengaruhi variabel dependen. Misalnya, penjualan produk mungkin tidak hanya dipengaruhi oleh anggaran iklan, tetapi juga oleh harga produk, diskon, dan kualitas layanan pelanggan.
Contoh kasus:
- Memprediksi harga rumah berdasarkan luas bangunan, lokasi, dan jumlah kamar.
- Menganalisis faktor-faktor yang memengaruhi kepuasan pelanggan.
3. Regresi Non-Linear
Tidak semua hubungan antarvariabel bersifat linear. Jika hubungan tersebut membentuk kurva atau pola non-linier, maka digunakan regresi non-linear. Model ini lebih kompleks, tetapi lebih akurat dalam situasi di mana hubungan tidak membentuk garis lurus.
Contoh kasus:
- Pertumbuhan populasi terhadap waktu.
- Reaksi kimia yang tidak proporsional terhadap perubahan suhu.
4. Regresi Logistik
Berbeda dengan regresi linear, regresi logistik digunakan ketika variabel dependen bersifat kategorikal (misalnya “ya” atau “tidak”). Model ini sangat penting dalam klasifikasi dan prediksi probabilitas.
Contoh kasus:
- Memprediksi apakah pelanggan akan membeli produk (ya/tidak).
- Memprediksi kemungkinan pasien menderita suatu penyakit.
Fungsi utama analisis regresi:
- Menentukan hubungan antara variabel bebas dan terikat.
- Membuat prediksi berdasarkan data historis.
- Mengidentifikasi variabel yang memiliki pengaruh paling signifikan.
- Menilai kekuatan dan arah pengaruh variabel bebas terhadap variabel terikat.
Analisis Korelasi vs Analisis Regresi: Apa Bedanya?
Korelasi dan regresi sering digunakan bersamaan dalam analisis data, tetapi keduanya memiliki fungsi dan interpretasi yang berbeda.
Pengertian Analisis Korelasi
Analisis korelasi mengukur seberapa kuat dan arah hubungan antara dua variabel. Nilai korelasi berkisar antara -1 hingga +1:
- +1 berarti hubungan positif sempurna (jika satu variabel naik, yang lain juga naik).
- -1 berarti hubungan negatif sempurna (jika satu variabel naik, yang lain turun).
- 0 berarti tidak ada hubungan linear.
Namun, korelasi tidak menunjukkan sebab-akibat. Misalnya, ada korelasi tinggi antara penjualan es krim dan jumlah orang berenang, tetapi es krim tidak menyebabkan orang berenang.
Pengertian Analisis Regresi
Analisis regresi tidak hanya mengukur hubungan, tetapi juga membangun model prediktif. Ia menentukan variabel mana yang memengaruhi variabel lain dan memungkinkan kita menghitung nilai baru berdasarkan data yang ada.
Contohnya, jika kita mengetahui pengeluaran iklan dan ingin memprediksi penjualan, regresi dapat memberikan rumus matematis yang bisa digunakan untuk perhitungan.
Perbedaan Utama
| Aspek | Korelasi | Regresi |
| Tujuan | Mengukur kekuatan dan arah hubungan | Memprediksi nilai variabel dependen |
| Sebab-akibat | Tidak menunjukkan sebab-akibat | Menunjukkan pengaruh variabel bebas |
| Output | Nilai koefisien antara -1 s.d. +1 | Persamaan matematis prediksi |
| Arah hubungan | Tidak menentukan variabel bebas/terikat | Menentukan variabel bebas dan terikat |
Persamaan dan Rumus Regresi Linear
Salah satu bentuk regresi yang paling sering digunakan adalah regresi linear, terutama dalam analisis dasar statistik dan prediksi.
Persamaan Regresi Linear Sederhana
Persamaan umum regresi linear sederhana adalah:
Y=a+bXY = a + bXY=a+bX
Keterangan:
- YYY = variabel dependen (yang diprediksi)
- aaa = konstanta (nilai Y saat X = 0)
- bbb = koefisien regresi (besar perubahan Y jika X bertambah 1 satuan)
- XXX = variabel independen
Cara Menghitung Koefisien Regresi
Koefisien regresi bbb dan konstanta aaa dapat dihitung menggunakan rumus:
b=n∑XY−(∑X)(∑Y)n∑X2−(∑X)2b = \frac{n\sum XY – (\sum X)(\sum Y)}{n\sum X^2 – (\sum X)^2}b=n∑X2−(∑X)2n∑XY−(∑X)(∑Y) a=∑Y−b(∑X)na = \frac{\sum Y – b(\sum X)}{n}a=n∑Y−b(∑X)
di mana:
- nnn = jumlah data
- ∑XY\sum XY∑XY = jumlah hasil kali X dan Y
- ∑X2\sum X^2∑X2 = jumlah kuadrat dari X
Contoh Perhitungan
Misalkan data jumlah pengeluaran iklan (X) dan penjualan (Y) sebagai berikut:
| Pengeluaran Iklan (X) | Penjualan (Y) |
| 10 | 50 |
| 20 | 70 |
| 30 | 90 |
| 40 | 110 |
| 50 | 130 |
Setelah dihitung, diperoleh persamaan regresi:
Y=30+2XY = 30 + 2XY=30+2X
Artinya, jika pengeluaran iklan naik 1 satuan, penjualan diprediksi naik 2 satuan. Jika tidak ada pengeluaran iklan (X=0X = 0X=0), maka penjualan dasar adalah 30 satuan.
Uji Regresi: Tujuan, Langkah, dan Interpretasi Hasil
Melakukan uji regresi adalah langkah penting untuk memastikan bahwa model yang dibangun benar-benar valid dan dapat dipercaya. Tujuan utamanya adalah untuk menguji apakah variabel independen berpengaruh signifikan terhadap variabel dependen.
Tujuan Uji Regresi
- Menilai kekuatan hubungan antara variabel.
- Menguji signifikansi pengaruh variabel bebas.
- Menentukan kelayakan model regresi.
- Membaca seberapa besar variasi variabel terikat yang dijelaskan oleh model.
Langkah-Langkah Uji Regresi
- Menentukan variabel: Tentukan variabel dependen (Y) dan independen (X).
- Mengumpulkan data: Kumpulkan data historis yang relevan.
- Membuat model regresi: Gunakan rumus regresi linear.
- Melakukan uji signifikansi:
- Uji t: Menguji pengaruh masing-masing variabel bebas.
- Uji F: Menguji kelayakan model secara keseluruhan.
- Menghitung koefisien determinasi (R²): Menunjukkan seberapa besar variabel bebas menjelaskan variasi variabel terikat.
- Interpretasi hasil: Lihat nilai signifikansi (p-value) untuk menentukan apakah pengaruhnya signifikan.
Interpretasi Output Regresi
Hasil analisis regresi biasanya menampilkan:
- Koefisien regresi: Menunjukkan arah dan besarnya pengaruh variabel bebas.
- R² (Koefisien Determinasi): Semakin besar R², semakin baik model menjelaskan data.
- Signifikansi (p-value): Jika p < 0,05, maka pengaruhnya signifikan.
Kesimpulan
Secara keseluruhan, regresi adalah teknik analisis statistik yang sangat kuat dan fleksibel untuk memahami hubungan antarvariabel dan membuat prediksi. Dari bentuk sederhana seperti regresi linear hingga model yang lebih kompleks seperti regresi logistik, metode ini menjadi fondasi dalam pengambilan keputusan berbasis data di berbagai bidang, mulai dari ekonomi, bisnis, hingga kecerdasan buatan.
Dengan memahami analisis regresi, rumus regresi linear, serta cara melakukan uji regresi, siapa pun dapat menganalisis data secara efektif dan mengubahnya menjadi insight yang bernilai. Teknik ini bukan hanya alat akademis, tetapi juga keterampilan penting dalam dunia profesional yang semakin berbasis data.
Tertarik mendalami dunia teknologi dan kesehatan?
Kunjungi website resmi Prodi S1 Teknik Biomedis Telkom University untuk mengetahui kurikulum, fasilitas laboratorium, hingga prospek karier lulusan.
Pelajari lebih lanjut di sini
Referensi
Putra, R. A., & Sari, D. K. (2022). Analisis Regresi Linear dalam Prediksi Penjualan Produk Menggunakan Metode Statistik. Jurnal Statistika dan Sains Data, 10(2), 145–156.
