Tez çalışmalarında en sık kullanılan yöntemlerden biri regresyon analizidir. Ancak her araştırmada aynı regresyon türünü kullanmak mümkün değildir. Araştırmacılar çoğu zaman şu soruyla karşılaşır: “Çalışmamda doğrusal regresyon mu, yoksa lojistik regresyon mu kullanmalıyım?”
Bu sorunun yanıtı, yalnızca istatistiksel değil, aynı zamanda metodolojik bir karardır. Doğrusal regresyon, bağımlı değişkenin sürekli olduğu durumlarda kullanılırken, lojistik regresyon bağımlı değişkenin kategorik (özellikle ikili: evet/hayır, var/yok) olduğu araştırmalarda tercih edilir. Yanlış regresyon modelinin seçilmesi, araştırmanın bulgularını geçersiz kılabilir, hatta bilimsel hatalara yol açabilir.
Örneğin, öğrencilerin sınav puanlarını etkileyen faktörler inceleniyorsa bağımlı değişken sürekli olduğu için doğrusal regresyon uygundur. Ancak öğrencilerin sınavı geçip geçmediği inceleniyorsa bağımlı değişken kategorik olduğundan lojistik regresyon kullanılır. Bu kadar temel bir ayrım, araştırmanın güvenilirliği açısından kritik önemdedir.
Bu yazıda, tez yaptırma sürecinde doğrusal ve lojistik regresyon arasındaki farklar, kullanım alanları, varsayımlar, avantajlar–dezavantajlar, uygulama örnekleri ve stratejik ipuçları kapsamlı şekilde ele alınacaktır.
1. Doğrusal Regresyonun Tanımı
Doğrusal regresyon, bağımlı değişkenin sürekli olduğu durumlarda, bağımsız değişken(ler) ile bağımlı değişken arasındaki doğrusal ilişkiyi modelleyen parametrik bir yöntemdir.
2. Lojistik Regresyonun Tanımı
Lojistik regresyon, bağımlı değişkenin kategorik olduğu (genellikle ikili) durumlarda kullanılan, olasılıklara dayalı bir regresyon modelidir.
3. Doğrusal Regresyon Varsayımları
-
Bağımlı değişken sürekli olmalı.
-
Bağımlı ve bağımsız değişkenler arasında doğrusal ilişki olmalı.
-
Hatalar normal dağılmalı.
-
Varyans homojenliği sağlanmalı.
-
Bağımsız değişkenler arasında çoklu doğrusal bağlantı olmamalı.
4. Lojistik Regresyon Varsayımları
-
Bağımlı değişken kategorik olmalı (ikili, çoklu).
-
Bağımsız değişkenler sürekli veya kategorik olabilir.
-
Bağımsız değişkenler ile logit dönüşümü arasında doğrusal ilişki olmalı.
-
Aykırı değerler kontrol edilmeli.
5. Kullanım Alanları – Doğrusal Regresyon
-
Eğitim: Sınav puanlarını etkileyen faktörler.
-
Psikoloji: Depresyon ölçeği puanlarını yordayan değişkenler.
-
Sağlık: Kan basıncı seviyesini etkileyen yaşam tarzı değişkenleri.
-
İşletme: Satış gelirini etkileyen reklam harcamaları.
6. Kullanım Alanları – Lojistik Regresyon
-
Eğitim: Öğrencinin sınavı geçip geçmemesi.
-
Psikoloji: Bir bireyin kaygı bozukluğu yaşayıp yaşamaması.
-
Sağlık: Hastanın tedaviye yanıt verip vermemesi.
-
İşletme: Müşterinin ürünü satın alıp almaması.
7. Avantajları – Doğrusal Regresyon
-
Basit ve anlaşılırdır.
-
Tahmin gücü yüksektir.
-
Parametreler kolay yorumlanır.
8. Avantajları – Lojistik Regresyon
-
Kategorik bağımlı değişkenlerle çalışabilir.
-
Odds ratio ile yorum yapılabilir.
-
Hem sürekli hem kategorik bağımsız değişkenleri kabul eder.
9. Dezavantajları – Doğrusal Regresyon
-
Kategorik bağımlı değişkenlerde kullanılamaz.
-
Varsayımlara çok duyarlıdır.
-
Aykırı değerlerden etkilenir.
10. Dezavantajları – Lojistik Regresyon
-
Karmaşık yorumlamalar gerektirir.
-
Parametreler doğrudan değil, olasılık üzerinden yorumlanır.
-
Çoklu kategorilerde model karmaşıklaşır.
11. Uygulamalı Örnek 1: Eğitim
Araştırma: “Öğrencilerin ders çalışma saatlerinin sınav puanına etkisi.”
-
Bağımlı değişken: Puan (sürekli).
-
Model: Doğrusal regresyon.
12. Uygulamalı Örnek 2: Psikoloji
Araştırma: “Kaygı düzeyini etkileyen faktörler.”
-
Bağımlı değişken: Ölçek puanı (sürekli).
-
Model: Doğrusal regresyon.
-
Ancak kaygı düzeyi “yüksek/düşük” olarak ikili sınıflandırılırsa → Lojistik regresyon.
13. Uygulamalı Örnek 3: Sağlık
Araştırma: “Yeni tedavi yönteminin başarısı.”
-
Bağımlı değişken: Başarı (evet/hayır).
-
Model: Lojistik regresyon.
14. Uygulamalı Örnek 4: Sosyoloji
Araştırma: “Eğitim düzeyi ve gelir arasındaki ilişki.”
-
Bağımlı değişken: Gelir (sürekli).
-
Model: Doğrusal regresyon.
15. Uygulamalı Örnek 5: İşletme
Araştırma: “Müşterilerin ürün satın alma kararını etkileyen faktörler.”
-
Bağımlı değişken: Satın alma (evet/hayır).
-
Model: Lojistik regresyon.
16. Türkiye’de Tezlerde Kullanımı
Türkiye’de eğitim, psikoloji ve işletme tezlerinde doğrusal regresyon oldukça yaygındır. Sağlık ve klinik tezlerde ise kategorik sonuç değişkenleri nedeniyle lojistik regresyon sıklıkla kullanılmaktadır.
17. Etik Boyutlar
-
Bağımlı değişkenin türüne uygun olmayan regresyon modeli seçmek etik değildir.
-
Varsayımlar dürüstçe raporlanmalıdır.
-
Araştırmacı, sonuçları yanlış yönlendirecek yorumlardan kaçınmalıdır.
18. Yaygın Hatalar
-
Kategorik bağımlı değişken için doğrusal regresyon kullanmak.
-
Normal dağılım kontrolü yapmadan doğrusal regresyona başvurmak.
-
Odds ratio yerine doğrudan regresyon katsayısını yanlış yorumlamak.
19. Kontrol Listesi
-
Bağımlı değişkenim sürekli mi, kategorik mi?
-
Bağımsız değişkenlerim nasıl?
-
Varsayımlar sağlanıyor mu?
-
Doğrusal mı lojistik mi gerekçem net mi?
20. Stratejik İpuçları
-
Önce bağımlı değişkenin doğasını inceleyin.
-
Grafiklerle ilişki türünü gözlemleyin.
-
Hem doğrusal hem lojistik regresyonu denemek, tartışma bölümünü zenginleştirir.
-
Sonuçları mutlaka etki büyüklüğüyle destekleyin.
Sonuç
Tez yaptırma sürecinde doğrusal mı lojistik mi sorusu, en temel metodolojik kararlardan biridir. Eğer bağımlı değişken sürekli ise doğrusal regresyon, kategorik ise lojistik regresyon tercih edilmelidir. Yanlış seçim yalnızca metodolojik bir hata değil, aynı zamanda bilimsel güvenilirliği de zedeleyen bir sorundur.
Doğru regresyon modelini seçmek, araştırmanın bulgularını güçlendirir, literatüre katkısını artırır ve çalışmanın akademik değerini yükseltir.