Tez araştırmalarında bağımlı değişken ile bir veya birden fazla bağımsız değişken arasındaki ilişkiyi incelemek için kullanılan en güçlü istatistiksel yöntemlerden biri regresyon analizidir. Regresyon, yalnızca değişkenler arasındaki ilişkileri açıklamakla kalmaz, aynı zamanda geleceğe yönelik tahminler yapmaya da olanak tanır. Ancak her araştırmada kullanılacak regresyon türü aynı değildir. Bağımlı değişkenin niteliği, bağımsız değişkenlerin sayısı, verilerin dağılım özellikleri ve araştırma sorusunun doğası, kullanılacak regresyon türünü doğrudan etkiler.
Örneğin bağımlı değişken sürekli ise doğrusal regresyon, bağımlı değişken kategorik ise lojistik regresyon, bağımlı değişken sayım verisinden oluşuyorsa Poisson veya negatif binom regresyon, zaman serisi verisi için ise ARIMA gibi modeller tercih edilmelidir. Yanlış regresyon modeli seçmek, yalnızca yanlış sonuçlara yol açmakla kalmaz, aynı zamanda tezin metodolojik geçerliliğini de zedeler.
Bu yazıda, tez yaptırma sürecinde regresyon türü seçiminde dikkate alınması gereken kriterler, regresyon modellerinin türleri, avantajları–dezavantajları, uygulama örnekleri ve stratejik ipuçları kapsamlı biçimde incelenecektir.
1. Regresyon Analizinin Amacı
-
Değişkenler arasındaki ilişkiyi modellemek.
-
Bağımlı değişkeni bağımsız değişkenlerle açıklamak.
-
Geleceğe yönelik tahminlerde bulunmak.
-
Etki büyüklüğünü ve yönünü belirlemek.
2. Regresyon Türü Seçimini Etkileyen Faktörler
-
Bağımlı değişkenin türü (sürekli, kategorik, sayım).
-
Bağımsız değişkenlerin sayısı (tek veya çoklu).
-
Veri yapısı (çapraz kesit, panel, zaman serisi).
-
Varsayımlar (normallik, varyans homojenliği, bağımsızlık).
3. Doğrusal Regresyon
-
Bağımlı değişken sürekli olduğunda kullanılır.
-
Tek veya çoklu bağımsız değişken olabilir.
-
Varsayımlar: Doğrusallık, normallik, varyans homojenliği.
4. Lojistik Regresyon
-
Bağımlı değişken kategorik olduğunda kullanılır.
-
İkili lojistik (evet/hayır), çok kategorili lojistik olabilir.
-
Odds ratio ile yorum yapılır.
5. Poisson Regresyon
-
Bağımlı değişken sayım verilerinden oluşuyorsa tercih edilir.
-
Örneğin: Günlük müşteri sayısı, kaza sayısı.
6. Negatif Binom Regresyon
-
Poisson modelinin varyans varsayımı ihlal edildiğinde kullanılır.
-
Aşırı saçılım (overdispersion) olduğunda uygundur.
7. Probit Regresyon
-
Bağımlı değişken ikili olduğunda alternatif bir yöntemdir.
-
Olasılık tahminleri normal dağılıma dayandırılır.
8. Panel Veri Regresyonu
-
Zaman ve kesit boyutunu birlikte içeren verilerde kullanılır.
-
Sabit etkiler ve rassal etkiler modelleri bulunur.
9. Zaman Serisi Regresyonları
-
ARIMA, VAR, VECM gibi yöntemler.
-
Ekonomi, finans, makro verilerde yaygın kullanılır.
10. Yapısal Eşitlik Modellemesi
-
Karmaşık ilişkileri test etmek için kullanılır.
-
Hem ölçüm hem yapısal modelleri içerir.
11. Regresyon Türlerine Göre Avantajlar
-
Doğrusal regresyon → Basit, yorumlaması kolay.
-
Lojistik regresyon → Kategorik değişkenler için ideal.
-
Poisson/Negatif Binom → Sayım verilerinde güçlü.
-
Panel veri → Zaman boyutunu dikkate alır.
-
Zaman serisi → Tahmin yapmaya uygundur.
12. Regresyon Türlerine Göre Dezavantajlar
-
Doğrusal regresyon → Varsayımlar bozulursa yanlış sonuç verir.
-
Lojistik regresyon → Sadece olasılık tahmini yapar.
-
Poisson → Varyans varsayımına duyarlıdır.
-
Panel veri → Model seçimi karmaşıktır.
-
Zaman serisi → Durağanlık şartı önemlidir.
13. Uygulamalı Örnek 1: Eğitim
Araştırma: “Öğrencilerin sınav puanlarını etkileyen faktörler.”
-
Bağımlı değişken: Sınav puanı (sürekli).
-
Test: Doğrusal regresyon.
14. Uygulamalı Örnek 2: Psikoloji
Araştırma: “Depresyon tedavisinde başarıyı etkileyen faktörler.”
-
Bağımlı değişken: Başarı (evet/hayır).
-
Test: Lojistik regresyon.
15. Uygulamalı Örnek 3: Sağlık
Araştırma: “Hastaneye yatış sayısını etkileyen faktörler.”
-
Bağımlı değişken: Yatış sayısı.
-
Test: Poisson/Negatif binom regresyon.
16. Uygulamalı Örnek 4: Sosyoloji
Araştırma: “Bireylerin iş tatmini ve maaş ilişkisi.”
-
Bağımlı değişken: Tatmin puanı.
-
Test: Doğrusal regresyon.
17. Uygulamalı Örnek 5: İşletme
Araştırma: “Çalışanların işten ayrılma niyetini etkileyen faktörler.”
-
Bağımlı değişken: Ayrılma niyeti (evet/hayır).
-
Test: Lojistik regresyon.
18. Türkiye’de Tezlerde Kullanımı
Türkiye’de eğitim bilimleri ve sosyal bilimlerde doğrusal ve lojistik regresyon yaygın olarak kullanılmaktadır. Son yıllarda panel veri ve zaman serisi modellerine ilgi artmaktadır.
19. Etik Boyutlar
-
Yanlış regresyon modeli seçmek bilimsel hatadır.
-
Varsayımlar mutlaka test edilmelidir.
-
Bulgular şeffaf raporlanmalıdır.
20. Yaygın Hatalar
-
Kategorik değişkenler için doğrusal regresyon kullanmak.
-
Sayım verilerinde Poisson yerine yanlış modeller uygulamak.
-
Panel veride sabit–rassal etkileri test etmeden model seçmek.
21. Kontrol Listesi
-
Bağımlı değişkenim sürekli mü, kategorik mi, sayım mı?
-
Veri yapım kesitsel mi, panel mi, zaman serisi mi?
-
Varsayımları sağlıyor muyum?
-
Model seçiminde gerekçem açık mı?
22. Stratejik İpuçları
-
Önce bağımlı değişken türünü netleştirin.
-
Varsayım testlerini mutlaka yapın.
-
Alternatif regresyon modellerini karşılaştırın.
-
Sonuçları etki büyüklüğüyle birlikte raporlayın.
Sonuç
Tez yaptırma sürecinde regresyon türü seçiminde, bağımlı değişkenin türü, veri yapısı ve araştırma amacına göre karar verilmesi gerekir. Doğrusal regresyon sürekli değişkenler için, lojistik regresyon kategorik bağımlı değişkenler için, Poisson ve negatif binom sayım verileri için, panel ve zaman serisi modelleri ise uzun dönemli analizler için uygundur.
Araştırmacılar için doğru regresyon modelini seçmek, yalnızca metodolojik doğruluk değil aynı zamanda bilimsel güvenilirlik açısından da kritik öneme sahiptir. Yanlış model seçimi, tezlerin geçerliliğini zedeleyebilirken, doğru model seçimi bulguların literatüre katkısını artırır.