Tez araştırmalarında kullanılan regresyon yöntemlerinden bazıları, bağımlı değişkenin sürekli değil sayım verisi olduğu durumlarda devreye girer. Sayım verisi, genellikle belirli bir zaman aralığında veya belirli bir koşul altında meydana gelen olayların sayısını ifade eder. Örneğin, bir öğrencinin bir haftada çözdüğü soru sayısı, bir hastaneye yapılan günlük başvuru sayısı veya bir işletmenin aylık müşteri şikâyeti sayısı gibi veriler “sayım verisi”dir.
Sayım verilerinin analizinde en yaygın kullanılan iki yöntem Poisson regresyonu ve Negatif Binom regresyonudur. Araştırmacılar için kritik soru şudur: “Verim Poisson dağılımına mı uyuyor, yoksa aşırı saçılım (overdispersion) nedeniyle Negatif Binom modeli mi daha uygun?”
Yanlış regresyon modeli seçmek, yalnızca sonuçların güvenilirliğini değil, aynı zamanda araştırmanın metodolojik bütünlüğünü de zedeleyebilir. Özellikle Poisson modelinin temel varsayımı olan “ortalama = varyans” koşulu sağlanmadığında, sonuçlar yanıltıcı hale gelir. İşte bu noktada, varyansın ortalamadan büyük olduğu durumlarda Negatif Binom regresyon devreye girer.
Bu yazıda, tez yaptırma sürecinde Poisson mu Negatif Binom mu seçilmeli? sorusuna yanıt aranacak; modellerin tanımları, varsayımları, kullanım alanları, avantajları–dezavantajları, uygulama örnekleri ve stratejik ipuçları ayrıntılı biçimde ele alınacaktır.
1. Sayım Verisinin Özellikleri
-
Değerler negatif olamaz.
-
Genellikle sıfırdan başlar (0, 1, 2…).
-
Çoğunlukla sağa çarpık dağılıma sahiptir.
-
Ortalama küçükse sıfır sayısı yüksektir.
2. Poisson Regresyonun Tanımı
Poisson regresyon, bağımlı değişkenin sayım verisi olduğu ve ortalama ile varyansın eşit olduğu varsayımına dayanan parametrik bir yöntemdir.
3. Negatif Binom Regresyonun Tanımı
Negatif Binom regresyon, Poisson modelinin varyans varsayımı bozulduğunda (overdispersion) kullanılan alternatif bir yöntemdir. Varyans, ortalamadan büyük olduğunda daha uygun sonuçlar verir.
4. Poisson Modelinin Varsayımları
-
Bağımlı değişken sayım verisi olmalı.
-
Ortalama = Varyans (E[Y] = Var[Y]).
-
Bağımsız gözlemler.
-
Aykırı değerler sınırlı olmalı.
5. Negatif Binom Modelinin Varsayımları
-
Bağımlı değişken sayım verisi olmalı.
-
Varyans > Ortalama (overdispersion).
-
Bağımsız gözlemler.
6. Karar Kriterleri
-
Eğer varyans ≈ ortalama → Poisson.
-
Eğer varyans > ortalama → Negatif Binom.
-
Aşırı saçılım testleri yapılmalı (ör. Lagrange Multiplier).
7. Avantajları – Poisson
-
Basit ve anlaşılırdır.
-
Küçük örneklemler için uygundur.
-
Hesaplama kolaydır.
8. Avantajları – Negatif Binom
-
Overdispersion problemini çözer.
-
Daha esnektir.
-
Gerçekçi sonuçlar üretir.
9. Dezavantajları – Poisson
-
Overdispersion varsa yanıltıcıdır.
-
Varyans küçük farklılıklardan etkilenir.
10. Dezavantajları – Negatif Binom
-
Daha karmaşık bir modeldir.
-
Parametre yorumları Poisson’a göre daha zordur.
11. Uygulamalı Örnek 1: Eğitim
Araştırma: “Öğrencilerin haftada çözdükleri soru sayısını etkileyen faktörler.”
-
Eğer varyans ≈ ortalama → Poisson.
-
Eğer varyans çok büyük → Negatif Binom.
12. Uygulamalı Örnek 2: Psikoloji
Araştırma: “Bir bireyin ayda kaç kez terapi seansına katıldığını etkileyen faktörler.”
-
Küçük varyans → Poisson.
-
Büyük varyans → Negatif Binom.
13. Uygulamalı Örnek 3: Sağlık
Araştırma: “Bir yıl içinde bireylerin hastaneye yatış sayısını etkileyen faktörler.”
-
Eğer veri çok saçılmışsa → Negatif Binom.
14. Uygulamalı Örnek 4: Sosyoloji
Araştırma: “Bireylerin katıldıkları toplumsal etkinlik sayısı.”
-
Normal dağılıma yakın → Poisson.
-
Çok değişkenlik varsa → Negatif Binom.
15. Uygulamalı Örnek 5: İşletme
Araştırma: “Bir müşteri şikâyet hattına yapılan çağrı sayısı.”
-
Ortalama ile varyans benzer → Poisson.
-
Varyans çok yüksek → Negatif Binom.
16. Türkiye’de Tezlerde Kullanımı
Türkiye’de sosyal bilimler, eğitim ve sağlık alanında Poisson ve Negatif Binom modelleri giderek artan bir şekilde kullanılmaktadır. Özellikle işletme ve tıp tezlerinde sayım verilerinin artmasıyla birlikte Negatif Binom modeli popüler hale gelmiştir.
17. Etik Boyutlar
-
Yanlış model seçimi, sonuçların güvenilirliğini zedeler.
-
Araştırmacılar model seçimini açıkça gerekçelendirmelidir.
-
Overdispersion ihmal edilmemelidir.
18. Yaygın Hatalar
-
Overdispersion testlerini yapmadan Poisson kullanmak.
-
Negatif Binom’u gereksiz yere seçmek.
-
Parametreleri yanlış yorumlamak.
19. Kontrol Listesi
-
Veri sayım verisi mi?
-
Ortalama ≈ varyans mı?
-
Overdispersion testi yaptım mı?
-
Model seçimimi gerekçelendirdim mi?
20. Stratejik İpuçları
-
Önce Poisson ile başlayın, varyans–ortalama karşılaştırması yapın.
-
Aşırı saçılım varsa Negatif Binom’a geçin.
-
Modellerin uyum iyiliğini (AIC, BIC) karşılaştırın.
-
Bulguları grafiklerle destekleyin.
Sonuç
Tez yaptırma sürecinde Poisson mu, Negatif Binom mu sorusu, sayım verilerinin analizinde en kritik metodolojik kararlardan biridir. Eğer varyans ortalamaya yakınsa Poisson modeli güvenilir sonuçlar sunar. Ancak varyans ortalamadan belirgin şekilde büyükse Negatif Binom modeli tercih edilmelidir.
Araştırmacıların doğru regresyon modelini seçmeleri, yalnızca metodolojik doğruluk açısından değil, aynı zamanda bilimsel güvenilirlik ve akademik etik açısından da önemlidir. Yanlış seçim, araştırmanın bulgularını zayıflatırken, doğru seçim literatüre güçlü bir katkı sağlar.