Dengesiz Veri Yöntem Seçimi Rehberi

Dengesiz veri (imbalanced data), hedef sınıfların dağılımının eşit olmaması—çoğu pratik senaryoda “azınlık sınıfı”nın çok küçük kalması—durumudur. Tıbbi tarama (%1–10 pozitif), sahtekârlık tespiti (%0.1–1 sahte), churn analizi (%5–20 terk), arıza kestirimi…

0 Yorum

Özellik Seçimi Yöntem Seçimi Rehberi

Özellik seçimi (feature selection), bir modelin genellenebilirlik kapasitesini yükseltmek, aşırı uyumu (overfitting) azaltmak, hesaplama maliyetini düşürmek, yorumlanabilirlik sağlamak ve kimi durumlarda adalet/etik risklerini azaltmak için aday değişkenler arasından en bilgilendirici…

0 Yorum

LASSO mı Ridge mi? Yöntem Seçimi Rehberi

Regresyon modellerinde çok sayıda aday değişken (p) ve nispeten sınırlı gözlem (n) olduğunda, klasik OLS’in varyansı şişer, genellenebilirlik düşer ve yorumlar kararsızlaşır. Düzenlileştirme (regularization), bu darboğazı çözmek için katsayıları küçülten…

0 Yorum