Yukarıda verilen örneklerde, çok değişkenli regresyon analizi kullanılarak bağımlı değişkenin kategorik olduğu durumlar incelenmektedir. Örneğin, başarılı ve başarısız yöneticiler arasındaki ayırt edici faktörler, hipertansiyon rahatsızlığına sahip olan ve olmayan insanlar arasındaki farklar, riskli ve risksiz müşteriler arasındaki farklar gibi durumlarda, bağımlı değişken iki kategoriye ayrılmaktadır. Bu tür durumlarda, çok değişkenli lojistik regresyon analizi veya sınıflandırma analizi gibi yöntemler kullanılarak, bağımlı değişkenin kategorik yapısına uygun olarak ilişkili bağımsız değişkenler arasındaki ilişki incelenir. Bu analizler, hangi bağımsız değişkenlerin bağımlı değişkenin kategorisini açıklamada önemli bir katkı sağladığını belirlemeye yardımcı olur. Örneğin, başarılı ve başarısız yöneticiler arasındaki farkları incelemek için lojistik regresyon analizi kullanılabilir. Bu analiz, başarılı yönetici olma durumunu bağımlı değişken olarak alırken, ayırt edici faktörler olarak örneğin liderlik becerileri, deneyim düzeyi, eğitim seviyesi gibi bağımsız değişkenler kullanılabilir. Analiz sonuçları, hangi faktörlerin başarılı yöneticilik ile ilişkili olduğunu ve ne derecede etkili olduklarını ortaya koyabilir. Bu şekilde, çok değişkenli regresyon analizi çeşitli kategorik bağımlı değişkenlerin incelenmesi için kullanılabilir ve araştırmacılara, belirli bir kategorinin belirlenmesinde önemli faktörleri belirleme konusunda değerli bilgiler sunabilir.
Lojistik regresyon, regresyon analizinin özel bir türüdür ve kategorik bağımlı değişkenlerin incelenmesinde kullanılır. Regresyon analizinde kullanılan değişkenlerin metrik (nicel) özellikte olması beklenirken, lojistik regresyonda bağımlı değişken ikili (binom) dağılımı sergiler. Bu nedenle, regresyon analizinde kullanılan istatistik testleri ve varsayımlar lojistik regresyonda geçerli olmaz. Lojistik regresyon analizinde, bağımlı değişkenin kategorik yapısına uygun olarak logit fonksiyonu kullanılır. Logit fonksiyonu, bağımlı değişkenin olasılığını tahmin etmek için bağımsız değişkenlerle ilişkilendirilir. Bu şekilde, bağımsız değişkenlerin etkisi ve katkısı bağımlı değişkenin kategorisini belirlemede değerlendirilir. Lojistik regresyonda, regresyon katsayılarının ve uyum indekslerinin hesaplanması farklı bir yaklaşım gerektirir. Katsayıların yorumlanması, bağımsız değişkenlerin log-olasılık oranı üzerindeki etkilerinin değerlendirilmesini içerir. Uyum indeksleri ise modelin verilere ne kadar iyi uyduğunu değerlendirmek için kullanılır. Lojistik regresyon analizi ayrıca heteroskedastisite gibi sorunları da beraberinde getirebilir. Bu durumda, değişen varyansı dikkate alarak uyum indekslerinin ve katsayıların hesaplanması önemlidir. Sonuç olarak, lojistik regresyon analizi, regresyon analizinin kategorik bağımlı değişkenlerle kullanılan bir yöntemidir. Bu yöntemde, bağımlı değişkenin kategorik yapısına uygun olarak farklı bir yaklaşım kullanılır ve katsayıların yorumlanması ile modelin uyumu değerlendirilir.
Bağımlı değişkenin kategorik olduğu durumlarda kullanılabilecek uygun analiz teknikleri arasında ayırma (discriminant) analizi ve lojistik regresyon analizi bulunmaktadır. Regresyon analizi, metrik bir bağımlı değişken ile bir veya daha fazla metrik bağımsız değişken arasındaki ilişkiyi incelemek için kullanılan bir istatistiksel yöntemdir. Lojistik regresyon analizi ise logit analizi olarak da bilinir ve temel olarak iki kategoriden oluşan bir bağımlı değişken üzerinde çalışır.
Çok değişkenli regresyon analizinde bağımlı ve bağımsız değişkenler arasında doğrusal bir ilişki olduğu varsayılırken, lojistik regresyonda ise bağımlı ve bağımsız değişkenler arasında S şeklinde bir ilişki olduğu varsayılır. Bu S şeklindeki ilişki, doğrusal olmayan bir ilişkiyi ifade eder. Dolayısıyla, regresyon analizi doğrusal ilişkileri incelediği için lojistik regresyon analizi bu tür ilişkileri incelemek için daha uygun bir seçenektir. Lojistik regresyon analizi, bağımlı değişkenin iki kategoriden oluştuğu durumlarda kullanılarak, bağımsız değişkenlerin bağımlı değişken üzerindeki etkisini değerlendirmektedir.
Kaynak: Altunişik, R., Coşkun, R., Bayraktaroğlu, S., & Yildirim, E. (2007). Sosyal bilimlerde araştırma yöntemleri. Sakarya Yayıncılık, Sakarya, 226, 103-118.
Bu formülde, incelenen veya tahmin edilen bir olayın gerçekleşme veya olma olasılığı hesaplanmaya çalışılır. Bağımlı değişken (Yi) bu formülde iki farklı değeri alabilir. Bunlar Yi=0 (başarısızlık veya olayın gerçekleşmeme olasılığı) ve Yi=1 (başarı veya olayın gerçekleşme olasılığı) olarak ifade edilir. Lojistik regresyon analizi, bu iki kategorik değer arasındaki ilişkiyi inceleyerek bağımsız değişkenlerin başarı veya başarısızlık olasılığı üzerindeki etkisini değerlendirmek için kullanılır.
Lojistik regresyon analizi ve ayırma (discriminant) analizi aynı amaca hizmet etmelerine rağmen, lojistik regresyon analizi özellikle parametrik testlere ilişkin ön şartların ihlal edildiği durumlarda avantajlıdır. Ayırma analizi için belirli şartların sağlanması gerekmektedir, örneğin, çoklu normallik ve grupların eşit varyans/kovaryans matrisine sahip olma şartları. Bu şartların sağlanması ayırma analizinin geçerli olması için zorunludur, ancak uygulamada bu şartlar genellikle ihlal edilebilir. Şartların ihlal edilmesi durumunda bile, lojistik regresyon analizi esnek bir yöntemdir ve bu sapmalara karşı daha az hassas, daha dirençli sonuçlar verir. Bu nedenle, lojistik regresyon analizi, ayırma analizine göre daha geniş bir uygulama alanına sahiptir ve daha esnek bir çözüm sunar.
Bunun yanı sıra, lojistik regresyon analizi ve regresyon analizi arasındaki benzerlikler nedeniyle birçok araştırmacı lojistik regresyonu tercih etmektedir. Bu benzerlikler arasında hesaplama yöntemlerinin benzer olması, çeşitli test istatistiklerinin bulunması, doğrusal olmayan etkilerin incelenebilmesi ve teşhise yönelik istatistiklerin bulunması sayılabilir. Araştırmacılar, lojistik regresyonun regresyon analizine benzerlik göstermesi nedeniyle aşina oldukları analiz yöntemlerini kullanma eğilimindedirler. Bu benzerlikler, lojistik regresyonun daha geniş bir araştırma alanına uygulanabilmesini ve çeşitli soruların cevaplanmasını sağlar.
Ayrıca, lojistik regresyon analizinde grup üyeliği hesaplaması regresyon analizinde olduğu gibi benzer bir şekilde yapılır. Ancak, ayırma analizinde grup üyeliği, z değerlerinin hesaplanmasını takiben ayırma skorlarının belirlenmesiyle belirlenir. Bu yaklaşım, her bir gözlem biriminin hangi gruba ait olduğunu belirlemek için kullanılır. Ayırma skorları, gözlemlerin grup üyeliğini tahmin etmek için kullanılan değerlerdir. Bu şekilde, lojistik regresyon analizi grup üyeliğini tahmin etmek için etkili bir hesaplama yöntemi sunar.
Lojistik regresyon analizinde ikili bir kategorik bağımlı değişkeni tahmin etmeye ve açıklamaya yönelik bir formülasyon oluşturulmaktadır. Lojistik regresyonun yorumlaması regresyon analizine benzer olup, modelde yer alan her bir açıklayıcı (bağımsız) değişkene ait katsayı söz konusu değişkenin görece açıklayıcılık derecesini gös-termektedir. Ancak, regresyonun aksine lojistik regresyonda bir ola-yın/olgunun gerçekleşme/olma olasılığı veya bir gruba aidiyet olası-lığı doğrudan hesaplanabilmektedir. Olasılık değerleri ise 0 (sıfır) ile 1,0 arasında değişebilmektedir.
Hesaplama yöntemi olarak çoklu regresyonda en küçük kareler (least squares) yöntemi kullanılırken, lojistik regresyonda en yüksek olası-lık (maximum likelihood) yöntemi kullanılmaktadır. En yüksek olası-lık yaklaşımında katsayıların hesabı, regresyona benzer şekilde, tek-rarlı işlemler yapılarak katsayılar için “en muhtemel” değerler bulu-nur. Genel model uyumu (overal model fit) ise “olasılık oranı” (likeli-hood ratio) ile hesaplanmaktadır. Olasılık oranı (likelihood ratio) ise aslında araştırma konusu olan olayın olma/gerçekleşme olasılığının söz konusu olayın gerçekleşmeme/olmama olasılığına oranı şeklinde hesaplanmaktadır. Buna göre olasılık oranını (odds ratio);
Kaynak: Altunişik, R., Coşkun, R., Bayraktaroğlu, S., & Yildirim, E. (2007). Sosyal bilimlerde araştırma yöntemleri. Sakarya Yayıncılık, Sakarya, 226, 103-118.
şeklinde ifade etmek mümkündür. Bu eşitlikteki formüle göre hesap-lanan katsayılar (B0, B1, B2, … Bn) aslında olasılıkların oranlarındaki değişimin bir ölçüsü olup, olasılık oranı adı verilir. Logaritmalar şek-linde ifade edilir ve olasılıklar üzerindeki görece etkilerin daha kolay anlaşılabilmesi için geri dönüştürülmesi (anti-logaritma) gerekir. Bu katsayılara ilişkin pozitif bir değer söz konusu olayın tahmin edilen olma ihtimalini artırırken negatif değer ise olayın olma ihtimalini azaltmakta veya olmama ihtimalini artırmaktadır.
Lojistik regresyon analizinde hesaplanan modelin uyumluluğunun tespiti çoklu regresyon analizindeki hatalar karesinin toplamına ben-zer şekilde, olasılık değeri (likelihood value) ile verilmektedir. Aslın-da bu değer, bilgisayar çıktılarında anlaşılma kolaylığı sağlamak için 2LL (-2 kez log likelihood -2 kez olasılık değerinin logaritması) olarak verilmektedir. -2LL için en küçük değer sıfırdır. Mükemmel bir uyumda olasılık değeri 1 olup, buna bağlı olarak -2LL’nin alacağı de-ğer ise sıfır olacaktır. Dolayısıyla iyi uyum sağlayan bir modelin kü-çük –2LL değerine sahip olması beklenmektedir.
Farklı modeller (eşitlikler) için hesaplanan olasılık değerleri arasında karşılaştırma yapılabilir. Lojistik regresyon denklemine ilave edilen her yeni bağımsız değişkenin sağlayacağı iyileştirmenin [-2LL (-2 log olasılık) değerindeki düşüş] anlamlılığı için ki-kare testinden yarar-lanılabilir. Bu amaçla araştırmacılar çoklu regresyondaki R2 değerine benzer R2logit değeri hesaplama yoluna gitmektedirler.18 Bu ise aşağı-daki şekilde hesaplanabilir.
Kaynak: Altunişik, R., Coşkun, R., Bayraktaroğlu, S., & Yildirim, E. (2007). Sosyal bilimlerde araştırma yöntemleri. Sakarya Yayıncılık, Sakarya, 226, 103-118.
Bu denklemdeki -2LL değeri, bağımsız değişkenlerin modelde yer almadığı ve sadece ortalama değere dayalı hesaplama ile elde edilen değeri temsil etmektedir. Bu değer, temel bir başlangıç noktası olarak düşünülebilir. Öte yandan, -2LL model değeri, ilave bağımsız değişkenlerin modele eklenmesiyle elde edilen değeri temsil etmektedir. Bu değer, modele eklenen bağımsız değişkenin açıklama gücünü incelemek için kullanılır. Yani, R2logit değeriyle ilave bağımsız değişkenin modele katkısı ve iyileştirmesi değerlendirilmektedir.
Lojistik regresyon modelinin genel uyumu veya veriye uyumu çeşitli yöntemlerle ölçülebilir. Bunlardan biri sınıflandırma matrisi olarak adlandırılan yöntemdir, bu yöntemde modelin öngördüğü sınıflandırma doğruluğu ölçülür. Doğru sınıflandırma oranı, modelin genel uyumunu yansıtan bir gösterge olarak değerlendirilir. Diğer bir yöntem ise “Hosmer-Lemeshow” sınıflandırma testidir. Bu yaklaşımda, analizde kullanılan gözlemler yaklaşık olarak 10 eşit gruba ayrılır ve her bir grubun gerçek ve tahmin edilen sınıflandırmaları karşılaştırılır. Bu yöntemin avantajı, modelin tahmin doğruluğunu olasılık değeri üzerinden değil, bağımlı değişkenin gerçek değerlerine dayandırmasıdır. Modelin etkinliğini belirlemek için farklı değerlendirme ölçütlerinin kullanılması faydalı olabilir.
Lojistik regresyon modelinde, değişkenlere ait katsayıların anlamlılıklarının testi, Wald istatistiği kullanılarak gerçekleştirilir. Bu istatistik ile her bir değişkenin katsayısı için sıfırdan farklı olup olmadığı test edilir. Örneğin, ağızdan ağza pazarlama bağlamında yapılan bir analizde, pazar kurtları ve tavsiye alan tüketiciler arasındaki ayırt edici özelliklerin belirlenmesi amaçlanabilir. Bu durumda bağımlı değişken olarak tüketici türü kullanılır ve bu değişken iki değer alır: 1- tavsiye alan ve 2- pazar kurdu. Lojistik regresyon analizi ile belirli özellikler incelenerek bir tüketicinin pazar kurdu olma olasılığı ortaya konulmaya çalışılır. Bu analiz, kişinin belirli özelliklerine bağlı olarak pazar kurdu olma veya tavsiye alan bir tüketici olma olasılığını belirlemeyi hedefler. SPSS çıktısında tipik bir lojistik regresyon analizi görülebilir.
Verilerinizin analizi ve yorumlanması konusunda, akademik alanda her konuda yardıma ihtiyacınız varsa, uzman ekibimizle birlikte size yardımcı olmaktan mutluluk duyarız. Projelerinizin gereksinimlerini değerlendirebilir, size en uygun hizmetleri sunabiliriz. İletişime geçmek ve daha fazla bilgi almak için bize ulaşabilirsiniz.