Ki-kare testi, sosyal bilimler araştırmalarında geniş bir yelpazede kullanılan istatistiksel bir analiz yöntemidir. Temel olarak, bu test, uyumlu olma durumunu kontrol etme, iki değişken arasında bir ilişki olup olmadığını belirleme ve iki değişkenin birbirinden bağımsız olup olmadığını saptama gibi farklı amaçlar için kullanılmaktadır.
Ki-kare testi, yalnızca iki değişken arasındaki ilişkiyi belirleme konusunda değil, aynı zamanda değişkenler arasındaki farklılıkları ortaya çıkarma konusunda da etkilidir. Bu analiz, frekans dağılımlarının hesaplamasına dayanır ve ki-kare dağılımı, genellikle sağa çarpık (pozitif çarpıklık) bir dağılım sergiler. Bu testin hesaplamasına yönelik temel formül ve ki-kare dağılımının şekli, bu konuda genel bir fikir sağlar.
İki değişkenin bağımsız olması durumu, aralarında bir ilişkinin bulunmadığını ifade eder. Ki-kare testi, değişkenlerin birbirinden bağımsız olup olmadığını ölçmekte sıkça kullanılan bir araçtır. Ancak, bu test iki değişken arasındaki ilişkinin gücü hakkında sınırlı bilgi sağlar. Bu durum, ki-kare testinin bazı durumlarda yetersiz kalabileceğini gösterir.
Kaynak: Altunişik, R., Coşkun, R., Bayraktaroğlu, S., & Yildirim, E. (2007). Sosyal bilimlerde araştırma yöntemleri. Sakarya Yayıncılık, Sakarya, 226, 103-118.
Bir ki-kare testinde elde edilen χ2 değeri, modelin veriye ne derece uyduğunun bir göstergesi olduğu kadar, örnek büyüklüğünden de etkilenir. Önemli bir nokta, ki-kare testinde serbestlik derecesinin önemli rol oynamasıdır. Serbestlik derecesi ne kadar artarsa, ki-kare testi normal dağılıma o kadar çok benzer hale gelir. Dahası, χ2 değeri serbestlik derecesine bağlı olduğu için, analizde gözlem sayısı arttıkça χ2 değeri de büyür ve anlamlı farklılıkların saptanma olasılığı artar. Ancak bu durum, gözlem sayısı arttıkça önemsiz farklılıkların anlamlı hale gelme ihtimalini de artırır ve bu da sonuçların güvenilirliği konusunda sorunlar oluşturabilir.
Ki-kare testinde null hipotez (Ho), genellikle iki değişken arasında ilişkinin olmadığını varsaymak üzerine kurulur. Aslında, ki-kare testi, iki değişken arasında bir sistemli ilişki olup olmadığını belirlemek için yardımcı olur. Başka bir deyişle, ki-kare testi, bir çapraz tabloda yer alan değişkenler arasında gözlemlenen ilişkinin istatistiksel olarak anlamlı olup olmadığını tespit etmek için kullanılır.
Ki-Kare Testine Ait Örnekler
1. Bir kahvaltılık mısır gevreği markası, üç farklı paket boyutu kullanıyor ve bu paketlerin satış oranları geçmişte 1,2 ve 3 olarak saptanmış. Şimdi bu firma, Çikoli adlı yeni bir ürünle pazarda yer alıyor ve merak edilen konu, bu yeni ürün için önceki satış oranlarının geçerli olup olmadığı.
2. Pazarlama müdürünüzün sizden bir sorusu var: “Ürünlerimizin kullanım miktarının müşterilerin yaş ve eğitim seviyeleriyle bir ilişkisi olabilir mi?”
3. Acaba gelir düzeyi ile tüketim seviyesi arasında bir bağlantı var mıdır? Gelir ve satın alma seviyeleri hangi kategorilerle ifade edilebilir?
4. Bir alışveriş merkezinde geçirilen sürenin yapılan harcamalarla bir ilişkisi olabilir mi?
5. İnsanların medeni halleri ile moda trendlerini ne kadar takip ettikleri arasında bir bağlantı olabilir mi?
6. Eğitim seviyesi ve otomobil sahipliği arasında bir ilişki tespit etmek mümkün olabilir mi?
7. Aile büyüklüğü ile dışarıda yemek yeme alışkanlıkları arasında bir ilişki olabilir mi?
8. Bir üretim tesisindeki hatalı parçaların Poisson dağılımına uyduğu öne sürülmektedir. Üretim müdürü, bu iddianın ne kadar doğru olduğunu öğrenmek ister ve bu nedenle bir ay boyunca her gün hatalı üretim sayılarının istatistiklerini toplar ve analiz etmeye karar verir.
Önceden belirtildiği gibi, ki-kare testi, nominal veya ordinal ölçekli değişkenler arasındaki ilişkileri inceleme konusunda yaygın olarak kullanılır. Bu test, gerçekleşen ve teorik olarak beklenen frekans değerlerini karşılaştırır. Çapraz tablonun her hücresi için bu iki değer arasındaki farkın karesi alınır ve beklenen değere oranlanır. Bu oranların toplamı, ki-kare istatistiği olarak adlandırılan bir değeri verir. Eğer hesaplanan değer kritik değerden daha büyükse, anlamlı bir ilişki olduğunu kabul ederiz.
Ki-kare değeri örneklem büyüklüğünden büyük ölçüde etkilenir. Bu nedenle, farklı büyüklüklerdeki örnekler veya farklı serbestlik dereceleri arasında karşılaştırma yapılırsa, yanıltıcı sonuçlar elde edilebilir. Bu problemi çözmek için, ki-kareye dayalı çeşitli istatistikler oluşturulmuştur.
Bu istatistiklerden biri, değişkenler arasındaki ilişkilerin incelenmesinde ve nominal ölçümler için kullanılan fi (φ) katsayısıdır. Bu değer, hesaplanan ki-kare değerinin örneklem büyüklüğüne bölünmesi ve sonuçtan karekökün alınmasıyla elde edilir ve genellikle 2×2 çapraz tablolarda kullanılır. φ katsayısı genellikle 0-1 arasında değerler alır; fakat eğer boyutlardan biri 2’den büyükse, 1’den büyük değerler de alabilir. Bu durum, yorumları karmaşıklaştırabilir.
φ katsayısının sınırlamalarını aşmak için, her boyuttaki tablolar için değişkenler arasındaki ilişkinin yoğunluğunu belirlemede ve 0-1 arasında değerler alabilmede kullanılabilen bir durumsallık katsayısı önerilmiştir. Ancak bu katsayı genellikle maksimum değerlere ulaşmakta zorluk çeker.
2×2’den büyük tablolar için kullanılabilen ve 0-1 arasında değerler alabilen bir diğer istatistik olan Cramer’s V, φ katsayısına benzer. Ayrıca, Lambda katsayısı da nominal ölçüm olduğunda geçerli olan bir diğer ki-kare temelli testtir. Bu testlerle ilgili daha ayrıntılı bilgiler SPSS kullanım kılavuzlarında, istatistik kitaplarında, pazarlama araştırmaları kitaplarında ve çeşitli istatistiksel analiz metodları kitaplarında bulunabilir.
Ancak, ki-kare testinin güvenilir sonuçlar vermesi için belirli koşulların yerine getirilmesi gerekmektedir. Ki-kare analizinin doğru sonuçlar vermesini sağlamak için, analiz edilen değişkenlere ait çapraz tablodaki her hücredeki frekans sayısının en az beş olması genellikle önerilir.
Kaynak: Altunişik, R., Coşkun, R., Bayraktaroğlu, S., & Yildirim, E. (2007). Sosyal bilimlerde araştırma yöntemleri. Sakarya Yayıncılık, Sakarya, 226, 103-118.
Verinin çoklu dağılımdan (multinomial distribution) gelmesi ve beklenen değerlerin çok küçük olmaması, ki-kare testinin başarılı bir şekilde uygulanabilmesi için önemlidir. Maalesef, birçok araştırmacı bu koşulu göz ardı ederek ki-kare testini uygular. Ancak, bu koşul ihlal edildiğinde, çapraz tablolar üzerindeki ki-kare testi sonuçlarının güvenilirliği azalabilir. Bu tür hataların düzeltilebilmesi için çeşitli öneriler bulunsa da, bu önerilerin doğru bir şekilde uygulanabilmesi için koşulların tam olarak anlaşılması gerekmektedir.
Ki-kare analizinde, 2×2 tablolar için özel bir durum söz konusudur ve analiz sonuçlarını iyileştirmek amacıyla Yates’in süreklilik düzeltmesi yapılır. Bu düzeltme işlemi sırasında, pozitif beklenen frekanslardan 0.5 değeri çıkarılır ve negatif beklenen değerlere 0.5 değeri eklenir. Toplam örnek boyutu eğer çok küçükse, Fisher’in Exact testi kullanılır. SPSS programı, 2×2 tablolarda herhangi bir hücredeki frekans değeri 5’in altına düştüğünde Fisher’in Exact testini otomatik olarak hesaplar.
Ki-kare (χ2) analizini doğru ve anlamlı sonuçlar alabilmek için gözetilmesi gereken noktalar:
1. Çapraz tabloda bulunan hücrelerin hiçbiri boş kalmamalı ve her hücredeki gözlem sayısının en az 5 olması önerilir. Bu durum gerçekleşmediği zaman, yani beklenen frekans bu değerden düşük olduğunda, tablo içindeki belirli kategorilerin birleştirilmesi düşünülebilir. Bu, beklendiği gibi her hücrede minimum frekansın korunmasını sağlar. Şayet bu koşul ihlal edilirse, analiz sonuçlarına tam anlamıyla güvenmek zor olabilir.
2. Ki-kare testi örneklem büyüklüğüne duyarlıdır. Örneğin, örneklem büyüklüğü arttıkça ki-kare testinin anlamlılığını gösteren p değeri de genellikle azalır. Bu nedenle, test sonuçları yorumlanırken örneklem büyüklüğü göz önünde bulundurulmalıdır.
3. 2×2’lik tablolar söz konusu olduğunda, sonuçları iyileştirmek için bir düzeltme faktörü uygulanması genellikle önerilir. Örneklem boyutu çok küçük olduğunda ise, Fisher’in Tam İhtimalli (Exact) testinin kullanılması daha uygundur. Bu, özellikle beklenen frekansların 5’in altında olduğu durumlarda daha geçerlidir. Bu iki yaklaşım, test sonuçlarının doğruluğunu ve güvenirliğini artırmaya yardımcı olur.
Yukarıda belirtilen örnekte, ziyaretçilerin medeni durumları ve alışveriş merkezinde geçirdikleri süre arasında bir ilişki olup olmadığını incelemeye çalışıyoruz. Bu hedefe ulaşmak için, SPSS analiz aracının Descriptive ve CrossTabs bölümünü kullanıyoruz. Medeni durum ve kalış süresi değişkenleri bu bölümlere aktarıldıktan sonra, ki-kare testini uygulamak için Statistics menüsünden ilgili seçenek seçiliyor. Bu işlemlerden sonra, Tablo 9.1’deki analiz sonuçlarına ulaşılıyor. Daha fazla bilgi ve detay için, SPSS uygulamaları bölümüne başvurulabilir.
Tabloda görülen sonuçlara bakıldığında, %5 anlamlılık seviyesinde null hipotez reddediliyor. Bu, alışveriş merkezlerinde geçirilen süre açısından evli ve bekar kişiler arasında istatistiksel olarak anlamlı bir fark olduğunu gösteriyor. Sonuçları değerlendirdiğimizde, evli kişilerin genellikle bekarlara göre daha fazla zaman geçirdiğini görüyoruz. Evli kişilerin daha uzun süre alışveriş merkezlerinde kalma eğiliminde olmalarının nedenleri arasında, çocuklarıyla birlikte gelmiş olmaları ve bu nedenle onları oyalama ve eğlendirme ihtiyaçları olabilir. Sonuçta, medeni durumun alışveriş merkezinde kalış süresi üzerinde etkili olduğunu söyleyebiliriz.
Ki-kare analizinde, iki değişken arasında ilişki olmadığı sonucuna ulaşılmış olabilir ancak bu, her zaman iki değişken arasında hiçbir ilişkinin olmadığı anlamına gelmez. Örneğin, iki değişken arasında lineer olmayan bir ilişki olabilir. Bu durumda, ki-kare analizi bu ilişkiyi tespit etmekte yetersiz kalabilir. Bu nedenle, analiz sonuçlarını yorumlarken bu durumun göz önünde bulundurulması gereklidir.
Verilerinizin analizi ve yorumlanması konusunda, akademik alanda her konuda yardıma ihtiyacınız varsa, uzman ekibimizle birlikte size yardımcı olmaktan mutluluk duyarız. Projelerinizin gereksinimlerini değerlendirebilir, size en uygun hizmetleri sunabiliriz. İletişime geçmek ve daha fazla bilgi almak için bize ulaşabilirsiniz.