Ki-kare (x²) testi hesaplaması

Etiketler :
İki yönlü çapraz tablolar, istatistiksel test ve analizler için temel oluşturur. İki kategorik değişkende  en yaygın olarak kullanılan testlerden biri Ki-kare testidir. Bu test, iki kategorik değişkenin bağımsız olup olmadığını incelemek için kullanılır.
Ki-kare (x²) testi, iki kategorik değişken arasındaki ilişkinin istatistiksel olarak anlamlı olup olmadığını değerlendirmek amacıyla kullanılan temel bir istatistiksel yöntemdir. Bu test, gözlenen frekanslar ile değişkenlerin bağımsız olması durumunda beklenen frekanslar arasındaki farkları inceleyerek, değişkenlerin birbirinden etkilenip etkilenmediğini ortaya koyar. Ki-kare testi, özellikle nominal veya ordinal ölçekteki kategorik değişkenler için uygundur ve araştırmacılara değişkenler arasında ilişki olup olmadığını güvenilir bir şekilde gösterir.
Testin hesaplama mantığı, her hücredeki gözlenen frekans ile beklenen frekans arasındaki farkın karesinin, beklenen frekansa bölünmesi ve tüm hücreler için bu değerlerin toplamının alınması şeklindedir. Beklenen frekanslar, iki değişkenin bağımsız olması durumunda, satır ve sütun toplamlarının çarpımı ile genel toplamın bölünmesi yoluyla hesaplanır.  Örneğin, bir okulda erkek ve kız öğrencilerin spor yapma durumunu inceleyen bir araştırmayı ele alalım. Bu araştırmaya göre erkek öğrencilerden 30’u spor yaparken 20’si yapmamaktadır; kız öğrencilerden ise 25’i spor yapmakta 25'i de spor yapmamaktadır. Bu veriler çaproz tabloda gösterilir. Bu tabloda her hücre için beklenen frekans hesaplanır; örneğin erkek ve spor yapanlar için beklenen frekans, toplam erkek sayısı ile toplam spor yapan sayısının çarpımının genel toplamın bölümüyle bulunur. Gözlenen ve beklenen frekans arasındaki farklar, test istatistiğine katkıda bulunur. Tüm hücreler için hesaplamalar yapıldıktan sonra bulunan x² değeri, istatistiksel tablolar veya yazılımlar aracılığıyla p-değeri ile karşılaştırılır. P-değeri belirlenen anlamlılık düzeyinden (genellikle 0,05) küçük ise, iki değişken arasında istatistiksel olarak anlamlı bir ilişki olduğu sonucuna varılır; aksi takdirde değişkenler bağımsız kabul edilir. 
Ki-kare testi, eğitim araştırmalarında öğrencilerin performans ve tercihleri, sağlık araştırmalarında hastalık durumu ile risk faktörleri, sosyal bilimlerde demografik özelliklerle davranış ilişkilerini incelemek gibi pek çok alanda kullanılmaktadır. Bu yönüyle, kategorik verilerin analizi ve ilişkilerin değerlendirilmesi için güvenilir ve etkili bir yöntem olarak kabul edilir.
Konuyu bir çapraz tablo üzerinden basit bir örnekle açıklayalım ve Ki kare hesaplamasını bir hücre üzerinden yapalım:

Ki-kare testinde tüm hücrelerdeki değerler hesaplandıktan sonra "toplam x² değeri" bulunur. Daha sonra verilen çapraz tabloya göre serbestlik derecesi (degree of freedom, df) belirlenir. Serbestlik derecesi testin kritik değerini belirlemek ve anlamlılık değeri (p-değerini) yorumlamak için kullanılır. Bu serbestlik değerine göre hesaplanan toplam x² değeri büyüklük ve küçüklük bakımından karşılaştırılır. Daha sonra kategorik değişkenler arasında "anlamlıdır" veya "anlamlı değildir" sonucuna varılır. 
Serbestlik derecesi (degree of freedom, df), istatistiksel testlerde verilerin bağımsız olarak değişebilen sayısını ifade eder. Başka bir deyişle, bir tabloda veya veri setinde bazı değerler sabitlenmiş veya önceden belirlendiğinde, geri kalan değerlerin serbestçe değişebileceği maksimum sayıdır. 

Serbestlik derecesi istatistiksel testlerde verilerin bağımsız olarak değişebilen sayısını ifade eder. Ki-kare testinde serbestlik derecesi satır ve sütun sayıları temel alınarak hesaplanır. Formül olarak serbestlik derecesi, satır sayısından bir eksik ile sütun sayısından bir eksik değerin çarpımı şeklindedir. Örneğin bir çapraz tabloda iki satır (Erkek ve Kadın) ve iki sütun (Spor Yapan ve Spor Yapmayan) olduğunu varsayalım. Bu durumda satır sayısı 2, sütun sayısı 2’dir ve serbestlik derecesi (df) hesaplandığında (2-1)*(2-1)=1 olarak bulunur. Bu df=1 sonucu tabloda yalnızca bir hücre değerinin serbestçe değişebileceğini, diğer hücrelerin toplamlar sabit olduğu için otomatik olarak belirleneceğini gösterir. Serbestlik derecesi Ki-kare x² dağılım tablosundan kritik değer bulmada veya p-değeri hesaplamada önemli bir parametredir ve testin sonuçlarını yorumlamada temel rol oynar. Aşağıda bazı sık kullanılan serbestlik dereceleri verilmiştir.
Serbestlik deresi tablosu (df), çapraz tabloların satır ve sütun sayılarına göre hesaplanan değerlerden oluşan serbestlik derecesine ve anlamlılık düzeyine göre kritik x² değerlerini verir. Araştırmacılar hesaplanan Ki-kare değerini bu tablo ile karşılaştırarak ilişkinin istatistiksel olarak anlamlı olup olmadığını belirler.
Ki-kare x² testinde, öncelikle istenilen bir anlamlılık düzeyi seçilir. Anlamlılık düzeyi, istatistiksel testlerde sonucun tesadüfen ortaya çıkma olasılığının sınırını belirleyen önceden seçilmiş bir değerdir. Genellikle “alfa” (α) ile gösterilir ve en yaygın olarak 0,05 (yüzde 5) kullanılır. Anlamlılık düzeyi, istatistiksel karar verme sınırını belirleyen ölçüttür. Bir araştırmada anlamlılık düzeyi 0,05 olarak belirlenmişse ve hesaplanan p-değeri 0,03 ise, bu sonuç anlamlıdır çünkü 0,03 < 0,05. Ancak p-değeri 0,31 olsaydı, sonuç anlamlı kabul edilmezdi çünkü 0,31 > 0,05 olduğundan daha büyüktür. Bu nedenle aralarında bir ilişki yoktur. Sonuç istatistiksel olarak anlamlı sayılmaz; yani gözlemlenen farkın tesadüfi olma ihtimali yüksektir.
0,10 anlamlılık düzeyi yüzde 10 olasılık demektir. Yani istatistiksel testte gözlemlenen fark veya ilişki tesadüfen ortaya çıkma olasılığının %10’un altında olması durumunda sonucu anlamlı kabul eder. Anlamlılık düzeyi 0,10 seçildiğinde, testte daha “gevşek” bir kriter uygulanmış olur; yani %10 olasılıkla tesadüfi farkları da anlamlı kabul edebiliriz. Bu anlamlılık düzeyi seçilirse araştırma sonuçları düzgün bir sonuç vermez.
0,05 anlamlılık düzeyi yüzde 5 olasılık demektir. Yani istatistiksel testte gözlemlenen fark veya ilişki tesadüfen ortaya çıkma olasılığının %5’in altında olması durumunda sonucu anlamlı kabul ederiz. Çoğu araştırma analizlerinde tercih edilen anlamlılık düzeyi 0.05'tir. 
0,01 anlamlılık düzeyi yüzde 1 olasılık demektir. Yani istatistiksel testte gözlemlenen fark veya ilişki tesadüfen ortaya çıkma olasılığının %1’in altında olması durumunda sonucu anlamlı kabul ederiz. Eğer p-değeri 0,01 veya daha küçükse, sonuç çok yüksek güvenle anlamlıdır, yani gözlemlenen farkın tesadüfi olma olasılığı çok düşüktür. 0,01 çok sıkı bir anlamlılık düzeyi olarak kabul edilir ve yalnızca çok güçlü kanıtlar mevcutsa sonuç anlamlı sayılır.
Aslında anlamlılık düzeyi (α), araştırmacının belirleyeceği herhangi bir olasılık değeridir; sık kullanılanlar 0,10, 0,05 ve 0,01 olsa da 0,02, 0,03 gibi değerler de araştırmacı tarafından seçilebilir. Örneğin α = 0,02 seçilirse, gözlemlenen farkın tesadüfen ortaya çıkma olasılığı %2’den az olursa sonuç anlamlı kabul edilir.
Anlamlılık düzeyine karar verildikten sonra serbestlik derecesi ve seçilen anlamlılık düzeyi dikkate alınarak Ki-kare dağılım tablosundan kritik değer bulunur. Hesaplanan Ki-kare  değeri bu kritik değerle karşılaştırılır. Eğer hesaplanan değer kritik değerden büyükse, iki değişken arasında istatistiksel olarak anlamlı bir ilişki vardır; eğer hesaplanan değer kritik değerden küçükse, değişkenler arasındaki ilişki anlamlı değildir. 
 
 
Örneğimizde araştırma sorusu, “Erkekler mi, kadınlar mı daha fazla spor yapıyor?” şeklindeydi. Amacımız, cinsiyet ile spor yapma durumu arasındaki ilişkinin istatistiksel olarak anlamlı olup olmadığını belirlemektir. Örnekte her hücre değeri için ayrı ayrı hesaplama yapılıp toplam x² değeri bulundu. Hesaplanan toplam değer x² = 1,01 dir. Daha sonra verilen çapraz tablonun 2 satır ve 2 sütununa göre serbestlik derecesi bulundu. Bu durumda satır sayısı 2, sütun sayısı 2’dir ve serbestlik derecesi hesaplandığında; df=(2-1)*(2-1)=1 olarak bulunur. Bu serbestlik değeri için serbestlik tablosundan araştırmacı tarafından bir anlamlılık değeri seçilir. Genellikle bütün anlamlılık testlerinde 0.05 değeri kullanılır. 0.05 için tabloya bakıldığında df=1 için bu değer 3,841 dir. Buna göre Hesaplanan x² = 1,01 değeri, kritik değer olan 3,841’den küçüktür. 1,01 < 3,841 olduğundan cinsiyet ile spor yapma durumu arasında istatistiksel olarak anlamlı bir ilişki bulunmamaktadır. Yani bu örneklemde erkekler ve kadınlar arasındaki spor yapma eğilimi istatistiksel olarak farklı değildir; gözlemlenen fark, tesadüfi farklılıklardan kaynaklanıyor olabilir. 
Aynı işlem p değerleri ile de kıyaslanarak anlamlılık hakkında bir sonuca varılabilir. Aşağıdaki tablo, serbestlik derecesi 1 olan bir Ki-kare x² testi için kritik değerleri ve yaklaşık p-değerlerini gösterir. Hesaplanan x² değeri ile tabloya bakarak, p-değerinin hangi aralıkta olduğunu lineer olarak yaklaşık biçimde tahmin edebiliriz. Daha kesin p-değeri için SPSS gibi hesaplama yazılımları veya farklı istatistiksel fonksiyonlar kullanılabilir.
 
Ki-kare tablosu, serbestlik derecesi bir olan testler için bazı kritik değerleri ve bunlara karşılık gelen yaklaşık p-değerlerini gösterir. Örneğin, x² değeri 0,455 için p değeri yaklaşık 0,50’dir; bu, x²’nin 0,455 veya daha büyük olma olasılığının yaklaşık yüzde 50 olduğu anlamına gelir. Benzer şekilde, x² değeri 1,323 için p değeri yaklaşık 0,25’tir, yani x²’nin 1,323 veya daha büyük olma olasılığı yaklaşık yüzde 25’tir. Örneğimizde hesaplanan x² değeri 1,01 ise bu iki değer arasında (0,455 < 1,01 < 1,323) yer alır; p-değeri bu uç değerlere göre oranlanarak hesaplanırsa yaklaşık olarak 0,25 ile 0,50 arasında bir değere karşılık gelir. Sonucu lineer olarak tahmin edersek p değeri yaklaşık p ≈ 0,31 olarak bulunur. Bu, tablo kullanılarak yapılan yaklaşık bir tahmin yöntemidir, kesin sonucu vermez. Kesin sonuç istatistik analiz programlarından bulunur.  
Tahminen bulunan p-değeri yaklaşık 0,31 olup, seçilen anlamlılık düzeyi olan 0,05’ten büyüktür. Bu durum, iki değişken arasında gözlemlenen ilişkinin istatistiksel olarak anlamlı olmadığını gösterir. Başka bir deyişle, cinsiyet ile spor yapma durumu arasında fark gözlemlenmiş olsa da, bu fark tesadüfi olma olasılığı yüksektir ve güvenilir bir ilişki olduğu söylenemez. Dolayısıyla araştırma sonucuna göre, örneklemde erkekler ve kadınlar arasında spor yapma eğiliminde istatistiksel olarak belirgin bir farklılık bulunmamaktadır.

0 yorum:

Fayda vermeyen ilimden Allah'a sığınırım. İlim; amel etmek ve başkalarıyla paylaşmak içindir. Niyetimiz samimiyetle insanlara yararlı olmaktır, akıbetimiz bu vesileyle güzel olsun. Dua eder, dualarınızı beklerim...

"Allah'ım; bana fayda sağlayacak ilimleri öğret ve ilmimi ziyadeleştir."

“Allahım! Sana teslim oldum, sana inandım, sana güvendim. Yüzümü, gönlümü sana çevirdim. İşlediğim tüm günahlarımı affeyle! Ey kalbleri çeviren Allahım! Kalbimi dînin üzere sâbit kıl. Beni Müslüman olarak vefât ettir ve beni sâlihler arasına kat!”

“Rabbim! Bizi doğru yola ilettikten sonra kalplerimizi eğriltme! Bize tarafından bir rahmet bağışla.Öne geçiren de sen, geride bırakan da sensin. Muhakkak ki lütfu en bol olan Sen’sin. Senden başka ilâh yoktur."

Lâ ilâhe illallah Muḥammedürrasulüllâh


KADİR PANCAR

Aşağıdaki Yazılar İlginizi Çekebilir!!!