Serbestlik derecesi istatistiksel testlerde verilerin bağımsız olarak değişebilen sayısını ifade eder. Ki-kare testinde serbestlik derecesi satır ve sütun sayıları temel alınarak hesaplanır. Formül olarak serbestlik derecesi, satır sayısından bir eksik ile sütun sayısından bir eksik değerin çarpımı şeklindedir. Örneğin bir çapraz tabloda iki satır (Erkek ve Kadın) ve iki sütun (Spor Yapan ve Spor Yapmayan) olduğunu varsayalım. Bu durumda
satır sayısı 2, sütun sayısı 2’dir ve serbestlik derecesi (df) hesaplandığında (2-1)*(2-1)=1 olarak bulunur. Bu
df=1 sonucu tabloda yalnızca bir hücre değerinin serbestçe değişebileceğini, diğer hücrelerin toplamlar sabit olduğu için otomatik olarak belirleneceğini gösterir. Serbestlik derecesi Ki-kare
x² dağılım tablosundan kritik değer bulmada veya p-değeri hesaplamada önemli bir parametredir ve testin sonuçlarını yorumlamada temel rol oynar. Aşağıda bazı sık kullanılan serbestlik dereceleri verilmiştir.
Serbestlik deresi tablosu (df), çapraz tabloların satır ve sütun sayılarına göre hesaplanan değerlerden oluşan serbestlik derecesine ve anlamlılık düzeyine göre kritik x² değerlerini verir. Araştırmacılar hesaplanan Ki-kare değerini bu tablo ile karşılaştırarak ilişkinin istatistiksel olarak anlamlı olup olmadığını belirler. Ki-kare x² testinde, öncelikle istenilen bir anlamlılık düzeyi seçilir. Anlamlılık düzeyi, istatistiksel testlerde sonucun tesadüfen ortaya çıkma olasılığının sınırını belirleyen önceden seçilmiş bir değerdir. Genellikle “alfa” (α) ile gösterilir ve en yaygın olarak 0,05 (yüzde 5) kullanılır. Anlamlılık düzeyi, istatistiksel karar verme sınırını belirleyen ölçüttür. Bir araştırmada anlamlılık düzeyi 0,05 olarak belirlenmişse ve hesaplanan p-değeri 0,03 ise, bu sonuç anlamlıdır çünkü 0,03 < 0,05. Ancak p-değeri 0,31 olsaydı, sonuç anlamlı kabul edilmezdi çünkü 0,31 > 0,05 olduğundan daha büyüktür. Bu nedenle aralarında bir ilişki yoktur. Sonuç istatistiksel olarak anlamlı sayılmaz; yani gözlemlenen farkın tesadüfi olma ihtimali yüksektir.
0,10 anlamlılık düzeyi yüzde 10 olasılık demektir. Yani istatistiksel testte gözlemlenen fark veya ilişki tesadüfen ortaya çıkma olasılığının %10’un altında olması durumunda sonucu anlamlı kabul eder. Anlamlılık düzeyi 0,10 seçildiğinde, testte daha “gevşek” bir kriter
uygulanmış olur; yani %10 olasılıkla tesadüfi farkları da anlamlı kabul
edebiliriz. Bu anlamlılık düzeyi seçilirse araştırma sonuçları düzgün
bir sonuç vermez.
0,05 anlamlılık düzeyi yüzde 5 olasılık demektir. Yani istatistiksel testte gözlemlenen fark veya ilişki tesadüfen ortaya çıkma olasılığının %5’in altında olması durumunda sonucu anlamlı kabul ederiz. Çoğu araştırma analizlerinde tercih edilen anlamlılık düzeyi 0.05'tir.
0,01 anlamlılık düzeyi yüzde 1 olasılık demektir. Yani istatistiksel testte gözlemlenen fark veya ilişki tesadüfen ortaya çıkma olasılığının %1’in altında olması durumunda sonucu anlamlı kabul ederiz. Eğer p-değeri 0,01 veya daha küçükse, sonuç çok yüksek güvenle anlamlıdır, yani gözlemlenen farkın tesadüfi olma olasılığı çok düşüktür. 0,01 çok sıkı bir anlamlılık düzeyi olarak kabul edilir ve yalnızca çok güçlü kanıtlar mevcutsa sonuç anlamlı sayılır.
Aslında anlamlılık düzeyi (α), araştırmacının belirleyeceği herhangi bir olasılık değeridir; sık kullanılanlar 0,10, 0,05 ve 0,01 olsa da 0,02, 0,03 gibi değerler de araştırmacı tarafından seçilebilir. Örneğin α = 0,02 seçilirse, gözlemlenen farkın tesadüfen ortaya çıkma olasılığı %2’den az olursa sonuç anlamlı kabul edilir.
Anlamlılık düzeyine karar verildikten sonra serbestlik derecesi ve seçilen anlamlılık düzeyi dikkate alınarak Ki-kare dağılım tablosundan kritik değer bulunur. Hesaplanan Ki-kare x² değeri bu kritik değerle karşılaştırılır. Eğer hesaplanan değer kritik değerden büyükse, iki değişken arasında istatistiksel olarak anlamlı bir ilişki vardır; eğer hesaplanan değer kritik değerden küçükse, değişkenler arasındaki ilişki anlamlı değildir.
Örneğimizde araştırma sorusu, “Erkekler mi, kadınlar mı daha fazla spor yapıyor?” şeklindeydi. Amacımız, cinsiyet ile spor yapma durumu arasındaki ilişkinin istatistiksel olarak anlamlı olup olmadığını belirlemektir. Örnekte her hücre değeri için ayrı ayrı hesaplama yapılıp toplam x² değeri bulundu. Hesaplanan toplam değer x² = 1,01 dir. Daha sonra verilen çapraz tablonun 2 satır ve 2 sütununa göre serbestlik derecesi bulundu. Bu durumda satır sayısı 2, sütun sayısı 2’dir ve serbestlik derecesi hesaplandığında; df=(2-1)*(2-1)=1 olarak bulunur. Bu serbestlik değeri için serbestlik tablosundan araştırmacı tarafından bir anlamlılık değeri seçilir. Genellikle bütün anlamlılık testlerinde 0.05 değeri kullanılır. 0.05 için tabloya bakıldığında df=1 için bu değer 3,841 dir. Buna göre Hesaplanan x² = 1,01 değeri, kritik değer olan 3,841’den küçüktür. 1,01 < 3,841 olduğundan cinsiyet ile spor yapma durumu arasında istatistiksel olarak anlamlı bir ilişki bulunmamaktadır. Yani bu örneklemde erkekler ve kadınlar arasındaki spor yapma eğilimi istatistiksel olarak farklı değildir; gözlemlenen fark, tesadüfi farklılıklardan kaynaklanıyor olabilir.
Aynı işlem p değerleri ile de kıyaslanarak anlamlılık hakkında bir sonuca varılabilir. Aşağıdaki tablo, serbestlik derecesi 1 olan bir Ki-kare x² testi için kritik değerleri ve yaklaşık p-değerlerini gösterir. Hesaplanan x² değeri ile tabloya bakarak, p-değerinin hangi aralıkta olduğunu lineer olarak yaklaşık biçimde tahmin edebiliriz. Daha kesin p-değeri için SPSS gibi hesaplama yazılımları veya farklı istatistiksel fonksiyonlar kullanılabilir.
Ki-kare tablosu, serbestlik derecesi bir olan testler için bazı kritik değerleri ve bunlara karşılık gelen yaklaşık p-değerlerini gösterir. Örneğin, x² değeri 0,455 için p değeri yaklaşık 0,50’dir; bu, x²’nin 0,455 veya daha büyük olma olasılığının yaklaşık yüzde 50 olduğu anlamına gelir. Benzer şekilde, x² değeri 1,323 için p değeri yaklaşık 0,25’tir, yani x²’nin 1,323 veya daha büyük olma olasılığı yaklaşık yüzde 25’tir. Örneğimizde hesaplanan x² değeri 1,01 ise bu iki değer arasında (0,455 < 1,01 < 1,323) yer alır; p-değeri bu uç değerlere göre oranlanarak hesaplanırsa yaklaşık olarak 0,25 ile 0,50 arasında bir değere karşılık gelir. Sonucu lineer olarak tahmin edersek p değeri yaklaşık p ≈ 0,31 olarak bulunur. Bu, tablo kullanılarak yapılan yaklaşık bir tahmin yöntemidir, kesin sonucu vermez. Kesin sonuç istatistik analiz programlarından bulunur.
Tahminen bulunan p-değeri yaklaşık 0,31 olup, seçilen anlamlılık düzeyi olan 0,05’ten büyüktür. Bu durum, iki değişken arasında gözlemlenen ilişkinin istatistiksel olarak anlamlı olmadığını gösterir. Başka bir deyişle, cinsiyet ile spor yapma durumu arasında fark gözlemlenmiş olsa da, bu fark tesadüfi olma olasılığı yüksektir ve güvenilir bir ilişki olduğu söylenemez. Dolayısıyla araştırma sonucuna göre, örneklemde erkekler ve kadınlar arasında spor yapma eğiliminde istatistiksel olarak belirgin bir farklılık bulunmamaktadır.
0 yorum:
Fayda vermeyen ilimden Allah'a sığınırım. İlim; amel etmek ve başkalarıyla paylaşmak içindir. Niyetimiz samimiyetle insanlara yararlı olmaktır, akıbetimiz bu vesileyle güzel olsun. Dua eder, dualarınızı beklerim...
"Allah'ım; bana fayda sağlayacak ilimleri öğret ve ilmimi ziyadeleştir."
“Allahım! Sana teslim oldum, sana inandım, sana güvendim. Yüzümü, gönlümü sana çevirdim. İşlediğim tüm günahlarımı affeyle! Ey kalbleri çeviren Allahım! Kalbimi dînin üzere sâbit kıl. Beni Müslüman olarak vefât ettir ve beni sâlihler arasına kat!”
“Rabbim! Bizi doğru yola ilettikten sonra kalplerimizi eğriltme! Bize tarafından bir rahmet bağışla.Öne geçiren de sen, geride bırakan da sensin. Muhakkak ki lütfu en bol olan Sen’sin. Senden başka ilâh yoktur."
Lâ ilâhe illallah Muḥammedürrasulüllâh
KADİR PANCAR