Bu bölümde istatistiksel araştırma sürecinin adımlarını, tek nicel değişkenli verilerin nasıl analiz edileceğini ve yorumlanacağını öğreneceğiz.
İstatistiksel araştırma süreci, verilerden anlamlı bilgilere ulaşmak, tahminlerde bulunmak veya kararlar vermek amacıyla yapılan sistematik ve bilimsel bir çalışmadır. Bu süreç, bir problemi çözmek, bir durumu anlamak veya bir hipotezi test etmek için verilerin toplanmasını, analiz edilmesini ve yorumlanmasını içerir. (Kaynak: PDF Sayfa 151)
Bu süreç, genellikle döngüsel bir yapıda ilerler ve aşağıdaki temel adımları kapsar (Döngüsel Şema - Kaynak: PDF Sayfa 152, 515):
Döngüsel Yapı: İstatistiksel araştırma süreci doğrusal bir çizgi gibi bitmez; sonuçlar yeni sorular doğurabilir veya eksiklikler fark edilirse önceki adımlara dönülebilir. Örneğin, analiz sonrası veri toplama yönteminin yetersiz olduğu fark edilirse, yeni bir planla süreç baştan başlatılabilir.
Önemli Not: Bu süreç, bilimsel bir yaklaşım gerektirir. Sistematik olmasının sebebi, sonuçların güvenilir, tutarlı ve tekrarlanabilir olmasını sağlamaktır. Rastgele veya düzensiz bir şekilde veri toplamak, yanlış çıkarımlara yol açabilir.
1. İstatistiksel araştırma sürecinin temel amacı nedir?
2. Araştırma sürecindeki ilk adım nedir?
3. İstatistiksel araştırma sürecinin döngüsel yapısı neyi ifade eder?
4. Verilerin analiz edilmesi hangi aşamada gerçekleşir?
5. Sürecin son aşamasında ne yapılır?
6. Araştırma süreci neden sistematik bir çalışma gerektirir?
7. Hangi durumda süreç yeniden başlatılabilir?
8. İstatistiksel araştırma sürecinde tahminler hangi aşamada kullanılır?
9. Araştırma sürecinde veri toplama neden önemlidir?
10. İstatistiksel araştırma süreci hangi özelliği ile bilimsel kabul edilir?
Bir veri setindeki tüm değerlerin toplanıp, toplam veri sayısına bölünmesiyle elde edilir. Veri setinin "denge noktası"dır. Sembolü: \(\bar{x}\) veya \(\mu\). Verilerin genel merkezini gösterir ancak aykırı (uç) değerlerden çok etkilenir. (PDF S.181'de etkisi tartışılıyor).
Sıralanmış veri setinin tam ortasındaki değerdir. Veri setini iki eşit parçaya böler. Aykırı değerlerden etkilenmez veya çok az etkilenir, bu nedenle çarpık dağılımlarda merkezi eğilimi ortalamadan daha iyi temsil edebilir. (PDF S.181'de aykırı değerlere karşı dayanıklılığı belirtiliyor).
Veri setindeki en büyük değer ile en küçük değer arasındaki farktır (Maks - Min). Verilerin toplam yayılım aralığını gösterir ama sadece uç değerlere baktığı için aykırı değerlerden çok etkilenir ve iç dağılım hakkında bilgi vermez. (PDF S.179, 359'da kullanılıyor).
Sıralanmış veri setinde üst çeyrek (Q3 - %75. nokta) ile alt çeyrek (Q1 - %25. nokta) arasındaki farktır (IQR = Q3 - Q1). Verilerin ortadaki %50'sinin yayılımını gösterir. Aykırı değerlerden etkilenmediği için açıklığa göre daha güvenilir bir yayılım ölçüsüdür. Kutu grafiğindeki kutunun uzunluğunu verir. (Kaynak: PDF Sayfa 176).
Verilerin, aritmetik ortalamadan tipik olarak ne kadar saptığını gösteren bir ölçüdür. Büyük standart sapma, verilerin ortalama etrafında daha çok yayıldığını; küçük standart sapma ise ortalamaya daha yakın kümelendiğini gösterir. Tüm verileri dikkate aldığı için hassas bir yayılım ölçüsüdür ancak aykırı değerlerden etkilenebilir. Sembolü: 's' veya 'σ'. (Kaynak: PDF Sayfa 178).
İstatistiksel bir araştırmada toplanan verilerin birbirinden farklı değerler alması durumudur. Bu farklılıkların neden kaynaklandığını anlamak, veriyi doğru yorumlamak için önemlidir. Dört ana türü vardır (Kaynak: PDF Sayfa 158, 160-161):
Doğada var olan ve ölçülen özelliğin kendisinden kaynaklanan farklılıklardır. Araştırmacı müdahale etmez, sadece doğal durumu gözlemler.
Örnekler:Ölçüm yapmak için kullanılan araçlardan (örn: cetvel, terazi, kronometre) veya ölçümü yapan kişinin farklı ölçüm tekniklerinden kaynaklanan farklılıklardır.
Örnekler:Araştırmacının, belirli bir etkiyi (müdahaleyi) gözlemlemek için koşulları değiştirmesi sonucu ortaya çıkan farklılıklardır. Genellikle deneylerde görülür.
Örnekler:Aynı evrenden (ana kitle) rastgele farklı örneklemler (alt gruplar) seçildiğinde, bu örneklemlerden elde edilen sonuçların birbirinden farklı olmasıdır.
Örnekler:1. Nicel veri nedir?
2. Standart sapma neyi ölçer?
3. Ortanca (medyan) neden aykırı değerlerden az etkilenir?
4. Çeyrekler açıklığı (IQR) hangi verilerin yayılımını gösterir?
5. "Doğal ortamdan kaynaklı değişebilirlik" örneği hangisidir?
6. Evren ile örneklem arasındaki temel fark nedir?
7. Açıklık (range) neden aykırı değerlerden çok etkilenir?
8. Değişken nedir?
9. Aritmetik ortalama hangi durumda yanıltıcı olabilir?
10. "Müdahaleden kaynaklı değişebilirlik" için örnek nedir?
İstatistiksel araştırma sorusu, bir araştırmanın temel taşıdır ve tüm süreci yönlendirir. İyi bir soru, açık, net ve veriyle cevaplanabilir olmalıdır. Aşağıdaki özelliklere sahip olmalıdır (Kaynak: PDF Sayfa 159):
Betimleyen ve Karşılaştıran Sorular:
Betimleyen Soru: "A lisesindeki 9. sınıf öğrencilerinin haftalık fiziksel etkinlik süreleri nasıl bir eğilim göstermektedir?" (Kaynak: PDF Sayfa 168)
Karşılaştıran Soru: "A lisesindeki öğrencilerin ev ödevi süresi, cinsiyete göre nasıl farklılaşmaktadır?" (Kaynak: PDF Sayfa 166)
Uygun Olmayan Soru: "Öğrenciler neyi sever?" (Bu soru belirsizdir, nitel veri içerir ve ölçülebilir değildir.)
1. İyi bir araştırma sorusu hangi özelliği taşımalıdır?
2. "9. sınıf öğrencilerinin haftalık ders çalışma süreleri nedir?" sorusu hangi türdendir?
3. "Kız ve erkek öğrencilerin matematik notları farklılık gösterir mi?" sorusu hangi türdendir?
4. Bir araştırma sorusu neden değişebilirliği yansıtmalıdır?
5. Hangi soru nicel veri toplamaya uygun değildir?
6. Araştırma sorusu neden net bir amaca sahip olmalıdır?
7. "Bir okulun öğrencilerinin yaş ortalaması nedir?" sorusu hangi özelliğe sahiptir?
8. İyi bir soruda evren neden açıkça belirtilmelidir?
9. Hangi soru araştırmaya değer olmayabilir?
10. "Öğrencilerin boy uzunlukları nasıl dağılır?" sorusu hangi özelliği taşır?
Veri toplama planı, araştırma sorusuna cevap verecek verilerin nasıl elde edileceğini düzenleyen bir yol haritasıdır. Verilerin güvenilir, geçerli ve yanlılıktan uzak olmasını sağlamak için bu aşama kritik öneme sahiptir. İyi bir plan, aşağıdaki unsurları içermelidir (Kaynak: PDF Sayfa 167, 279):
Neden Önemli? Plansız veri toplama, eksik, yanlış veya yanlı sonuçlara yol açabilir. Örneğin, bir okulda sadece başarılı öğrencilerin seçilmesi, evreni temsil etmez ve sonuçları çarpıtır. Rastgelelik ve sistematik bir yaklaşım, bu sorunları önler.
Amaç: A Lisesi 9. sınıf öğrencilerinin haftalık fiziksel etkinlik sürelerini belirlemek.
Araç: Anket (Öğrencilere cinsiyet ve haftalık etkinlik süresi sorulacak; süre dakika cinsinden ölçülecek).
Evren: A Lisesi'ndeki tüm 9. sınıf öğrencileri (620 kişi).
Örneklem: Rastgele seçilecek 100 öğrenci (Örneğin, öğrenci numaraları bir torbaya atılıp kura ile çekilecek).
Değişken: Haftalık fiziksel etkinlik süresi (nicel, dakika cinsinden).
Uygulama: Anketler, Nisan 2025'te, ders çıkışında okul bahçesinde, iki araştırmacı tarafından yüz yüze uygulanacak. Alternatif olarak, Google Forms ile dijital toplama yapılabilir.
Kayıt: Veriler, bir elektronik tabloya (Excel) girilecek ve yedeklenecek.
Etik: Öğrencilerin kimlik bilgileri gizli tutulacak, katılım isteğe bağlı olacak ve veriler sadece araştırma için kullanılacak.
(Kaynak: PDF Sayfa 168-169)
1. Veri toplama planında ilk olarak ne belirlenmelidir?
2. Örneklem nasıl seçilmelidir?
3. Veri toplama planında etik kurallar neden önemlidir?
4. "Anket" hangi tür veri toplama aracıdır?
5. Veri toplama planında "değişkenler" neden belirtilir?
6. Rastgelelik örneklem seçiminde neden önemlidir?
7. Veri toplama planında zamanlama neden belirtilir?
8. Hangi yöntem veri toplama aracı olarak kullanılamaz?
9. Veri toplama planında gizlilik neden önemlidir?
10. Veri toplama planında veriler nasıl kaydedilmelidir?
Toplanan verileri anlamlandırmak için çeşitli grafikler ve özet ölçüler kullanılır.
Sürekli veya gruplandırılmış nicel verilerin dağılımını görselleştirmek için kullanılır. Verilerin belirli aralıklarda (sınıflar/bin'ler) ne sıklıkla bulunduğunu gösterir. Sütunlar bitişiktir ve yükseklikleri frekansı temsil eder. Veri dağılımının şekli (simetrik, çarpık vb.), merkezi ve yayılımı hakkında görsel bilgi sunar. Sınıf aralığı seçimi görünümü etkiler. (Kaynak: PDF Sayfa 175)
Bu histogram, illerde avlanan sazan miktarlarının (ton) hangi aralıklarda yoğunlaştığını gösterir. Örneğin, 0-50 ton arası avlanan il sayısı en fazladır.
(Kaynak: PDF Sayfa 175)
Veri setinin dağılımını "Beş Sayılı Özet" (Minimum, Q1, Ortanca, Q3, Maksimum) ile gösterir. Kutunun kenarları Q1 ve Q3'ü, içindeki çizgi ortancayı gösterir. "Bıyıklar" genellikle aykırı olmayan en uç değerlere uzanır. Aykırı değerler ayrı noktalarla gösterilir. Verilerin merkezini, yayılımını (özellikle IQR), simetrisini ve aykırı değerleri hızlıca görmeyi sağlar. Grupları karşılaştırmak için idealdir. (Kaynak: PDF Sayfa 176, 180-181).
Bu kutu grafiği, atletlerin 100m derecelerinin dağılımını gösterir. Ortanca derece, derecelerin %50'sinin hangi aralıkta (Q1-Q3 = IQR) yoğunlaştığı ve aykırı dereceler görülebilir.
(Kaynak: PDF Sayfa 180-181)
Basit bir grafik türüdür. Sayı doğrusu üzerinde her bir veri noktası bir nokta ile temsil edilir. Aynı değere sahip birden fazla veri varsa, noktalar o değer üzerinde dikey olarak üst üste yığılır. Veri setinin genel dağılımını, kümelenmeleri, boşlukları ve aykırı değerleri görmek için kullanışlıdır, özellikle küçük veri setleri için. (Kaynak: PDF Sayfa 152, 157 - Grafik 6.2, 174)
Grafiklerin yanı sıra hesaplanan istatistikler de önemlidir:
Farklı yıllara ait katı atık miktarı verileri (örneğin kutu grafikleri veya ortalama/ortanca/standart sapma değerleri ile) karşılaştırılarak yıllar içindeki değişim eğilimi ve yayılımı yorumlanabilir. (Kaynak: PDF Sayfa 183-185)
1. Histogram hangi tür veriler için uygundur?
2. Kutu grafiğinde "bıyıklar" neyi gösterir?
3. Nokta grafiği hangi durumda kullanışlıdır?
4. Ortalama ile ortanca arasındaki fark neyi gösterebilir?
5. Histogramda sınıf aralığı artırılırsa ne olur?
6. Kutu grafiği hangi özet ölçüleri gösterir?
7. Nokta grafiğinde aynı değerdeki veriler nasıl gösterilir?
8. Veri analizi neden görselleştirme ile desteklenir?
9. Kutu grafiğinde aykırı değerler nasıl gösterilir?
10. Histogramda sütunların yüksekliği neyi temsil eder?
Aşağıdaki alana sayısal verilerinizi girin (sayıları virgül, boşluk veya noktalı virgül ile ayırabilirsiniz). Ardından butona basarak temel istatistikleri ve grafikleri görün.
Bu bölümde konuyu ne kadar öğrendiğinizi test edebilirsiniz. Toplam 30 soru: Kolay (1-10), Orta (11-20), Zor (21-30).