Medyan nasıl bulunur istatistik?
Medyan Nasıl Bulunur: İstatistiksel Bir Yaklaşım
Medyan, bir veri setindeki tam ortada yer alan değerdir. Başka bir deyişle, verileri küçükten büyüğe sıraladığında, tam ortada kalan sayıdır. Bu, ortalamadan (aritmetik ortalama) farklıdır ve aykırı değerlerden daha az etkilenir. Bu yüzden, gelir dağılımı gibi çarpık dağılımlarda ortalamadan daha anlamlı bir merkezi eğilim ölçüsü olabilir.
- Veriyi Sıralamak: Temel Adım
Medyanı bulmanın ilk ve en kritik adımı, elindeki tüm veriyi küçükten büyüğe doğru sıralamaktır. Bu, sayılarla uğraşırken en sık yapılan ama gözden kaçabilen bir detaydır. Örneğin, bir sınıftaki 10 öğrencinin matematik sınavı notları şöyle olsun: 55, 80, 70, 95, 60, 85, 75, 90, 65,
70.
Bu veriyi sıraladığımızda şu şekilde olur: 55, 60, 65, 70, 70, 75, 80, 85, 90,
95.
- Veri Sayısına Göre Medyan Hesaplama
Sıraladığın veri setindeki eleman sayısı (n), medyanı bulma yöntemini belirler. İki ana durum söz konusudur:
* Tek Sayıda Veri Olduğunda: Eğer veri setindeki eleman sayısı tek ise, medyan tam ortadaki değerdir. Örneğin, yukarıdaki 10 elemanlı veri setinden bir tanesini çıkarıp 9 elemanlı bir veri seti oluşturalım: 55, 60, 65, 70, 70, 75, 80, 85,
- Burada ortadaki değer
- sıradaki 70'tir. Yani medyan 70'tir.
* Çift Sayıda Veri Olduğunda: Eğer veri setindeki eleman sayısı çift ise, medyan ortadaki iki değerin ortalamasıdır. Yukarıdaki 10 elemanlı örneğimize geri dönelim: 55, 60, 65, 70, 70, 75, 80, 85, 90,
- Ortadaki iki değer
- ve
- sıradaki 70 ve 75'tir. Bu iki sayının ortalamasını alırsın: (70 + 75) / 2 = 72.
- Bu durumda medyan 72.5 olur.
Deneyimlerime göre, bu ortadaki iki sayının ortalamasını alırken bazen öğrencilerin kafası karışıyor. Unutma, sadece o iki sayıyı toplayıp ikiye bölüyorsun. Bu kadar basit.
- Pratik İpuçları ve Dikkat Edilmesi Gerekenler
* Aykırı Değerler: Medyanın en büyük avantajlarından biri, ortalamanın aksine aykırı değerlerden (veri setindeki diğer değerlerden çok uzak olanlar) daha az etkilenmesidir. Örneğin, yukarıdaki 10 kişilik sınıfa bir öğrenci daha gelip 1000 puan alırsa, ortalama çok yükselecektir. Ancak medyan, ortadaki değerler değişmediği sürece pek etkilenmez.
* Veri Setinin Büyüklüğü: Küçük veri setlerinde medyanı elle hesaplamak kolaydır. Ancak çok büyük veri setlerinde (örneğin, binlerce satış verisi), Excel, R veya Python gibi istatistiksel yazılımlar kullanmak çok daha pratiktir. Bu yazılımlarda genellikle "MEDIAN" gibi hazır fonksiyonlar bulunur.
* Gruplanmış Veride Medyan: Eğer verin gruplanmış olarak verildiyse (örneğin, yaş grupları: 0-10, 10-20, 20-30 gibi), medyanı hesaplamak için biraz daha gelişmiş bir formül kullanılır. Ancak temel mantık yine gruplanmış verinin ortasında yer alan aralığı bulmaktır. Bu durumda kullanılan formül şöyledir:
$Medyan = L + \frac{\frac{n}{2} - F}{f} \times w$
Burada:
- $L$: Medyanın bulunduğu grubun alt sınırı.
- $n$: Toplam veri sayısı.
- $F$: Medyanın bulunduğu grubun bir önceki gruplardaki kümülatif frekansının toplamı.
- $f$: Medyanın bulunduğu grubun frekansı.
- $w$: Grubun genişliği (sınırları arasındaki fark).
Bu formül ilk bakışta karmaşık görünse de, aslında mantığı veri setinin ortasına denk gelen grubu bulup, o grubun içindeki tam yeri hesaplamaktır.
Medyan, verinin merkezini anlamak için güçlü bir araçtır. Özellikle veriyi sıralayıp ortadaki değeri veya değerleri bulmak, istatistiksel analizlerin temelini oluşturur.