Loading AI tools
Vikipedi'den, özgür ansiklopediden
Ortalama veya merkezsel konum ölçüleri, istatistik bilim dalında ve veri analizinde kullanılan bir veri dizisinin orta konumunu, tek bir sayı ile ifade eden betimsel istatistik ölçüsüdür. Günlük hayatta ortalama dendiğinde genellikle kast edilen aritmetik ortalama olmakla beraber bu ölçünün çok belirli bazı dezavantajları söz konusudur. Bu yüzden matematik ve istatistikte, bir anakütle veya örneklem veri dizisi değerlerini temsil eden tek bir orta değer veya beklenen değer, olarak medyan (ortanca), mod (tepedeğer), geometrik ortalama, harmonik ortalama vb adlari verilen birçok değişik merkezsel konum ölçüleri geliştirilmiş ve pratikte kullanılmaktadır.
Ortalama kavramı başlangıçta deniz nakliyatında ortaya çıkan zarar kavramından geliştirilmiştir. Deniz nakliyatında zarar, ya zarar gören eşya sahibi tarafından özel avarya olarak tümüyle yüklenilir veya nakledilen eşyaların satış kârını ortak olarak paylaşanlar tarafından genel avarya ortaklık payına göre karşılanır. Genel avarya hesabının yapılması için geliştirilip kullanılan matematiksel hesaplar aritmetik ortalamanın ilk kullanılma alanı olmuştur. Bu kavrama Arapça avar, İtalyanca avaria, Türkçede (pek çok denizcilik terimi gibi İtalyancadan alınan) avarya ve İngilizce average adı verilmektedir. İngilizcede aynı sözcük ve bazı günlük pratik hallerde Türkçede kullanılan averaj sözcüğü ortalamaya eşit anlamda kullanılmaktadır.
İstatistikte bilimsel olarak ortalamalar kavramına bir aksiyomatik yaklaşım John Bibby (1974) tarafından verilmiştir.[1]
Ortalama bir sayısal veri dizisinin merkezsel konumunu temsil etmek için seçilen tek bir sayı halinde bir özettir. Eğer veri dizisinde tüm elemanlar aynı sayı ise ortalama bu tek sayıdır. Ancak bu tip veri dizisi pratikte gayet az olarak bulunduğu, hatta nerede ise hiç bulunmadığı için, bir pratik veri dizisinin merkezsel konumunu farklı şekilde temsil edecek ortalamalar geliştirilmiştir. Önce bu ortalamalardan en çok kullanılanları kısaca ele alınacak ve sonra daha geniş kapsamlı bir tablo sunulacaktır.
Günlük hayatta en çok kullanılan ortalama türü aritmetik ortalama olmakla birlikte, bazı durumlarda mod, medyan, geometrik ortalama ve diğer ortalama türleri tercih edilmektedir.
Aritmetik ortalama bir anakütle veya bir örneklem veri değerlerinin toplamlarının o anakütledeki terim sayısına veya örneklem büyüklüğüne bölünerek elde edilen merkezsel konum değeridir. Bu tanınım şu formülle gösterilir:
Burada örneklem aritmetik ortalaması sembolüdür; anakütle aritmetik ortalaması için μ kullanılır.
Bu yöntem istatistikte sıkça kullanılır. Fakat bazı eksik yönleri vardır.
Örnek: Bir iş yerinde işçiler maaşlarının düşük olmasından dolayı şikayetçidirler. Fakat yöneticiler tam tersini savunabilirler. Maaş dağılımları şöyle olsun:
olarak ortalama aylık maaş hesaplanır. Ama bu ortalama merkezsel konumu göstermez. 38 personelden ancak 3'ü ortalamadan fazla maaş almakta görülmektedir ve maaş dağılımı çok bariz şekilde çarpıktır. Çok küçük sayıda kişi (müdür ve 2 yardımcısı) karşılaştırılmalı olarak çok büyük değerde maaş almakta ama çok büyük sayıda kişi düşük değerde maaş almaktadır. Böylece maaş dağılımı gayet asimetrik olup sağda ince uzun bir kuyruk bulunmaktadır; veri dağılımı pozitif çarpıklık göstermektedir. Bu nedenle maaş aritmetik ortalaması merkezsel konum göstergesi olmaktan çıkmıştır.
Aritmetik Ortalama'nın Çarpık veri dizilerinde işlevini kaybetmesi durumunun önüne geçebilmek için, 2014 yılında yayınlanan "İstatistikte Altın Oran" Kitabında yeni bir ortalama tanımlanmıştır.[3] Bu yeni ortalama GRiS (Golden Ratio in Statistics) Ortalama olarak adlandırılmıştır. Bu ortalamanın özelliği, veri dizisindeki her bir elemanın, konumuna göre katkı sağlamasıdır.
Veri Dizisi küçükten büyüğe sıralandıktan sonra, her bir elemana bulunduğu konuma göre, yukarıda gösterilen GRiS ortalama katsayı maskesindeki ağırlıklandırma katsayıları atanır. Her bir elemanın Medyan'dan farkı, kendine atanmış ağırlıklandırma katsayısı ile çarpılır, bu çarpımların toplamı, ağırlıklandırma katsayıları toplamına bölünür ve medyandan sapma hesaplanır. Veri dizisinin her iki ucunda bulunan elemanlar, aynı ölçüde baskılandığı için; GRiS ortalama her durumda medyana, aritmetik ortalamadan daha yakın konumlanmaktadır. Bu yöntem sayesinde aritmetik ortalamanın en bariz zayıflığı olan merkezsel değer olmaktan çıkıp çarpıklık kuyruğunun bulunduğu tarafa doğru gitme eğilimi bertaraf edilmiştir.
Geometrik ortalama bir anakütle veya bir örneklem veri değerlerinin çarpımlarının o anakütledeki terim sayısına veya örneklem büyüklüğüne eşit kökü alınmak suretiyle elde edilen bir merkezsel konum değeridir. Bu tanımlama için formül şöyle verilir:
Burada G geometrik ortalama sembolüdür.
Bu tür ortalamanın da dezavantajları bulunmaktadır:
Mod veri dizisi içinde en çok defa tekrarlanan veri değeridir. Mod isimsel ölçekli veriler için anlamlı olan tek ortalama ölçüsüdür. Ancak veri dizisi içinde tek bir mod olmayabilir yahut birden fazla sayıda mod bulunabilir.
Medyan bir veri dizisinin küçükten büyüğe veya büyükten küçüğe sıralanmasından sonra bu dizinin tam ortasında bulunan değerdir. Eğer veri büyüklüğü tek sayılı ise medyan verilen bir veri değerine eşit olur. Eğer veri büyüklüğü çift sayılı ise medyan orta iki değerin ortalaması olur. Medyan bulmak için basit bir algoritmaya göre sıralanmış veri değerlerinin kalan en küçük ve en büyük değerleri birer birer elimine edilir; veri sayısı tek ise en son kalan tek veri medyandır; eğer veri sayısı çift ise son kalan iki veri çiftinin ortalaması medyan olur.
İstatistikçiler ortalama türlerini genelleştiren tek bir formül bulmak için değişik yaklaşımlar kullanmışlardır:
Bu formülde m için değişik değerler değişik ortalama türü verirler: :
Burada f tersi alınabilir bir fonksiyondur. Bu formül değişik ortalamalar için şu şekilleri alır:
Ancak bu genelleştirme ile tüm ortalamaların ayrı ayrı formüllerini bulmak imkânsızdır.
İstatistik bilim dalında bir sıra değişik ortalama tipleri geliştirilmiş ve bunlardan araştırıcının isteğine göre birinin veya birkaçının eldeki veriler için merkezsel konum ölçüsü olarak kullanılması imkânı sağlanmıştır.
İsim | Denklem veya betimleme |
---|---|
Aritmetik ortalama | |
Medyan (ortanca) | Bu yüksek değerde olan veriler ile düşük değerde olan verilerin tam ortasında bulunan bir sayı. |
Geometrik medyan | Rn düzeyindeki noktalar için, medyan kavramının, matematik rotasyon dönüşümünde sabit kalan bir genişletilmesi, |
Mod (tepedeğer) | Verilerin en çok defa tekrarlanmış değeri |
Geometrik ortalama | |
Harmonik ortalama | |
Kuadratik ortalama (veya ortalama kareler karekökü) | |
Genelleştirilmiş ortalama | |
Ağırlıklı ortalama | |
Kesilmiş ortalama | Belirli bir yüzde oranda en yüksek ve en düşük veri değerlerinin bertaraf edilmelerinden sonra hesaplanan aritmetik ortalamadır. |
Çeyrekler açıklığı ortası | Çeyrekler açıklığı kullanılarak kesilmiş ortalamanın özel bir hali. |
Açıklık-ortası | |
Winsorize ortalaması | Bir çeşit kesilmiş ortalama olup belirli bir yüzde olarak kesilen en yüksek ve en düşük değerler bertaraf edileceğine kalan sayılar için en yuksek ve en düşük veri değerleri yerine ikame edilirler. |
Anualizasyon |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.