Loading AI tools
Vikipedi'den, özgür ansiklopediden
Varyans Analizi (veya ANOVA, İngilizce ANalysis Of VAriance sözcüklerinin kısaltması) istatistik bilim dalında, grup ortalamaları ve (gruplar içi ve gruplar arası varyasyon gibi) bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans Analizi kullanılmaktayken belirlenmiş bir değişkenin gözlemlenen varyansı farklı değişim kaynaklarına dayandırılabilen varyans bileşenine ayrılır. En basit şekliyle varyans analizi birkaç grubun ortalamalarının birbirine eşit mi eşit değil mi olduğunu sınamak için bir çıkarımsal istatistik sınaması olur ve bu sınama iki-grup için yapılan t-test sınamasını çoklu-gruplar için genelleştirir. Eğer, çoklu değişkenli analiz için birbiri arkasından çoklu iki-örneklemli-t-sınaması yapmak istenirse bunun I. tip hata yapma olasılığını artırma sonucu doğurduğu aşikardır. Bu nedenle, üç veya daha fazla sayıda (gruplar için veya değişkenler için) ortalamaların ististiksel anlamlığının sınama ile karşılaştırılması için Varyans Analizleri daha faydalı olacağı gerçeği ortaya çıkmaktadır.
Kısacası, ANOVA bir parametrik çıkarımsal metodu olup anakütle ortalamaları arasında farkın olup olmadığını sınamak için kullanılır. Örneğin, 'Opel ile Toyota marka araçların benzin tüketim ortalamaları aynıdır' H0 hipotezinin sınaması yapılır. Sonuç, "ortalamalar aynıdır" veya "ortalamalar aynı değildir" şeklinde çıkartılır. Bu analizdeki iki değişken arasında lineer bağlantı için (regresyon analizinde yapıldığı gibi) herhangi bir eğim katsayısı bulunmadığı kabul edilir. ANOVA analizi yapılabilmesi için en temel şart, ortalamaları incelenecek olan anakütlelerin varyanslarının aynı olmasıdır.
Bu yöntem ilk defa İngiliz istatistikçi ve genetikçi Ronald Fisher tarafından 1920'lı ve 1930'lu yıllarda geliştirilmiştir. Genel olarak istatistiksel anlamlılık sınamaları içinde F-dağılımı'nı kullanmaları ile karakterize edildikleri için bazen bu analize Fisher'in Varyans Analizi adı da verilmektedir.
Varyans analizi deneysel verilerin analiz edilmesi için özellikle pratikte çok defa kullanılan özel bir istatistikel hipotez sınaması şeklidir. İstatistiksel hipotez sınaması bir veriler kullanarak karar vermek yöntemidir. Bir örneklem ve sıfır hipotezden hesaplanmış sınama sonucunun istatistiksel anlamsal olduğunu bildirmek bu sonucun (sıfır hipotezin doğru olduğu kabul edilirse) şans eseri olarak ortaya çıkmasının pek olası olmadığını bildirmek ve kabul etmektir. (Eğer bir olasılık p-değeri bir anlamlılık seviyesi eşik değerinden daha düşük ise) bir istatistiksel anlamlı sonuç sıfır hipotezi'nin reddedilmesini haklı çıkartır.
Varyans analizinin uygulandığı tipik bir problemde sıfır hipotez basitçe tüm grupların aynı anakütleden ayrı ayrı basit olasılık örneklemleri ile elde edildiğidir. Bu ise bütün sağaltım işlemlerinin aynı etki (hatta hiçbir etki) vermediğine işaret etmektedir. Böylece sıfır hipotezin reddedilmesi değişik sağaltım işlemlerinin değişme yaratan etkileri olduğunu kabul etmeyi ima etmektedir.
Çıkarımsal istatistik ana kurulma kurallarına göre hipotez sınaması I. Tip Hata yapma haddini (yani hatalı bilimsel iddialara yol açan hatalı pozitifleri) bir anlamlılık seviyesi ile sınırlamaktadır. Deneyciler aynı zamanda II. Tip hataları (yani bilimsel bulguları çıkartma fırsatının kaçırılmasına neden olan hatalı negatifleri) sınırlamak istemektedirler. II. Tip Hata haddi çeşitleri nedenlerin fonksiyonudur ve bunlar arasında şunlar bulunur: (a) Örneklem büyüklüğü (deneylem maliyetleri ile pozitif korelasyonlu olarak birlikte değişir). (b) Anlamlılık seviyesi (ispat için gereken standartlar çok sıkı ise bir yapılabilecek bir bulgu gözden kaçırma olasılıkları da yüksek olmaktadır). (c) Etki büyüklüğü (etkiler herhangi bir alelade gözlemciye çok aşikar görünmekteyse II. Tip Hata yapma olasılığı düşüktür.)
Varyans analizi için kullanılan terminoloji istatistiksel çoğunlukla deneysel tasarım için kullanılan terimlerle aynıdır. Deney yapan, bir "etki"yi tespit etmek girişimi ile "faktörler"'i ayarlar ve "yanıtlar"ı ölçer. Sonuçların geçerliliğini sağlamak için "faktörler"i deneyleme birimlerine "rassallaştırma" ve "bloklama" karışımı ile ulaştırır. Deneysel "körleştirme" ağırlıkların tarafsız olmasını sağlar. "Yanıt"lar, kısmen etki sonucu olarak kısmen de rassal hata dolayısıyla, bir değişebilirlik gösterir.
Varyans analizi çeşitli düşünce tarzlarının bir sentezidir ve çok değişik maksatlarla kullanılmaktadır. Bu nedenle bu analizi çok özlu veya kesinlikle tanımlamak gayet zordur.
Dengeli veriler için klasik varyans analizi üç değişik şeyi aynı anda yapmaktadır:
Kısaca ifade ile varyans analizi çözümlenen veriler için bir açıklama geliştirme ve doğrulaması için birkaç çeşit analiz yolu olarak kullanılan istatistiksel alettir.
Buna ek olarak
Bu nedenle
Varyans analizinin özellikle karmaşık deneysel tasarılar için öğretilmesi ve öğrenilmesi gayet zordur ve bu arada "sınırlandırılmış rassallaştırma" konusu gayet kötü şöhret yapmıştır.[4] Bazı hallerde yöntemin tam uygunlukla kullanılabilmesi için, önce görüntülü tanıma yöntemi ile belirlenmesi gerekmekte ve sonra da en iyi yetkili klasik testi uygulayarak bir "konsaltasyon" rejimi kullanmak gerekmektedir.[5]
Varyans Analizi'nde üç değişik sınıf model kullanılmaktadır. Bunlar şöyle özetlenebilir:
Verinin normal dağılım gösteren bir anakütleden geldiğini ve ancak farklı ortalamalar dolayısıyla ayrım yapılabileceğini varsaymaktadırlar.
Verinin bir farklar hiyerarşisi ile sınırlanmış olan değişik hiyerarşi içeren anakütlelerden geldiğini varsayar.
Içinde hem sabit etkiler hem de rastgele etkiler kapsayan durumları inceler.
Pratik problemlerde varyans analizi deneylemler için kullanılır ve deneylem elemanlarına uygulanan sağlatımların sayısına ve nasıl uygulandıklarına göre birkaç değişik tipe sınıflandırılmaktadırlar:
Bu tür analiz iki veya daha çok sayıda bağımsız grup arasındaki farklılıkların sınanmak istenildiği hallerde uygulanır. F-dağılımına dayanır. Tipik olarak tek yönlü varyans analizi en aşağı üç değişik grup olduğu zaman uygulanmaktadır.[6] İki-grup halinde daha kolay olarak t-testi aynı sonuçları vermektedir; çünkü bu halde t-testi ve F-testi birbirine çok yakından ilişkilidir. Bu yakın ilişki şöyle ifade edilir:
Bu tür varyans analizinde aynı elamanlara her değişik sağlatım uygulanır, yani elamanlar tekrarlanan ölçülere tabi tutulurlar. Bu yöntem kullanılırken elemanlar kalıntı etkilerine maruz kalabilirler.
Bu tür varyans analizi eğer deneyci iki veya daha çok sayıda sağlanım (bağımsız) değişkenin etkilerini incelemek isterse kullanılır. En çok kullanılan faktōryel varyans analizi iki bağımsız değişken ve her değişken için iki değişik değer veya seviye olduğu 2x2 (ikiye iki) tasarımdır. Faktōryel varyans analizi çoklu seviyeli, 3x3 (üçe üç) veya daha yüksek sıralı 2x2x2 (ikiye ikiye iki) vb. deneylem tasarımlarında da kullanılabilirler. Ancak bu daha yüksek sayıda faktörler için analizler çok nadir olarak yapılmaktadır. Buna neden hesapların çok karmaşık ve uzun olması ve ortaya çıkartılan sonuçların açıklanmalarının çok zor olduğudur.
Eğer iki veya daha çok sayıda bağımsız gruplar elemanlarına tekrar edilen ölçüler uygulayıp sınanmak istenirse, bir faktöryel karışık tasarım varyans analizi gerçekleştirilebilinir. Bunda bir faktör bağımsız olur ve diğer faktör tekrar edilebilir ölçülere bağlıdır. Bu, karışık etkiler modeline bir örnektir.
Birden çok bağımlı değişken bulunduğu zaman bu tür varyans analizi kullanılır.
Varyans analizi içinde sabit etkiler modeli, bir deneylem içinde deneycinin deney örneklem elemanlarına yanıt değişkeni değerlerinin birkaç değişik sağlanım uyguladığı zaman değişip değişmediğini incelemek istediği hallere tatbik edilir. Bu modeller deneyciye sağlanımın tüm anakütle içinde ortaya çıkarabileceği yanıt değişken değerlerinin açıklığını kestirim yapma imkâni sağlar.
Rastgele etkiler modelleri, sağlanımlar sabit olmadıkları hallerde kullanılırlar. Bu (faktör seviyeleri adı ile de bilinen) değişik sağlanımlar daha büyük bir anakütleden örneklem ile bulunmaları halidir. Sağlanımları kendileri rassal değişken olmaları nedeniyle, sabit etkiler modelinden daha değişik bazı varsayımların ve sağlanımların karşılaştırılmaları gerekmektedir.
Rastgele etkiler modelerinin veya karışık etki modellerinin çoğunda iyi belirenmiş örneklemi alınmış faktörleri ilgilendiren çıkarımsal istatistik analizlerle ilgili değildir. Bunu bir orneğinle açıklamak şöyle yapilabilir: Aynı mali üretmek için çok değişik makinaların kullanıldığı bir sanayi birimi ele alınsın. Bu işletmeyi inceleyen istatisikçi üç değişik makinenin birbirleri ile karşılaştırılması ile ilgilenmesi uygulanabilen pratik bir problem degildir. Buna karşılık tüm makinalar hakkında, tüm ortalama üretkenlik ve değişik makinelerde üretkenliğin yayılımı hakkında çıkarımsal istatistik analizi sınamalar arastirmaciyi ilgilendiren bir sorun olabilir.
Bazı istatistikçiler verilerin normallikten ayrılması halinde varyans analizinin esası olan F-sınaması'nın güvenilmez olacağını bildirmektedir.[7] Diğer istatistikçiler ise F-sınamasının "güçlü olduğunu", yani normal olmamakdan fazla etkilenmediğini savunmaktadırlar.[8]
Bu ortak varsayımlar yanında sabit etki modelleri için hataların bağımsız ve aynı şekilde normal dağılım gösterdikleri de, yani
olduğu varsayılmaktadır. Varyans analizi için kullanılan rastgele etki modelleri ve karışık etki modelleri için hataların ortalama ve varyansi için daha karmaşık varsayımlar gerekmektedir çünkü faktörler kendilerine özel dağılımlardan ortaya çıkartılabilirler.
Varyans analizinde temel yöntem, toplam kareler toplamını modelde kullanılan etkilere uygun olan parçalara bölmektir. Bu yönteme aşağıda verilen örnek tek bir sağlatımın değişik seviyelere uygulanması halidir.
Örnek olarak tek bir sağlatımın değişik seviyeler uygulanması sonucu ortaya çıkan toplam kareler toplamı şu parçalara bölünür:
Serbestlik dereceleri de aynı şekilde parçalara bölünmektedir ve her ilgili parçanın bir ki-kare dağılımı gösterdiği belirlenmektedir.
Toplam sapmanın parçalarının karşılaştırılması için F-sınaması uygulanır. Tek yönlü veya tek faktörlü varyans analizi için istatistik anlamlılığın sınanması, F-sınama istatistiği olan şu
ifade ile I-1 ve nT serbestlik derecelerinde F-dağılımı ifadesini karşılaştırmak suretiyle gerçekleştirilir.
F-dağılımı kullanmak doğal bir uygulamadır, çünkü sınama istatistiği her biri ki-kare dağılımı gösteren iki kareler toplamları ortalamasının bir diğerine bölümüne eşittir.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.