Eksperimentalni dizajn

Eksperimentalni dizajn (DOE, DOX, ili dizajn eksperimenata) je dizajn bilo kojeg zadatka koji ima za cilj da opiše ili objasni varijaciju informacija pod uslovima za koje je postavljena hipoteza da odražavaju varijaciju. Termin se generalno povezuje sa eksperimentima u kojima dizajn uvodi uslove koji direktno utiču na varijaciju, ali se takođe može odnositi na dizajn kvazi-eksperimenata, u kojima su prirodni uslovi koji utiču na varijacije odabrani za posmatranje.

U svom najjednostavnijem obliku, eksperiment ima za cilj da predvidi ishod uvođenjem promene preduslova, koja je predstavljena sa jednom ili više nezavisnih varijabli, koje se takođe nazivaju „ulazne varijable” ili „prediktorske varijable”. Promena jedne ili više nezavisnih varijabli se generalno pretpostavlja da dovodi do promene jedne ili više zavisnih varijabli, koje se takođe nazivaju „izlazne varijable” ili „varijable odgovora”. Eksperimentalni dizajn može takođe identifikovati kontrolne varijable koje se moraju održavati konstantnim kako bi se sprečilo da spoljni faktori utiču na rezultate. Eksperimentalni dizajn uključuje ne samo izbor odgovarajućih nezavisnih, zavisnih i kontrolnih varijabli, već i planiranje isporuke eksperimenta pod statistički optimalnim uslovima, s obzirom na ograničenja raspoloživih resursa. Postoji više pristupa za određivanje skupa projektnih tačaka (jedinstvene kombinacije postavki nezavisnih varijabli) koje će se koristiti u eksperimentu.

Glavni problemi u eksperimentalnom dizajnu uključuju utvrđivanje validnosti, pouzdanosti i replikabilnosti. Na primer, ova tri aspekta mogu biti delimično rešina pažljivim odabirom nezavisnih varijabli, čime se smanjuje rizik od greške u merenja i osigurava da je dokumentacija metode dovoljno detaljna. Povezani problemi uključuju postizanje odgovarajućih nivoa statističke moći i osetljivosti. Ispravno dizajnirani eksperimenti unapređuju znanje iz prirodnih i društvenih nauka i inženjerstva. Ostale aplikacije uključuju marketing i kreiranje smernica. Proučavanje dizajna eksperimenata je važna tema u metanauci.

Istorija

Sistematska klinička ispitivanja

Godine 1747, dok služio kao hirurg na HMS Solsberi, Džejms Lind sproveno je sistematsko kliničko ispitivanje radi poređivanja lekova za skorbut.^[1] To sistematsko kliničko ispitivanje predstavlja vrstu eksperimentalnog dizajna.

Lind je odabrao 12 ljudi sa broda, svi od kojih su patili od skorbuta. Lind je ograničio svoje subjekte na muškarce koji su „bili međusobno slični koliko je to bilo moguće”, odnosno, on je primenio stroge ulazne zahteve da bi se umanjile irelevantne varijacije. On ih je podelio u šest parova, dajući svakom paru različite dopune njihovoj osnovnoj ishrani tokom perioda od dve nedelje. Tretmani su bili lekovi koji su u to vreme bili predloženi:

Kvart cidera svaki dan.
Dvadeset pet kapi vitriola (sumporne kiselina) tri puta dnevno na prazan želudac.
Pola pinte morske vode svaki dan.
Mešavina belog luka, senfa i hrena u grudima veličine muškatnog oraščića.
Dve kašike sirćeta tri puta dnevno.
Dva narandže i jedan limun svaki dan.

Citrusni tretman je okončan nakon šest dana kad im je ponestalo voća, ali do tada je jedan mornar već bio spreman za dužnost, dok se drugi gotovo oporavio. Izuzev toga, samo jedna grupa (jabukovača) pokazala je određeni učinak lečenja. Ostatak posade je verojatno služio kao kontrola, ali Lind nije izvestio o rezultatima iz bilo koje kontrolne (netretirane) grupe.

Statistički eksperimenti

Inicijalni doprinos razvodju teorije statističkog zaključivanja je napravio Čarls Sanders Pers sa radovima „Ilustracije logike nauke” (1877–1878) i „Teorija verovatnog zaključivanja” (1883). U ove dve publikacije on je naglasio značaj zaključivanja zasnovanog na randomizaciji u statistici.

Randomizovani eksperimenti

Čarls Sanders Pers je randomno rasporedio volontere u slepom, ponavljeno-merenom dizajnu da bi procenio njihovu sposobnost da diskriminiraju težine.^[2]^[3]^[4]^[5] Persov eksperiment inspirisao je druge istraživače u psihologiji i obrazovanju, koji su razvili istraživačku tradiciju randomiziranih eksperimenata u laboratorijama i specijalizovanim udžbenicima tokom 1800-ih.^[2]^[3]^[4]^[5]

Optimalni dizajnovi za regresione modele

Čarls Sanders Pers je isto tako doprineo prvoj publikaciji na engleskom jeziku o optimalnom dizajnu za regresione modele iz 1876. godine.^[6] Pionirski optimalni dizajn za polinomsku regresiju predložio je Gergon 1815. godine. Kirsten Smit je 1918. objavila optimalne dizajne za polinome šestog stepena (i manje).

Sekvence eksperimenata

Upotreba niza eksperimenata, gde dizajn svakog može zavisiti od rezultata prethodnih eksperimenata, uključujući i moguću odluku da se zaustavi eksperimentisanje, obuhvaćena je poljem sekvencione analize. Pionirski doprinos ovom polju^[7] je učinio Abraham Vald u kontekstu sekvencijalnih testova statističkih hipoteza.^[8] Herman Černof je napisao pregled optimalnih sekvencijalnih dizajna,^[9] dok je S. Zaks ispitivao adaptivne dizajne.^[10] Jedan specifičan tip sekvencijalnog dizajna je „dvoruki bandit”, koji se može generalizovati u višestrukog bandita, na kojem je rane radove izvršio Herbert Robins 1952. godine.^[11]

Fišerovi principi

Metodologiju dizajniranja eksperimenata predložio je Ronald Fišer u svojim inovativnim knjigama: Uređenje terenskih eksperimenata (1926) i Dizajn eksperimenata (1935). Veliki deo njegovog pionirskog rada bavio se poljoprivrednim primenama statističkih metoda. Kao svakodnevni primer, opisao je kako se može testirati hipoteza dame koja gustira čaj, da izvesna dama može samo po ukusu da razlikuje da li je mleko ili čaj prvi stavljen u šolju. Ove metode su našle široku primenu u fizičkim i društvenim naukama, i još uvek se koriste u poljoprivrednom inženjerstvu. One se razlikuju od dizajna i analize računarskih eksperimenata.

Poređenje

U nekim oblastima studija nije moguće imati nezavisna merenja prema metrološkom standardu koji se može pratiti. Poređenja između tretmana su mnogo vrednija i obično su poželjnija, i često se porede sa naučnom kontrolom ili tradicionalnim tretmanom koji služi kao osnova.

Randomizacija

Slučajno dodeljivanje je proces radnomnog svrstavanja pojedinaca u grupe ili različite grupe u eksperimentu, tako da svaki pojedinac populacije ima istu šansu da postane učesnik u studiji. Slučajno raspoređivanje pojedinaca u grupe (ili uslova unutar grupe) razlikuje rigorozan, „pravi” eksperiment od opservacijske studije ili „kvazi-eksperimenta”.^[12] Postoji opsežna matematička teorija koja istražuje posledice alociranja jedinica na tretmane pomoću nekog slučajnog mehanizma (kao što su tabele slučajnih brojeva ili upotreba uređaja za randomizaciju kao što su karte za igru ili kocke). Dodeljivanje jedinica lečenju nasumično ima tendenciju da ublaži pometanje, koje uzrokuju da se efekti uzrokovani faktorima koji nisu deo tretmana pojavljuju kao rezultat tretmana.

Rizici povezani sa randomnom alokacijom (kao što je ozbiljna neravnoteža u ključnoj karakteristici između tretirane grupe i kontrolne grupe) mogu se izračunati i stoga se mogu upravljati do prihvatljivog nivoa koristeći dovoljno eksperimentalnih jedinica. Međutim, ako je populacija podeljena na nekoliko subpopulacija koje se nekako razlikuju, a istraživanje zahteva da svaka subpopulacija bude jednaka po veličini, može se koristiti stratifikovano uzorkovanje. Na taj način, jedinice u svakoj subpopulaciji su randomizirane, ali ne i celi uzorak. Rezultati eksperimenta mogu se pouzdano generalizovati iz eksperimentalnih jedinica na veću statističku populaciju jedinica samo ako su eksperimentalne jedinice slučajni uzorak iz veće populacije; verovatna greška takve ekstrapolacije zavisi, između ostalog, od veličine uzorka.

Statistička replikacija

Merenja su obično predmet varijacija i merne nesigurnosti; stoga se ona ponavljaju i celokupni eksperimenti se replikuju kako bi se identifikovali izvori varijacija, bolje procenili stvarni efekti tretmana, dodatno ojačala pouzdanost i valjanost eksperimenta, i da bi se uvećalo postojeće poznavanje teme.^[13] Međutim, određeni uslovi moraju biti ispunjeni pre nego što se započne replikacija eksperimenta: originalno istraživačko pitanje je objavljeno u recenziranom časopisu ili široko citirano, istraživač je nezavisan od originalnog eksperimenta, istraživač mora prvo pokušati da ponovi originalne nalaze koristeći originalne podatke, i izveštaj treba da navede da je sprovedena studija replikaciona studija koja je pokušala da prati originalnu studiju što je moguće striktnije.^[14]

Blokiranje

Blokiranje je nerandomno raspoređivanje eksperimentalnih jedinica u grupe (blokove/mnoštva) koje se sastoje od jedinica koje su slične jedna drugoj. Blokiranje smanjuje poznate ali irelevantne izvore varijacija između jedinica i na taj način omogućava veću preciznost u proceni izvora varijacija koje se proučavaju.

Ortogonalnost

Ortogonalnost se odnosi na oblike poređenja (kontraste) koje se mogu legitimno i učinkovito sprovoditi. Kontrasti mogu biti predstavljeni vektorima i skupovi ortogonalnih kontrasta su nekorelirani i nezavisno distribuirani ako su podaci normalni. Zbog te nezavisnosti, svaki ortogonalan tretman pruža različite informacije od drugih tretmana. Ako postoji T-tretmana i T-1 ortogonalnih kontrasta, sve informacije koje se mogu prikupiti iz eksperimenta mogu se dobiti iz skupa kontrasta.

Faktorski eksperimenti

Ovi ekperimenti obuhvataju upotrebu faktorskih eksperimenata, umesto metode jedan po jedan faktor. Oni su efikasni u proceni efekata i mogućih interakcija nekoliko faktora (nezavisnih varijabli). Analiza dizajna eksperimenta izgrađena je na osnovi analize varijanse, kolekcije modela koji dele uočenu varijansu u komponente, prema tome koje faktore eksperiment mora proceniti ili testirati.

Reference

[1]
Dunn, Peter (januar 1997). „James Lind (1716-94) of Edinburgh and the treatment of scurvy”. Archives of Disease in Childhood: Fetal and Neonatal Edition. 76 (1): 64—65. PMC 1720613 . PMID 9059193. doi:10.1136/fn.76.1.F64. Приступљено 17. 1. 2009.
[2]
Peirce, Charles Sanders; Jastrow, Joseph (1885). „On Small Differences in Sensation”. Memoirs of the National Academy of Sciences. 3: 73—83.
[3]
Hacking, Ian (septembar 1988). „Telepathy: Origins of Randomization in Experimental Design”. Isis. 79 (3): 427—451. JSTOR 234674. MR 1013489. doi:10.1086/354775.
[4]
Stephen M. Stigler (novembar 1992). „A Historical View of Statistical Concepts in Psychology and Educational Research”. American Journal of Education. 101 (1): 60—70. JSTOR 1085417. doi:10.1086/444032.
[5]
Trudy Dehue (decembar 1997). „Deception, Efficiency, and Random Groups: Psychology and the Gradual Origination of the Random Group Design”. Isis. 88 (4): 653—673. PMID 9519574. doi:10.1086/383850.
[6]
Peirce, C. S. (1876). „Note on the Theory of the Economy of Research”. Coast Survey Report: 197—201., actually published 1879, NOAA „PDF Eprint” (PDF). Архивирано из оригинала (PDF) 02. 03. 2017. г..
Reprinted in Collected Papers 7, paragraphs 139–157, also in Writings 4, pp. 72–78, and in Peirce, C. S. (1967). „Note on the Theory of the Economy of Research”. Operations Research. 15 (4): 643—648. JSTOR 168276. doi:10.1287/opre.15.4.643.
[7]
Johnson, N.L. (1961). "Sequential analysis: a survey." Journal of the Royal Statistical Society, Series A. Vol. 124 (3), 372–411. (pages 375–376)
[8]
Wald, A. (1945) "Sequential Tests of Statistical Hypotheses", Annals of Mathematical Statistics, 16 (2), 117–186.
[9]
Herman Chernoff, Sequential Analysis and Optimal Design, SIAM Monograph, 1972.
[10]
Zacks, S. (1996) "Adaptive Designs for Parametric Models". In: Ghosh, S. and Rao, C. R., (Eds) (1996). "Design and Analysis of Experiments," Handbook of Statistics, Volume 13. North-Holland. 0-444-82061-2. (pages 151–180)
[11]
Robbins, H. (1952). „Some Aspects of the Sequential Design of Experiments”. Bulletin of the American Mathematical Society. 58 (5): 527—535. doi:10.1090/S0002-9904-1952-09620-8.
[12]
Creswell, J.W. (2008), Educational research: Planning, conducting, and evaluating quantitative and qualitative research (3rd edition), Upper Saddle River, NJ: Prentice Hall. (2008) 0-13-613550-1. p. 300.
[13]
Dr. Hani (2009). „Replication study”. Архивирано из оригинала 02. 06. 2012. г. Приступљено 27. 10. 2011.
[14]
Burman, Leonard E.; Robert W. Reed; James Alm (2010), „A call for replication studies”, Public Finance Review, 38 (6): 787—793, doi:10.1177/1091142110385210, Архивирано из оригинала 06. 05. 2021. г., Приступљено 27. 10. 2011

Literatura

Peirce, C. S. (1877–1878), "Illustrations of the Logic of Science" (series), Popular Science Monthly, vols. 12-13. Relevant individual papers:
- (1878 March), "The Doctrine of Chances", Popular Science Monthly, v. 12, March issue, pp. 604–615. Internet Archive Eprint.
- (1878 April), "The Probability of Induction", Popular Science Monthly, v. 12, pp. 705–718. Internet Archive Eprint.
- (1878 June), "The Order of Nature", Popular Science Monthly, v. 13, pp. 203–217.Internet Archive Eprint.
- (1878 August), "Deduction, Induction, and Hypothesis", Popular Science Monthly, v. 13, pp. 470–482. Internet Archive Eprint.
- Peirce, C. S. (1883), "A Theory of Probable Inference", Studies in Logic, pp. 126-181, Little, Brown, and Company. (Reprinted 1983, John Benjamins Publishing Company, 90-272-3271-7)

Spoljašnje veze

A chapter from a "NIST/SEMATECH Handbook on Engineering Statistics" at NIST
Box–Behnken designs from a "NIST/SEMATECH Handbook on Engineering Statistics" at NIST
Detailed mathematical developments of most common DoE in the Opera Magistris v3.6 online reference Chapter 15, section 7.4, 978-2-8399-0932-7.

[ADC1997-1] [1]
Dunn, Peter (januar 1997). „James Lind (1716-94) of Edinburgh and the treatment of scurvy”. Archives of Disease in Childhood: Fetal and Neonatal Edition. 76 (1): 64—65. PMC 1720613 . PMID 9059193. doi:10.1136/fn.76.1.F64. Приступљено 17. 1. 2009.

[smalldiff-2] [2]
Peirce, Charles Sanders; Jastrow, Joseph (1885). „On Small Differences in Sensation”. Memoirs of the National Academy of Sciences. 3: 73—83.

[telepathy-3] [3]
Hacking, Ian (septembar 1988). „Telepathy: Origins of Randomization in Experimental Design”. Isis. 79 (3): 427—451. JSTOR 234674. MR 1013489. doi:10.1086/354775.

[stigler-4] [4]
Stephen M. Stigler (novembar 1992). „A Historical View of Statistical Concepts in Psychology and Educational Research”. American Journal of Education. 101 (1): 60—70. JSTOR 1085417. doi:10.1086/444032.

[dehue-5] [5]
Trudy Dehue (decembar 1997). „Deception, Efficiency, and Random Groups: Psychology and the Gradual Origination of the Random Group Design”. Isis. 88 (4): 653—673. PMID 9519574. doi:10.1086/383850.

[6] [6]
Peirce, C. S. (1876). „Note on the Theory of the Economy of Research”. Coast Survey Report: 197—201., actually published 1879, NOAA „PDF Eprint” (PDF). Архивирано из оригинала (PDF) 02. 03. 2017. г..
Reprinted in Collected Papers 7, paragraphs 139–157, also in Writings 4, pp. 72–78, and in Peirce, C. S. (1967). „Note on the Theory of the Economy of Research”. Operations Research. 15 (4): 643—648. JSTOR 168276. doi:10.1287/opre.15.4.643.

[7] [7]
Johnson, N.L. (1961). "Sequential analysis: a survey." Journal of the Royal Statistical Society, Series A. Vol. 124 (3), 372–411. (pages 375–376)

[8] [8]
Wald, A. (1945) "Sequential Tests of Statistical Hypotheses", Annals of Mathematical Statistics, 16 (2), 117–186.

[ref3-9] [9]
Herman Chernoff, Sequential Analysis and Optimal Design, SIAM Monograph, 1972.

[10] [10]
Zacks, S. (1996) "Adaptive Designs for Parametric Models". In: Ghosh, S. and Rao, C. R., (Eds) (1996). "Design and Analysis of Experiments," Handbook of Statistics, Volume 13. North-Holland. 0-444-82061-2. (pages 151–180)

[11] [11]
Robbins, H. (1952). „Some Aspects of the Sequential Design of Experiments”. Bulletin of the American Mathematical Society. 58 (5): 527—535. doi:10.1090/S0002-9904-1952-09620-8.

[12] [12]
Creswell, J.W. (2008), Educational research: Planning, conducting, and evaluating quantitative and qualitative research (3rd edition), Upper Saddle River, NJ: Prentice Hall. (2008) 0-13-613550-1. p. 300.

[13] [13]
Dr. Hani (2009). „Replication study”. Архивирано из оригинала 02. 06. 2012. г. Приступљено 27. 10. 2011.

[14] [14]
Burman, Leonard E.; Robert W. Reed; James Alm (2010), „A call for replication studies”, Public Finance Review, 38 (6): 787—793, doi:10.1177/1091142110385210, Архивирано из оригинала 06. 05. 2021. г., Приступљено 27. 10. 2011

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]