Kvantitatívna lingvistika

From Wikipedia, the free encyclopedia

Kvantitatívna lingvistika je poddisciplínou všeobecnej jazykovedy, presnejšie poddisciplínou matematickej lingvistiky. Predmetom kvantitatívnej jazykovedy je akvizícia, zmena, používanie a štruktúra prirodzeného jazyka. Skúma jazyky používajúc kombinatoriku, teóriu pravdepodobnosti, diferenčné a diferenciálne rovnice a testuje výsledky pomocou štatistických metód.[1] Jej hlavným cieľom je formulovať zákony jazyka[2], aby mohla vybudovať teóriu jazyka, chápanú ako systém usúvzťažnených jazykových zákonov. Tento cieľ si postavila od počiatku predovšetkým synergetická lingvistika.

Kvantitatívna lingvistika sa opiera empiricky o výsledky jazykovej štatistiky, ktorú možno považovať buď za štatistiku jazykov alebo za štatistiku ľubovoľných jazykových javov. Táto oblasť nemusí mať bezpodmienečne nejaké teoretické nároky. Dôležité dáta dodávajú aj korpusová a počítačová lingvistika.

Počiatky kvantitatívnej lingvistiky možno nájsť už v gréckej a indickej antike. Jednou z tradícií je aplikácia kombinatoriky na jazykové javy [3], druhá spočíva na elementárnych štatistických výberoch, ktoré možno nájsť pod heslami kolometria a stichometria.[4]

Jazykové zákony v kvantitatívnej lingvistike

Pod zákonom sa v kvantitatívnej lingvistike rozumie všeobecná výpoveď (t.j. platná pre všetky jazyky splňujúce isté podmienky, odvodená z teoretických predpokladov, formulovaná matematicky, usúvzťažnená s inými zákonmi a empiricky dostatočne overená, pričom nebola ani raz zamietnutá. K úlohe zákonov poznamenáva Köhler: „…vlastnosti jazykových prvkov a ich vzťahy podliehajú všeobecným zákonom, ktoré sa dajú rigorózne matematicky formulovať, tak ako to poznáme z prírodných vied. Pritom si treba uvedomiť, že ide o stochastické zákony; nie sú splnené v každom jednotlivom prípade (čo nie je ani možné, ani nutné), ale predpisujú pravdepodobnosti, s ktorými isté javy alebo pomery v základnom súbore nastávajú. Ku všetkým uvedeným príkladom sa dajú ľahko nájsť odchýlky, ktoré sa jednotlivo neprehrešujú proti daným zákonom, lebo odchýlky od štatistických priemerov sú nielen prípustné, ale aj potrebné a sú kvantitatívne presne určené. Táto situácia sa v podstate neodlišuje od situácie v prírodných vedách, v ktorých staré deterministické predstavy už vymreli a boli nahradené tiež štatisticko-probabilistickými modelmi.“[5]

Niektoré jazykové zákony

Existuje celý rad návrhov na jazykové zákony, napríklad:

  • Zákon diverzifikácie: Ak jazykové kategórie ako slovné druhy alebo flektívne koncovky vykazujú rôzne formy, tak sa dá ukázať, že početnosti, s ktorými sa tieto formy vyskytujú v textoch, sa riadia zákonmi.
  • Zákon rozdelenia početností jednotiek rozličnej dĺžky alebo všeobecnejšie, rozličnej komplexity. Ak skúmame, ako často sú jednotky istého druhu v texte alebo v slovníku zastúpené, tak zistíme, že sa správajú podľa istých pravdepodobnostných rozdelení. K dispozícii sú rozsiahle výskumy:
    • k zákonu rozdelenia dĺžok morf
    • k zákonu rozdelenia rytmických jednotiek rozličných dĺžok
    • k zákonu rozdelenia dĺžok viet
    • k zákonu rozdelenia znakov písma rozličnej komplexity
    • k zákonu rozdelenia slabičných dĺžok
    • k zákonu rozdelenia slovných dĺžok

Tomuto zákonu dĺžky podliehajú aj iné jazykové jednotky ako dĺžky kláuz, fráz, hrebov[6], rečových aktov[7], podobne platí aj pre rozdelenie dĺžky hlások.[8]

  • Martinov zákon: ak skúmame, ktoré slovo je ako heslo schopné zachytiť iné slovo, a pokračujeme v hľadaní ďalšieho vysvetľujúceho slova pre toto heslo, dôjdeme k celému radu hesiel. Ak to urobíme pre veľa slov, dostaneme hierarchiu stále všeobecnejších slov, ktorých je vždy menej. Medzi rovinami tejto hierarchie vládnu zákonité vzťahy.
  • Menzerathov zákon, v jazykovede tiež Menzerath-Altmannov zákon: tento zákon tvrdí, že čím viac komponentov má nejaká jednotka, tým kratšími sa stávajú komponenty.
  • Rangovo-frekvenčný zákon, týkajúci sa rozličných jazykových javov. Ak skúmame vo veľkom korpuse textov, ktoré slovo je najčastejšie, druhé najčastejšie atď., tak dostaneme isté poradie slov podľa frekvencie. Pre takéto poradie boli v literatúre navrhnuté rozličné matematické modely. Túto metódu možno v podstate aplikovať na ľubovoľné jazykové jednotky. Tu uvedieme len niektoré príklady:
    • Frekvencie hlások, foném, písmen: Jednotky sa zoradia podľa početnosti, s akou sa vyskytujú v texte alebo v slovníku.[9]
    • Asociácie slov: skúma sa, ktoré slová asociujú s tým, ktoré bolo predložené pokusnej osobe ako stimul.[10]
    • Početnosti slov: slová z korpusu sa zoradia do rangového poradia podľa početnosti.
  • Zákon jazykových zmien: rast slovníka, prjímanie pôžičiek (cudzích slov), zmeny vo flektívnom systéme a mnohé iné zmeny v jazyku sa riadia týmto zákonom, ktorý sa v jazykovede nazýva Piotrovkého zákonom a zodpovedá zákonom rastu v iných vedách (por. logistickú rovnicu). Tento zákon sa presadzuje aj pri učení sa jazyka, takže ho možno považovať aj za zákon osvojovania si jazyka.
  • Zákon textových pasáží: ak sa v texte stanovia rovnako dlhé pasáže, tak možno ukázať, že početnosť jazykových jednotiek v týchto pasážach je rozdelená zákonito.
  • Zipfov zákon, lepšie povedané Zipfove zákony: vo všeobecnosti platí, že súčin rangu a frekvencie vo frekvenčnom slovníku je približne konštantný. Hovoríme o Zipfových zákonoch preto, lebo to nie je jediný zákon, ktorý Zipf navrhol.

Na druhej strane sa možno pýtať, ktoré zákony možno očakávať pri určitých jazykových jednotkách. Altmann to rozvinul na príklade kompozít. V tomto prípade sa našiel celý rad hypotéz, ktoré ešte čakajú na overenie. Jeden z výsledkov je napríklad skutočnosť, že kratšie slová sa častejšie podieľajú na tvorení derivátov a kompozít ako dlhšie.[11] Aj polysémia slov ovplyvňuje mieru tvorenia kompozít.[12]

Výskum štýlu

Výskum literárnych a aj neliterárnych štýlov môže používať štatistika; ale okrem toho sa môže venovať aj výskumu pôsobenia zákonov v istých štýloch. V takých prípadoch podporuje kvantitatívna lingvistika štylistiku pri hľadaní objektívnych poznatkov a pomáha jej vysvetliť štylistické javy aspoň čiastočne opieraním sa o jazykové zákony. K základným predpokladom kvantitatívnej lingvistiky patrí, že pripúšťa napr. pre rozdelenie slovných dĺžok existenciu rozličných modelov alebo aspoň existenciu odlišných parametrov pre odlišné druhy textov a jazykov. Ak tieto výskumy platia hlavne pre literárne texty, tak je kvantitatívna štylistika (štýlometria) poddisciplínou kvantitatívnej lingvistiky.

Známi autori:

  • Gabriel Altmann (1931-2020)
  • Hans Arens (1911–2003)[13]
  • Rolf Harald Baayen (1958)[14]
  • Otto Behaghel (1854–1936); viď aj Behaghelove zákony
  • Adolf Busemann (Psychologe) (1887–1967)[15]
  • Sergej Grigor'evič Čebanov (1898–1965)
  • Moritz Wilhelm Drobisch (1802–1896)
  • Sheila Embleton (1954)[16]
  • William Palin Elderton (1877–1962)[17]
  • Ernst Wilhelm Förstemann (1822–1906)[18]
  • Wilhelm Fucks (1902–1990)[19]
  • Georg von der Gabelentz (1840–1893)[20]
  • Hans Goebl (1943)
  • Peter Grzybek (1957-2019)[21]
  • Pierre Guiraud (1912–1983)
  • Gustav Herdan (1897–1968)
  • Luděk Hřebíček (1934)
  • Friedrich Wilhelm Kaeding (1843–1928)
  • Emmerich Kelih (1964)[22]
  • Karl Knauer (1906–1966)[23]
  • Reinhard Köhler (1951)[24]
  • Werner Lehfeldt (1943)[25]
  • Gottfried Wilhelm Leibniz (1646–1716)[26]
  • Viktor Vasiľevič Levickij (1938)[27]
  • Karl Marbe (1869–1953)[28]
  • Helmut Meier (1897–1973)
  • Paul Menzerath (1883–1954)[29]
  • Sizuo Mizutani (1926)[30]
  • Augustus De Morgan (1806–1871)
  • Charles Muller (1909)[31]
  • Raijmund G. Piotrowski (1922–2009)[32]
  • Anatolij A. Polikarpov
  • Ioan-Iovitz Popescu (1932)[33]
  • Burghard Rieger (1937)
  • August Schleicher (1821–1868)[34]
  • L.A. Sherman
  • Juhan Tuldava (1922–2003)[35]
  • Albert Thumb (1865–1915)
  • Bohumil Trnka (1895–1984)[36]
  • George Kingsley Zipf (1902–1950); v. tiež: Zipfov zákon
  • Eberhard Zwirner (1899–1984); v. tiež: zákon pasáží

Referencie

Literatúra

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.