Loading AI tools
ウィキペディアから
記述文法(きじゅつぶんぽう)は、「実際の表現はどうなっているか」を捉える文法であり、「明らかに普通は使わないだろう?」という表現も含めて、「文法的に正しいかどうか」に関わる文法である。
この記事はカテゴライズされていないか、不十分です。 |
例えば「できる」の命令形「できろ」は、規範文法では誤であるが、記述文法においては正である。日本語処理のうち、形態素解析において重要視される[1]。
具体的には、橋本進吉・岩淵悦太郎による動詞の活用形について[注 1]、いろいろな理由から批判が出たことに起因する。焦点としては、「文語動詞の四段活用動詞の語幹は子音末尾である」のに対し、文語文法で「h」音末尾の動詞が学校文法では「ワ行音末尾動詞(w 音末尾動詞)」とされたが、その説明が理論的整合性に欠けているという話であった。それが問題になった1970年代末には、まだ「漢字の使えるパソコン」は普及しておらず、インターネットなどもなかった時代なので、SNOBOLはあったものの「コーパスデータの分析」という計算言語学は未発達であったことから[3][4]、検証は困難であった。
その後、ワープロやパソコンの普及などにより、「かな漢字変換」の高精度化に対するニーズが高まったが、記述文法への興味は喚起されなかった[注 2]。その後、1990年に日本語の辞書引きツールが発売され、アスキーの VJE チームやアップルコンピュータ・ジャパンのことえりチームとも協業したが、いかんせん「かな漢字変換」とはいっても「ローマ字→かな→漢字かな交じり」というルートに沿っていたため記述文法の記述が複雑になり[注 3]、実装はされなかった。これには当時「不定長データと動的 GC を行なえるプログラミング言語が普及していなかった」という理由もある[注 4]。
日本語の用言の活用は、基本的には簡単でありローマ字ベースで記述すれば C 言語などでも六百行程度のコードによって記述できる(ただし、かなとローマ字の対応関係が一意でないため、「あ」を「_a」、「ん」を「nn」などと記述しないと扱いが面倒になる)。これに対し、従来の文語文法や学校文法で用いられている「かなベース」の記述を行なうと、おおむね二千行から三千行単位の記述になるため、国文法学者の手に余る(とはいえ、職業的なプログラマにとっては大した量ではないのだが、プログラマの多くは国文法学に堪能ではない)。そこで、中間言語(PrologやLISPなど)を用いた仮想言語システムを導入することが考えられたが、文字列処理に特化されていなかった(SQLは有望であったが[5]、先頭一致の文字列検索に対応していなかった)ために、言語処理の分野では普及はしなかった。
日本語の不規則活用動詞には、いわゆる「サ変(する)」「カ変(くる)」以外に、「いう(言う/云う/謂う)」や「いく(行く/征く/逝く)」があり、「乞う/請う」「問う」は文語の活用を遺しているということが検証されている。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.