![cover image](https://wikiwandv2-19431.kxcdn.com/_next/image?url=https://upload.wikimedia.org/wikipedia/commons/thumb/2/23/Basic_english_syntax_tree.svg/langzh-yue-640px-Basic_english_syntax_tree.svg.png&w=640&q=50)
詞性標注
From Wikipedia, the free encyclopedia
詞性標注(粵讀:ci4 sing3 biu1 zyu3;英文:POS tagging)係自然語言處理(NLP)同相關工作上成日做嘅一種重要工序,指攞一段文字做 input,再出個 output 係同段文字入面每隻字標明佢係咩詞性嘅,即係每隻字都標明咗佢係名詞定動詞定形容詞定點[1][2]。
![Thumb image](http://upload.wikimedia.org/wikipedia/commons/thumb/2/23/Basic_english_syntax_tree.svg/300px-Basic_english_syntax_tree.svg.png)
N
)。舉個例說明,想像家陣個 input 係以下呢句英文句子[3]:
做咗詞性標注個 output 就會係類似以下噉嘅樣:
喺廿世紀,詞性標注曾經係搵人手做嘅,但到咗廿一世紀初,NLP 等領域嘅發展經已有咗專化嘅演算法教電腦自動做詞性標注[4],例如 Python 嘅專化函式庫就索性整埋句陳述式 pos_tag(text)
俾用家用一句碼嚟叫部電腦做詞性標注。呢種技術喺 NLP 同語言學嘅研究(尤其係運算語言學)上都時不時會用到。