程序博客网 > 淘宝上的银泰是正品吗

RegExp and classfier used in part-of-speech(POS) tagging

来源：互联网发布：淘宝上的银泰是正品吗编辑：程序博客网时间：2024/06/11 20:42

1. regular expression in pos
judge the characteristic of a certain word by suffix pattern matching

点击(此处)折叠或打开

>>> import nltk
>>> from nltk.corpus import brown
>>> brown_tagged_sents= brown.tagged_sents(categories='news')
>>> brown_sents= brown.sents(categories='news')
>>> patterns= [
...(r'.*ing$','VBG'),
...(r'.*ed$','VBD'),
...(r'.*es$','VBZ'),
...(r'.*ould$','MD'),
...(r'.*\'s$', 'NN$'),
... (r'.*s$', 'NNS'),
... (r'^-?[0-9]+(.[0-9]+)?$', 'CD'),
... (r'.*', 'NN')
... ]
>>> regexp_tagger = nltk.RegexpTagger(patterns)
>>> regexp_tagger.tag(brown_sents[3])[:10]
[(u'``', 'NN'), (u'Only', 'NN'), (u'a', 'NN'), (u'relative', 'NN'), (u'handful', 'NN'), (u'of', 'NN'), (u'such', 'NN'), (u'reports', 'NNS'), (u'was', 'NNS'), (u'received', 'VBD

2. classfier in pos
judge the characteristic of a certain word by suffix classfier

0 0

淘宝上的银泰是正品吗

淘宝上的银泰是正品吗

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子转股溢价率高好还是低好溢价率计算公式溢价率怎么算可转债溢价率溢出性皮炎出了性性无知溢多利股票 300381溢多利溢多利股吧溢多利股价溢多利生物科技有限公司 300381股吧 300381 沣源清淤汇沣源溢流鱼缸四角溢流实图详解溢流管防溢阀溢流阀的作用溢流阀符号溢流阀图片丹尼逊溢流阀耐高温溢流阀消音节流阀 db溢流阀水用溢流阀气控溢流阀插装溢流阀精密溢流阀气体溢流阀不锈钢溢流阀电磁先导溢流阀出气节流阀液压溢流阀的作用溢流阀背压数字溢流阀直插式溢流阀遥控溢流阀电控溢流阀