程序博客网 > centos中文输入法

基于大规模语料的新词发现算法

来源：互联网发布：centos中文输入法编辑：程序博客网时间：2024/05/19 19:12

挖掘新词的传统方法是先对文本进行分词，猜测未能成功匹配片段就是新词。但这种方式依赖于词库的完整性，如果词库中根本没有新词，我们又怎能信任分词结果呢？顾森在文中介绍了一种基于大规模语料的新词发现算法。

对中文资料进行自然语言处理时，我们会遇到很多其他语言不会有的困难，例如分词——汉语的词与词之间没有空格，那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已／结婚／的／和／尚未／结婚／的”，还是“已／结婚／的／和尚／未／结婚／的”呢？

基于大规模语料的新词发现算法：http://www.csdn.net/article/2013-05-08/2815186

更多阅读请访问程序员官网新首页：http://programmer.csdn.net/

centos中文输入法

centos中文输入法

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子宣传广告词鞋子简短广告词吸引人面膜广告词简短吸引人搞活动的广告词宣传促销宣传语食品广告词语大全特价广告语销售广告语美甲广告宣传语好产品的广告语促销广告语大全幽默广告语大全广告大全幽默广告语广告标语大全搞笑广告语大全搞笑贷款广告语优惠活动广告语有趣的广告语有哪些广告语广告语有哪些广告台词创意广告词大全好的广告语搞笑的广告语著名广告语佳能广告经典广告语赏析经典的广告减肥广告语减肥广告宣传语减肥宣传语经典广告台词服装广告语大全56条手机广告词大全活动广告语活动促销广告语打折优惠的创意宣传语优惠促销广告语美容院广告词大全收集50句经典广告词