【Rosseta中文分词】python下利用HMM思想进行中文分词
来源:互联网 发布:怎样考上清华知乎 编辑:程序博客网 时间:2024/06/02 10:32
刚刚打了半天没保存 突然崩溃 全毁了。!QAQ
心好累,不想多说什么了,说点重要的放几个连接就算了。
github连接:https://github.com/yuchenlin/RossetaSeg/
1.这个项目是大一上计算导论的大作业之一,感觉比较有挑战性就选了,也学到了很多东西,挺开心的。
2.基本没什么心意,跟结巴分词的思路一模一样,但是因为结巴进行了太多工程性优化也没有很多文档,所以我的这个唯一的意义就是看起来比较容易懂。
3.思路主要是两层,一是基于词典和概率的动态规划搜索有向无环图的最大概率路径,二是针对多个连续单字进行HMM的标注构造,实现每个字都有一个状态,且这个状态链对应的概率是最大的。
4.一些连接,给了我很多帮助:
http://blog.csdn.net/likelet/article/details/7056068
http://ddtcms.com/blog/archive/2013/2/4/69/jieba-fenci-suanfa-lijie/
还有wiki的维特比算法词条。
0 0
- 【Rosseta中文分词】python下利用HMM思想进行中文分词
- Python利用结巴分词进行中文分词
- 用HMM模型进行中文分词
- 中文分词的python实现----HMM、FMM
- python中文分词,使用结巴分词对python进行分词
- 贝叶斯思想-dp进行简易中文分词
- 高阶HMM中文分词
- 基于HMM的中文分词
- 如何利用Python对中文进行分词处理
- 使用最大逆向法,利用python进行简易中文分词
- 中文分词思想scws
- python中文分词:结巴分词
- 利用庖丁解牛工具进行中文分词
- 中文分词的python实现-基于HMM算法
- 中文分词的python实现-基于HMM算法
- python调用中科院分词器进行中文分词
- ictclas4j进行中文分词
- 使用python jieba库进行中文分词
- 自定义ViewGroup来理解View的scrollTo()方法
- Emacs教程 30minutes
- 千万不能松懈
- poj 1707 伯努利数
- Linux shell 之 提取文件名和目录名的一些方法
- 【Rosseta中文分词】python下利用HMM思想进行中文分词
- C语言二进制文件读取解析
- SQLServer 维护脚本分享(03)数据库中记录CPU最近N分钟内的使用情况
- hdu4614 Vases and Flowers
- php 二分查找
- 2015年一月二十五号工作日志
- struts2手动进行表单验证
- 【机房重构】——观察者模式解决三种下机
- Android基础知识(二)—-Menu