python 过滤中文、英文标点特殊符号
来源:互联网 发布:网络游戏音乐视频 编辑:程序博客网 时间:2024/06/10 19:38
在工作中经常遇到很多特殊的标点符号,像中文标点符号,英文标点符号。英文的标点符号比较容易过滤,而过滤中文的标点符号较麻烦。下面是从邮件中过滤特殊符号的方式供参考。
下面是一封垃圾邮件的过滤实例:
"想做/ 兼_职/学生_/ 的 、加,我Q: 1 5. 8 0. !!?? 8 6 。0. 2。 3 有,惊,喜,哦"
邮件中的“!?。、”都是中文的,而“/.”是英文的
下面是过滤方式:
<span style="font-size:18px;">#-*-coding:utf-8-*-import retemp = "想做/ 兼_职/学生_/ 的 、加,我Q: 1 5. 8 0. !!?? 8 6 。0. 2。 3 有,惊,喜,哦"temp = temp.decode("utf8")string = re.sub("[\s+\.\!\/_,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+".decode("utf8"), "".decode("utf8"),temp)print string</span>
过滤后的效果如下:
<span style="font-size:18px;">想做兼职学生的加我Q158086023有惊喜哦</span>
处理成上述格式后就容易进行分词分析处理了。
1 1
- python 过滤中文、英文标点特殊符号
- python去掉标点,特殊符号
- 用python进行数据预处理,过滤特殊符号,英文和数字。(适用于中文分词)
- 过滤中文标点
- Python 去英文标点
- 全角,半角 和 中文标点,英文标点
- Python 中文去标点
- 将字符串中的中文标点替换成英文标点
- 英文标点
- Mac如何在中文输入法中显示英文标点
- 编程时中文输入状态下也使用英文标点
- JavaScript 实现全角转半角 中文标点替换成英文标点
- php 过滤英文标点符号 过滤中文标点符号
- 英文标点附号
- 英文特殊符号
- PPLable 过滤标点方法
- SQL过滤中文(或英文)数据
- 去掉每行的行号及将中文标点转化成英文
- Win7 + vs2012 + cocos2d-x2.2.5 配置开发环境
- java 线程wait()与notify()的用法(被唤醒后的线程到底重新执行同步代码块还是从那是等待的那里继续执行)
- Libevent基本应用实例--专为懒人定制
- 【d3.js实践教程01】d3基本操作
- Linux SSH
- python 过滤中文、英文标点特殊符号
- PMP 读书笔记纲要1
- Linux之Makefile(静态模式)
- MapReduce原理与设计思想
- Spring学习笔记——基础知识
- C/C++ 中的assert()宏 断言机制 (转)
- Android初学之listView分批加载数据
- 下载文件代码
- 电信中4G "15G断网"和3G“20G断网”的区别