java的中文转拼音组件---pinyin4j的使用
来源:互联网 发布:seo和sem有什么区别 编辑:程序博客网 时间:2024/06/10 14:58
pinyin4j是一个功能强悍的汉语拼音工具包,主要是从汉语获取各种格式和需求的拼音,功能强悍,下面看看如何使用pinyin4j。下载地址:http://pinyin4j.sourceforge.net/
import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; import java.io.UnsupportedEncodingException; /** * 拼音工具 * * @author leizhimin 2009-7-15 15:26:21 */ public class PinyinToolkit { /** * 获取汉字串拼音首字母,英文字符不变 * * @param chinese 汉字串 * @return 汉语拼音首字母 */ public static String cn2FirstSpell(String chinese) { StringBuffer pybf = new StringBuffer(); char[] arr = chinese.toCharArray(); HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); for (int i = 0; i < arr.length; i++) { if (arr[i] > 128) { try { String[] _t = PinyinHelper.toHanyuPinyinStringArray(arr[i], defaultFormat); if (_t != null) { pybf.append(_t[0].charAt(0)); } } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } } else { pybf.append(arr[i]); } } return pybf.toString().replaceAll("\\W", "").trim(); } /** * 获取汉字串拼音,英文字符不变 * * @param chinese 汉字串 * @return 汉语拼音 */ public static String cn2Spell(String chinese) { StringBuffer pybf = new StringBuffer(); char[] arr = chinese.toCharArray(); HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); for (int i = 0; i < arr.length; i++) { if (arr[i] > 128) { try { pybf.append(PinyinHelper.toHanyuPinyinStringArray(arr[i], defaultFormat)[0]); } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } } else { pybf.append(arr[i]); } } return pybf.toString(); } public static void main(String[] args) throws UnsupportedEncodingException { String x = "嘅囧誰說壞學生來勼髮視頻裆児"; System.out.println(cn2FirstSpell(x)); System.out.println(cn2Spell(x)); } }
运行结果:
kjsshxsljfspde kaijiongshuishuohuaixueshenglaijiufashipindanger Process finished with exit code 0
在某些系统上可能有字符集的问题,需要做预处理。
感谢:http://lavasoft.blog.51cto.com/62575/178320
阅读全文
0 0
- java的中文转拼音组件---pinyin4j
- java的中文转拼音组件---pinyin4j的使用
- java实现中文汉字转拼音 Pinyin4j的基本用法
- 如何使用pinyin4j的Java库进行汉字转拼音?
- pinyin4j的使用例子:将中文转换成拼音
- java中文转换为拼音的pinyin4j学习笔记
- java 中文转拼音之pinyin4j
- java开源类库pinyin4j的使用中文转汉语拼音的工具
- 中文转拼音Pinyin4j简介
- java使用pinyin4j生成拼音
- 汉字转拼音Pinyin4j的基本用法
- PinYin4j实现中文字符和拼音之间的转换
- 使用pinyin4j库把中文转成拼音
- 使用pinyin4j完成中文拼音转换
- Java汉字转拼音pinyin4j
- Java Pinyin4j(汉字转拼音)
- java开源类库pinyin4j的使用
- java开源类库pinyin4j的使用
- java日志级别以及log4j简单配置
- [code review] lstm
- android:layout_gravity 和 android:gravity 的区别
- 前端.什么是页面渲染&&影响渲染速度的两个因素
- Mysql 数据库模糊查询定位
- java的中文转拼音组件---pinyin4j的使用
- ListView使用SimpleAdapter加载网络图片
- Android权限注解
- C# 随机分一组数据
- Android权限详解
- android 添加桌面快捷方式
- 在python中处理matlab的mat文件
- 增量构造法输出所有子集
- Android 实时文件夹