PHP iconv()字符编码转换的问题
来源:互联网 发布:杜兰特新秀赛季数据 编辑:程序博客网 时间:2024/05/18 22:08
在php函数库有一个函数:iconv(),iconv函数库能够完成各种字符集间的转换,是php编程中不可缺少的基础函数库。
最近在做一个小偷程序,需要用到iconv函数把抓取来过的utf-8编码的页面转成gb2312, 发现只有用iconv函数把抓取过来的数据一转码数据就会无缘无故的少一些。 让我郁闷了好一会儿,去网上一查资料才知道这是iconv函数的一个bug。iconv在转换字符”—”到gb2312时会出错。
下面慢慢看一下这个函数的用法。
最简单的应用,把gb2312置换成utf-8:
1
在用
针对这的问题,可以用如下代码实现:
1
你没有看错,就这么简单,不使用gb2312,而写成GBK,就可以了。
还有一种方法,第二个参数,加上//IGNORE,忽略错误,如下:
1
iconv(“UTF-8”,”GB2312//IGNORE”,$data);
没有具体比较这两种方法,感觉第一种(GBK代替gb2312)方法更好。
php手册中iconv() 说明:
1
iconv
2
3
(PHP 4 >= 4.0.5, PHP 5)
4
iconv – Convert string to requested character encoding
5
Description
6
string iconv ( string in_charset, string out_charset, string str )
7
Performs a character set conversion on the string str from in_charset to out_charset. Returns the converted string or FALSE on failure.
8
If you append the string //TRANSLIT to out_charset transliteration is activated. This means that when a character can’t be represented in the target charset, it can be approximated through one or several similarly looking characters. If you append the string //IGNORE, characters that cannot be represented in the target charset are silently discarded. Otherwise, str is cut from the first illegal character.
在使用这个函数进行字符串编码转换时,需要注意,如果将utf-8转换为gb2312时,可能会出现字符串被截断的情况发生。此时可以使用以下方法解决:
1
即在第二个参数出添加红色字部分,表示:如果在目标编码中找不到与源编码相匹配的字符,会选择相似的字符进行转换。此处也可以使用://IGNORE 这个参数,表示忽略不能转换的字符。
ignore的意思是忽略转换时的错误,如果没有ignore参数,所有该字符后面的字符串都无法被保存。
iconv不是php的默认函数,也是默认安装的模块。需要安装才能用的。
如果是windows2000+php,你可以修改php.ini文件,将extension=php_iconv.dll前的”;”去掉,同时你要copy你的原php安装文件下的iconv.dll到你的winnt/system32下(如果你的dll指向的是这个目录)。在linux环境下,用静态安装的方式,在configure时加多一项 –with-iconv就可以了,phpinfo看得到iconv的项。(Linux7.3+Apache4.06+php4.3.2)。
mb_convert_encoding与iconv函数介绍
mb_convert_encoding这个函数是用来转换编码的。原来一直对程序编码这一概念不理解,不过现在好像有点开窍了。不过英文一般不会存在编码问题,只有中文数据才会有这个问题。比如你用Zend Studio或Editplus写程序时,用的是gbk编码,如果数据需要入数据库,而数据库的编码为utf8时,这时就要把数据进行编码转换,不然进到数据库就会变成乱码。
做一个GBK To UTF-8:
1
- PHP iconv()字符编码转换的问题
- 字符编码的转换iconv
- PHP 中字符编码转换 iconv() 和 mb_convert_encoding() 的区别
- PHP iconv()函数转字符编码的问题
- PHP iconv()函数转字符编码的问题
- PHP iconv()函数转字符编码的问题
- PHP iconv()函数转字符编码的问题
- iconv、mb_convert_encoding字符编码的转换
- 关于iconv字符编码的转换
- PHP 转换编码 iconv 的用法
- php处理多字节字符mbstring及编码转换iconv
- iconv 函数字符编码转换
- php iconv实现编码转换
- PHP编码转换之iconv
- PHP iconv 解决utf-8和gb2312编码转换问题
- PHP iconv 解决utf-8和gb2312编码转换问题
- PHP iconv 解决utf-8和gb2312编码转换问题
- iconv 转换字符编码,兼容VC转换
- UIScrollView的滚动,停止(UIScrollViewDelegate)
- ia32中程序调用返回时call.ret.leave的作用和栈变换的说明
- 用Open vSwitch实现VLAN
- LeetCode Regular Expression Matching
- ListView图片优化(二)---弱引用关联---或者使用Volley下的NetworkImageView
- PHP iconv()字符编码转换的问题
- 欢迎使用CSDN-markdown编辑器
- Spring4+Quartz2计划任务集群
- grant create synonym to SCOTT
- 在阿里云ubuntu 14.04 上部署Gogs
- 汉洛塔递归实现的思考(C语言)
- hdoj1379DNA Sorting
- VC单文件连接MYSQL示例,丢掉libmysql.dll.
- java中Date与String的相互转化