XMLHttpRequest读取中文网页时返回乱码的解决办法
来源:互联网 发布:2016年中国网络交易额 编辑:程序博客网 时间:2024/06/10 06:30
XMLHttpRequest读取中文网页时返回乱码的解决办法
XMLHttpRequest 默认是用UTF-8 传递数据。当服务端的返回数据是UTF-8编码的时候,它工作得很好(开发web应用,当服务端和客户端以及数据库统一使用UTF-8编码可以有效的避免乱码问题)。如果服务端设置了正确的Content-Type Response Header以及编码信息,那么XmlHttpRequest也可以正确工作。可是当使用XMLHttpRequest读取中文网页内容时, 如果服务端的程序没有设置Content-Type Response Header,或者Header没有设置编码类型,那么我们访问responseText属性的时候就可能遭遇乱码。如以下代码用XMLHttpRequest获取雅虎中国网站的星座站首页:
xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4) if (xmlhttp.status == 200) alert(xmlhttp.responseText);};xmlhttp.send(null);
纵使yahoo中国这样专业的网站,对web标准的支持还很不彻底,弹出的html源码中充斥不符合web标准的html标签,当然还有已预见的乱码。
同样遗憾的是,FireFox 和 IE 的解决方法也是南辕北辙
FireFox
FireFox 的XMLHttpRequest对象支持overrideMimeType方法,可以指定返回数据的编码类型,利用该方法可以解决中文乱码,前面的代码修改如下:
xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.overrideMimeType("text/html;charset=gb2312");//设定以gb2312编码识别数据xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4) if (xmlhttp.status == 200) alert(xmlhttp.responseText);};xmlhttp.send(null);
Internet Explorer
IE不支持overrideMimeType方法,并且只能用一种很蹩脚的方法来解决,此时需要引入一个杂交的函数:
function gb2utf8(data){var glbEncode = [];gb2utf8_data = data;execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript");var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2");t=t.split("@");var i=0,j=t.length,k;while(++i<j) {k=t[i].substring(0,4);if(!glbEncode[k]) {gb2utf8_char = eval("0x"+k);execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript");glbEncode[k]=escape(gb2utf8_char).substring(1,6);}t[i]=glbEncode[k]+t[i].substring(4);}gb2utf8_data = gb2utf8_char = null;return unescape(t.join("%"));}xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4) if (xmlhttp.status == 200) alert(gb2utf8(xmlhttp.responseBody)); //注意这里要用responseBody};xmlhttp.send(null);
gb2utf8函数直接解析XMLHttpRequest返回的二进制数据,其中要利用execScript方法来执行VBScript的函数。所以说是一个杂交的函数。感谢blueidea论坛 提供的算法。
虽然有了解决的办法,但形式丑陋,而且不符合web标准。所以应该在编程中尽量避免,如果是开发web应用,应尽量使用UTF-8编码,或者在服务端设置正确的编码信息。至于以上范例,有盗取其他网站内容的嫌疑,更是不为提倡。
- XMLHttpRequest读取中文网页时返回乱码的解决办法
- XMLHttpRequest读取中文网页时返回乱码的解决办法
- HttpClient4抓取网页返回乱码的解决办法
- HttpClient抓取网页返回乱码的解决办法
- php网页显示中文乱码的解决办法!
- AJAX返回中文乱码解决办法
- loadrunner返回中文乱码解决办法
- 用xmlhttpRequest获取同域网页中文出现乱码解决方案
- 网页乱码的解决办法
- AS 读取XML,中文显示为乱码的解决办法
- Request读取中文数据乱码的原因,以及解决办法
- Java 读取文件 使用BufferReader出现中文乱码的解决办法
- 读取一个网页时编码正确部分中文乱码
- servlet读取表单数据和返回页面时的中文乱码问题
- asp 中 XMLHttpRequest提交时中文乱码
- xmlHttpRequest 中文乱码问题
- XMLHttpRequest 传递中文 乱码
- XMLHttpRequest 传递中文 乱码
- 数字金额转换成中文金额(C#实现)
- Jmail发送和接收邮件
- 观察者模式介绍
- 在Spring的项目中配置Log4j(转载)
- 基于生物特征识别的公开密钥基础设施
- XMLHttpRequest读取中文网页时返回乱码的解决办法
- 1.1.2.计算机专业情况
- CAFE IN JAVA
- 管理人员的有效面试--结构化面试
- $1.2宏观经济形势
- 高管面试怪现状
- 生活摘要
- 用来脱口而出的100个精典句子
- 使用对称加密算法的例子