编码为GB2312网站让AJAX接收的数据显示支持中文

复制代码 代码如下:

  <script>

  var xmlHttp;

  var BrowerType="ie";

  function createXML(){

  try{

  xmlHttp = new ActiveXObject("Msxml2.XMLHTTP");

  } catch (e){

  try{

  xmlHttp = new ActiveXObject("Microsoft.XMLHTTP");

  }catch(e2) {

  xmlHttp =false;

  }

  }

  if (!xmlHttp && typeof XMLHttpRequest != 'undefined'){

  xmlHttp = new XMLHttpRequest();

  BrowerType = "ff"; //用于记录是否火狐,以便下面处理接收中文数据分析使用。

  }

  }

  function querytelcode(citys){

  createXML();

  showState=document.getElementById("showtelcode");

  xmlHttp.onreadystatechange = function(){

  if (xmlHttp.readyState == 2){

  showState.innerHTML = '<img src="/img/process.gif" />';

  }else if (xmlHttp.readyState == 4 && xmlHttp.status == 200){

  if (BrowerType=="ff"){

  getLastCode=xmlHttp.responseText;//FireFox

  }else{

  getLastCode=gb2utf8(xmlHttp.responseBody);

  }

  showState.innerHTML = getLastCode;

  }

  }

  var url='myorderAjax.asp?oid=<%=Request.QueryString("orderid")%>&cityname='+citys;

  xmlHttp.open ("GET",url,true);

  if (BrowerType=="ff"){

  xmlHttp.overrideMimeType("text/html;charset=gb2312");//设定以gb2312编码识别数据,只有FF支持。IE不行

  }

  xmlHttp.send(null);

  }

  function gb2utf8(data){

  var glbEncode = [];

  gb2utf8_data = data;

  execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript");

  var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2");

  t=t.split("@");

  var i=0,j=t.length,k;

  while(++i<j) {

  k=t[i].substring(0,4);

  if(!glbEncode[k]) {

  gb2utf8_char = eval("0x"+k);

  execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript");

  glbEncode[k]=escape(gb2utf8_char).substring(1,6);

  }

  t[i]=glbEncode[k]+t[i].substring(4);

  }

  gb2utf8_data = gb2utf8_char = null;

  return unescape(t.join("%"));

  }

  </script>

  以下是此篇文章全文:

  XMLHttpRequest 默认是用UTF-8 传递数据。当服务端的返回数据是UTF-8编码的时候,它工作得很好(开发web应用,当服务端和客户端以及数据库统一使用UTF-8编码可以有效的避免乱码问题)。如果服务端设置了正确的Content-Type Response Header以及编码信息,那么XmlHttpRequest也可以正确工作。

  可是当使用XMLHttpRequest读取中文网页内容时, 如果服务端的程序没有设置Content-Type Response Header,或者Header没有设置编码类型,那么我们访问responseText属性的时候就可能遭遇乱码。如以下代码用XMLHttpRequest获取雅虎中国网站的星座站首页:

  

复制代码 代码如下:

  xmlhttp = getXMLHttpRequest();

  var url = "http://cn.astrology.yahoo.com/";;

  xmlhttp.open("GET", url, true);

  xmlhttp.onreadystatechange = function(){

  if (xmlhttp.readyState == 4)

  if (xmlhttp.status == 200)

  alert(xmlhttp.responseText);

  };

  xmlhttp.send(null);

  纵使yahoo中国这样专业的网站,对web标准的支持还很不彻底,弹出的html源码中充斥不符合web标准的html标签,当然还有已预见的乱码。

  同样遗憾的是,FireFox 和 IE 的解决方法也是南辕北辙

  FireFox 做法:

  FireFox 的XMLHttpRequest对象支持overrideMimeType方法,可以指定返回数据的编码类型,利用该方法可以解决中文乱码,前面的代码修改如下:

  

复制代码 代码如下:

  xmlhttp = getXMLHttpRequest();

  var url = "http://cn.astrology.yahoo.com/";;

  xmlhttp.open("GET", url, true);

  xmlhttp.overrideMimeType("text/html;charset=gb2312");//设定以gb2312编码识别数据

  xmlhttp.onreadystatechange = function(){

  if (xmlhttp.readyState == 4)

  if (xmlhttp.status == 200)

  alert(xmlhttp.responseText);

  };

  xmlhttp.send(null);

  Internet Explorer 做法:

  IE不支持overrideMimeType方法,并且只能用一种很蹩脚的方法来解决,此时需要引入一个杂交的函数:

  

复制代码 代码如下:

  function gb2utf8(data){

  var glbEncode = [];

  gb2utf8_data = data;

  execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript");

  var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2");

  t=t.split("@");

  var i=0,j=t.length,k;

  while(++i<j) {

  k=t[i].substring(0,4);

  if(!glbEncode[k]) {

  gb2utf8_char = eval("0x"+k);

  execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript");

  glbEncode[k]=escape(gb2utf8_char).substring(1,6);

  }

  t[i]=glbEncode[k]+t[i].substring(4);

  }

  gb2utf8_data = gb2utf8_char = null;

  return unescape(t.join("%"));

  }

  xmlhttp = getXMLHttpRequest();

  var url = "http://cn.astrology.yahoo.com/";;

  xmlhttp.open("GET", url, true);

  xmlhttp.onreadystatechange = function(){

  if (xmlhttp.readyState == 4)

  if (xmlhttp.status == 200)

  alert(gb2utf8(xmlhttp.responseBody)); //注意这里要用responseBody

  };

  xmlhttp.send(null);

  gb2utf8函数直接解析XMLHttpRequest返回的二进制数据,其中要利用execScript方法来执行VBScript的函数。所以说是一个杂交的函数。感谢blueidea论坛 提供的算法。

  虽然有了解决的办法,但形式丑陋,而且不符合web标准。所以应该在编程中尽量避免,如果是开发web应用,应尽量使用UTF-8编码,或者在服务端设置正确的编码信息。至于以上范例,有盗取其他网站内容的嫌疑,更是不为提倡。

  附一篇:讨论:

  原因:AJAX在接收responseText或responseXML的值的时候是按照UTF-8的格式来解码的,如果服务器段发送的数据不是UTF-8的格式,那么接收responseText或responseXML的值有可能为乱码。

  解决办法: 在服务器指定发送数据的格式:

  在jsp文件中:

  response.setContentType("text/text;charset=UTF-8");//返回的是txt文本文件

  或是

  response.setContentType("text/xml;charset=UTF-8");//返回的xml文件

  PHP:header('Content-Type:text/html;charset=GB2312');

  ASP:Response.Charset("GB2312")

  JSP:response.setHeader("Charset","GB2312");

  讨论:

  PHP:header('Content-Type:text/html;charset=GB2312');

  这样写除非是小项目

  大项目都是按照框架走

  对于HEADER定义于config文件最前端解决方案

  在JS里有一个解析utf-8xml的方法写的非常强

  建议用那

  非物理生命 traindiy