一、请求与响应的格式
我们非常需要关注请求与响应格式的一至性,比如:客户端使用:
HttpConnection c = (HttpConnection)Connector.open (urlStr );
c.setRequestProperty("Content-Type", "application/xhtml+xml ")
表明自己识别的是:
application/xhtml+xml
类型的格式,服务器在传输时请按照相应格式给我组织响应的
byte[]
流;
那么服务器最好按照客户端要求的格式来响应;
这叫配套,如果请求和响应不配套就会出现很多怪问题,比如丢字,乱码等;
至于配套的格式都有多少种,在网络上可以查到,我就不一一列举了,下面是一个关于
Content-Type
说明的地址:
二、使用网关代理
如果我们只能通过中国移动的
cmwap
接入点访问网站页面(
cmwap
接入点也是移动梦网的网关)或者我们要访问位于移动梦网内的页面,那么我们就必须指定用于访问这些页面的代码网关:
10.0.0
.172:80
下面的例子表明了如何使用中国移动的代理网关;
例一:通过
URL
拆分的方法使用代理网关
Boolean UseAgent=true;
if (!UseAgent) {
c = (HttpConnection) Connector.open("http://" + “www.sina.com” + “
/webui/index.html
”, Connector.READ_WRITE, true);
} else {
c = (HttpConnection) Connector.open("http://10.0.0.172:80/"
+ “
/webui/index.html
”, Connector.READ, true);
c.setRequestProperty("X-Online-Host", “www.sina.com”);
}
之所以这样来写
url
,是为了方便大家看清楚在使用代理网关时如何进行
url
的拆分;
例二:不拆分
URL
,直接使用代理网关
Boolean UseAgent=true;
if (!UseAgent) {
c=(HttpConnection)Connector.open (
urlStr
);
} else {
c=(HttpConnection)Connector.open ("http://10.0.0.172:80/"+
urlStr
);
c.setRequestProperty("X-Online-Host",
urlStr
);
c.setRequestProperty("Accept","*/*");
}
那两种方式有何区别?
例一的方式是标准的写法,但是用这种方法访问移动梦网内的网页会有问题:无法得到正确的网页;这时候就要用第二种方法了。第一种方法能做的事情,第二种方法似乎都能做到,至少我还没有遇见过反例。
至于这是为什么?我也不知道,知道的大仙如果感兴趣请回贴说明一下吧,小神在此先谢过。
关于
cmnet
与
cmwap
,读者可以在
google
上查
”
活猴工作室
”
,这哥们是
CTO
,他的
blog
上有一些非常不错的文章;
三、读取服务器响应的内容:
我们通常用以下几种方式读取服务器端响应的内容:
例一:按指定编码逐字符读取
int
ch=0;
StringBuffer
sb = new StringBuffer ();
InputStreamReader
isr = new InputStreamReader (dis,"utf-8");
try
{
while
((ch=isr.read())!=-1){
System.out.print((char)ch);
sb.append((char)ch);
}
}catch (Exception ex){
sb.append("/r/n");
sb.append(ex.toString());
}
isr.close();
这种方法的优点是:它是在读取文本内容时最方便的一种作法,不过这种作法有一个缺陷,如果服务器端使用
asp.net
,用
Response.write(“”)
的方法向客户端返回的话,
isr.read()
永远读不到
-1
,
.net
和
java
在数值的字节流转换上划的不是一套拳。这时候就只能依靠使用最外层的那个
try
{}
catch()
来捕获错误的方法来终止读取,因此,这种方法看起来似乎总有点傻乎乎的感觉;
例二:先原样读取字节流,然后再对字节流进行转码;
ByteArrayOutputStream baout = new ByteArrayOutputStream(1024);
byte
[] bytes = new byte [128];
int
size = 0;
int
TotalSize = 0;
requestByte = null ;
while
((size = is.read(bytes)) != -1) {
baout.write(bytes, 0, size);
TotalSize += size;
}
bytes = null ;
responseByte = baout.toByteArray();
String responseStr = new String(responseByte,"UTF-8");
注:
responseStr
即为所求;
这种方法忠实的读取出所有返回到客户端的字节流,并将这些字节流记录下来;
不过,要想这种方法读取到正确的字节流,我们需要留意在第一节中所提到的内容:
“
请求与响应的格式
”
这种方法的好处是以不变应万变,万变不离其宗,管它服务器发来什么,不过都是一大堆的
byte[]
流而已,就像黑客帝国中的尼奥,他看破了这层
byte[]
流,想干嘛就干嘛。
四、编码
常用的汉字编码有:
GB2313(GB2313-80)
、
GBK
、
UTF8
、
BIG5
码,
BIG5
编码在港台用;
常用的其它编码有:
ASC-II
、
ISO-8859-1
、
Unicode
为了获得网页的内容,当然要指定正确的编码了,不同的网页使用的编码会不同,所以使用相同的程序在访问不同的网页时会表现不同,这时千万别
”
大惊失色
”
,其实只是小问题;
说到这里,我要说个很苦恼的事情:我在
google
上很难查到各种国家标准,可能是这些链接很少被人关注到,一直希望能找到这样一个网站,上面有各种国家发布的标准、法律文件等可以被广大人民群众方便的查询到。不但齐全完整,而且还能与时具进,不知哪位大仙能告诉我几个这种网站的网址?小神在此先谢过!
下面这个网站是中国国家教育部网站下面收藏的
GB2312-80
字符集;用
google
翻出来的,如果想从教育部网站首页上找到它反而有点难度。另外,这个页面不知道能存放在那里多久。
关于作者:
布老虎,
QQ
:
67090182