首先,百度在官方的声明中说:[喝小酒的网摘]http://blog.hehehehehe.cn/a/17112.htm
百度仅作为中立的转码工具及相关技术的提供方。在转码过程中,百度对第三方网站内容不做任何修改或编辑,亦不对本页面内容负责。您享有是否阅读转码页面的选择权,如您希望选择以非转码形式查看该页面内容,请您直接访问原网站。
当然也有百度对于推出百度转码的意义以及策略,最后当然也提到了如何屏蔽百度转码或者说叫做不希望被转码方法。如果只想拿来就用,就不需要看后面的了,直接在head中间插入<meta http-equiv="Cache-Control" content="no-transform " />即可。
1. web页面转码的意义?
互联网上融合了WEB和WAP两类网页资源,WEB网页资源占比远多于WAP网页,但目前绝大多数移动终端的浏览器都不能直接浏览WEB网页。因此,为确保WAP可用性,必须对WAP搜索结果中的WEB网页进行格式转换,转换为WAP网页,使其能在移动终端浏览器被浏览。百度的转码技术即是为实现此目的、服务于WAP搜索的附属产品,各大搜索引擎均拥有并提供类似转码技术。
2. 百度转码的策略?
为了最大程度解决WEB页面在手机上的可用性,转码须去除WEB页面中不能在手机浏览器上浏览的内容,和无法用WAP描述语言描述的部分内容,并将网页布局由2维布局适配为1维布局。
3. 站长小贴士
(1)如果觉得自己的站点转码效果不佳怎么办?
可以使用百度移动标注协议,在PC站点的html页面中加入百度的标注协议(注释形式),提升转码效果。该协议主要针对采用html规范制作的Web站点,以利于站长自助优化百度无线搜索访问其站点时的页面效果。
(2)如果不希望自己的站点被转码怎么办?
共有三种解决方案:
A. no-transform协议
TC支持的no-transform协议为如下两种形式:
a. HTTP Response中显式声明Cache-control为no-transform。
b. meta标签中显式声明Cache-control为no-tranform,格式为:
<head>
<meta http-equiv="Cache-Control" content="no-transform " />
</head>
如第三方站点不希望页面被转码,可添加此协议,当用户进入第三方网站时,先进入中间提示页,页面将引导用户自主选择跳转至原网页。
B. handheld协议
页面通过lt;link>标签显式指定WAP网页,声明格式如下:
<link rel="alternate" type="application/vnd.wap.xhtml+xml" media="handheld" href="target"/>
如第三方站点不希望页面被转码,可添加此协议,告知我们原网页对应有一个WAP版页面,当用户进入第三方网站时,先进入中间提示页,让用户自主选择跳转至原网页或第三方网站自有的wap页面。
C. User-Agent相关
TC抓取页面时,使用的User-Agent为:
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; baidu Transcoder;)
如第三方站点不希望转码HTML页面,且又可以提供对应的自有WAP页面,则可以根据这个User-Agent,返回自有WAP页,同时在HTTP Response显示声明:Content-Type为:vnd.wap.xhtml+xml,那么TC将不对这个页面转码,而是直接跳转至相应的自有WAP页面。
[喝小酒的网摘]http://blog.hehehehehe.cn/a/17112.htm