首先,百度在官方的聲明中說:[喝小酒的網摘]http://blog.hehehehehe.cn/a/17112.htm
百度僅做爲中立的轉碼工具及相關技術的提供方。在轉碼過程當中,百度對第三方網站內容不作任何修改或編輯,亦不對本頁面內容負責。您享有是否閱讀轉碼頁面的選擇權,如您但願選擇以非轉碼形式查看該頁面內容,請您直接訪問原網站。
固然也有百度對於推出百度轉碼的意義以及策略,最後固然也提到了如何屏蔽百度轉碼或者說叫作不但願被轉碼方法。若是隻想拿來就用,就不須要看後面的了,直接在head中間插入<meta http-equiv="Cache-Control" content="no-transform " />便可。
1. web頁面轉碼的意義?
互聯網上融合了WEB和WAP兩類網頁資源,WEB網頁資源佔比遠多於WAP網頁,但目前絕大多數移動終端的瀏覽器都不能直接瀏覽WEB網頁。所以,爲確保WAP可用性,必須對WAP搜索結果中的WEB網頁進行格式轉換,轉換爲WAP網頁,使其能在移動終端瀏覽器被瀏覽。百度的轉碼技術便是爲實現此目的、服務於WAP搜索的附屬產品,各大搜索引擎均擁有並提供相似轉碼技術。
2. 百度轉碼的策略?
爲了最大程度解決WEB頁面在手機上的可用性,轉碼須去除WEB頁面中不能在手機瀏覽器上瀏覽的內容,和沒法用WAP描述語言描述的部份內容,並將網頁佈局由2維佈局適配爲1維佈局。
3. 站長小貼士
(1)若是以爲本身的站點轉碼效果不佳怎麼辦?
可使用百度移動標註協議,在PC站點的html頁面中加入百度的標註協議(註釋形式),提高轉碼效果。該協議主要針對採用html規範製做的Web站點,以利於站長自助優化百度無線搜索訪問其站點時的頁面效果。
(2)若是不但願本身的站點被轉碼怎麼辦?
共有三種解決方案:
A. no-transform協議
TC支持的no-transform協議爲以下兩種形式:
a. HTTP Response中顯式聲明Cache-control爲no-transform。
b. meta標籤中顯式聲明Cache-control爲no-tranform,格式爲:
<head>
<meta http-equiv="Cache-Control" content="no-transform " />
</head>
如第三方站點不但願頁面被轉碼,可添加此協議,當用戶進入第三方網站時,先進入中間提示頁,頁面將引導用戶自主選擇跳轉至原網頁。
B. handheld協議
頁面經過lt;link>標籤顯式指定WAP網頁,聲明格式以下:
<link rel="alternate" type="application/vnd.wap.xhtml+xml" media="handheld" href="target"/>
如第三方站點不但願頁面被轉碼,可添加此協議,告知咱們原網頁對應有一個WAP版頁面,當用戶進入第三方網站時,先進入中間提示頁,讓用戶自主選擇跳轉至原網頁或第三方網站自有的wap頁面。
C. User-Agent相關
TC抓取頁面時,使用的User-Agent爲:
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; baidu Transcoder;)
如第三方站點不但願轉碼HTML頁面,且又能夠提供對應的自有WAP頁面,則能夠根據這個User-Agent,返回自有WAP頁,同時在HTTP Response顯示聲明:Content-Type爲:vnd.wap.xhtml+xml,那麼TC將不對這個頁面轉碼,而是直接跳轉至相應的自有WAP頁面。
html
[喝小酒的網摘]http://blog.hehehehehe.cn/a/17112.htmweb