Vue單頁項目SEO徹底指南

什麼是SEO

搜索引擎優化(Search engine optimization,簡稱SEO),指爲了提高網頁在搜索引擎天然搜索結果中(非商業性推廣結果)的收錄數量以及排序位置而作的優化行爲,是爲了從搜索引擎中得到更多的免費流量,以及更好的展示形象。javascript

SEM(Search engine marketing,搜索引擎營銷),則既包括了SEO,也包括了付費的商業推廣優化。css

本文主要介紹的是前端如何在代碼上作SEO以及單頁項目如何實現SEO。前端

搜索引擎工做原理

要了解SEO,首先得了解搜索引擎的工做原理,其原理是比較複雜,流程簡化以下:vue

爬蟲抓取網頁內容

通常爬蟲抓取頁面內容是先從一個頁面出發,從中提取出其餘頁面的連接,而後看成下一個請求的對象,一直重複這個過程。因此要有良好的SEO,須要你在各大網站上擁有外鏈,這樣會提升你的網站被搜索引擎爬蟲的概率。java

分析網頁內容

爬蟲拿到HTML以後,就會對其內容進行分析。通常須要進行去雜、分詞、簡歷索引數據庫。什麼是索引數據庫呢?簡單地說就是記錄一個詞在哪些文檔中出現、出現次數、出現的位置等等。爲何要簡歷索引數據庫呢?是爲了快速查找。node

搜索和排序

搜索會根據你輸入的關鍵詞,分別查詢其對應的索引數據庫,並對結果進行處理和排序。webpack

前端編碼的SEO

網站結構

網站結構要清晰。通常網站的結構是樹形的,通常分爲三個層次:首頁 → 頻道頁(列表頁) → 文章頁(詳情頁)。nginx

網站的結構要扁平。結構層數越少越好,通常不要超過三層,搜索引擎通常到了第三層就不想繼續深刻地爬取了。多數的網站,例如掘金、雪球等,他們的網站結構是兩層,他們的首頁和頻道頁是同一個頁面。git

導航

頁面應該要有簡明的導航。導航可讓搜索引擎知道網站的結構,也可讓搜索引擎知道當前頁面在網站結構所在的層次。 建議:github

  • 每個頁面都包含導航。
  • 對於內容較多的網站能夠採用麪包屑導航。
  • 連接使用文字連接,若是是圖片,則經過alt屬性告知搜索引擎連接的指向。

規範的URL

規範、簡單、易理解的URL能讓搜索引擎更好地抓取內容。建議:

  • 同一個頁面,只對應一個url 。多個url能夠採用301進行重定向。
  • url能夠反應網頁內容以及網站結構信息。例如www.a.com/blog、www.a.com/blog/12三、www.a.com/article。
  • url儘可能簡短。
  • 儘可能減小動態url中包含的變量參數。

提交Sitemap

Sitemap 可通知搜索引擎他們網站上有哪些可供抓取的網頁,以便搜索引擎能夠更加智能地抓取網站。

robot.txt

搜索引擎爬行網站第一個訪問的文件就是robots.txt。在這個文件中聲明該網站中不想被蜘蛛訪問的部分,這樣,該網站的部分或所有內容就能夠不被搜索引擎訪問和收錄了,或者能夠經過robots.txt指定使搜索引擎只收錄指定的內容。

合理的HTTP返回碼

不一樣的返回碼,搜索引擎的處理邏輯是不同的。

  • 若是站點臨時關閉,當網頁不能打開時,建議使用503狀態。503能夠告知百度spider該頁面臨時不可訪問,請過段時間再重試。
  • 若是百度spider對您的站點抓取壓力過大,請儘可能不要使用404,一樣建議返回503。這樣百度spider會過段時間再來嘗試抓取這個連接,若是那個時間站點空閒,那它就會被成功抓取了。
  • 有一些網站但願百度只收錄部份內容,例如審覈後的內容,累積一段時間的新用戶頁等等。在這種狀況,建議新發內容暫時返回403,等審覈或作好處理以後,再返回正常狀態的返回碼。
  • 站點遷移,或域名更換時,請使用301返回。

合適的title

title是告訴搜索引擎網頁的主要內容。

  • 每一個網頁應該有一個獨一無二的標題,切忌全部的頁面都使用默認標題
  • 標題要主題明確和精練,包含這個網頁中最重要的內容,且不羅列與網頁內容不相關的信息
  • 用戶瀏覽一般是從左到右的,重要的內容應該放到title的靠前的位置

百度建議描述:

  • 首頁:網站名稱 或者 網站名稱_服務介紹/產品介紹
  • 頻道頁:頻道名稱_網站名稱
  • 文章頁:文章標題_頻道名稱_網站名稱

合適的description

description是對網頁內容的精練歸納。這個標籤存在與否不影響網頁權值,只會用作搜索結果摘要的一個選擇目標。 百度推薦作法:

  • 爲每一個網頁建立不一樣的description,避免全部網頁都使用一樣的描述
  • 網站首頁、頻道頁、產品參數頁等沒有摘要的網頁最適合使用description
  • 準確的描述網頁,不要堆砌關鍵詞,長度合理

HTML語義化

HTML語義化是用標籤和屬性來描述內容。因此HTML語義化是SEO的基石。通常建議:

  • HTML結構要清晰和簡潔
  • 跳轉使用<a>標籤,不要使用js跳轉
  • 圖片加alt說明
  • 文章用<article>標籤承載
  • ...

關於這部分的內容比較多,本人有一篇筆記《HTML語義化》

Vue單頁項目的SEO

目前,對於SEO支持比較好的項目方案是採用服務端渲染。因此若是項目有SEO需求,那麼比較好的方案是服務端渲染。

若是你已經採用了先後分離的單頁項目,而你的網站內容不須要AJAX去獲取內容和展現內容,那麼能夠試試 prerender-spa-plugin 這個插件,這個插件是一個webpack插件,能夠幫助你在打包過程當中經過無頭瀏覽器去渲染你的頁面,並生成對應的HTML。固然這個方案適合你的路由是靜態的,而且路由數量非海量。

若是你的內容是AJAX動態獲取的,那麼vue單頁項目能夠試試 prerender ,這個是一個預渲染服務,能夠幫你經過無頭瀏覽器渲染頁面,並返回HTML。這個方案和prerender-spa-plugin很類似,都是經過無頭瀏覽器去渲染頁面,不一樣的是渲染的時機,prerender-spa-plugin是在打包過程當中渲染,註定了其只能渲染靜態路由,而prerender 是在請求時渲染,因此能夠渲染動態的路由。下面我重點介紹一下prerender方案。

prerender 的使用

一、安裝

$ npm install prerender
複製代碼

二、啓動服務 server.js

const prerender = require('prerender');
const server = prerender();
server.start();
複製代碼

三、測試

http://localhost:3000/render?url=https://www.example.com/
複製代碼

通過上面三個步驟,你就已經啓動一個預渲染服務,而且會返回"www.example.com/"的內容,整個過程仍是比較簡單的。其github官網上面還介紹了它的許多中間件(Middleware),例如prerender-node (Express)nginx.conf等,那麼這個和 prerender 是什麼關係呢?是否直接使用中間件就能夠呢?下面介紹prerender是如何工做的吧。

prerender方案的原理

首先服務端接收到一個頁面的請求,而後判斷這個請求是否來自搜索引擎的爬蟲,若是不是,則直接返回單頁項目的HTML,按照普通單頁項目的工做模式(客戶端渲染),若是是,則把請求轉發給prerender服務,prerender服務會經過無頭瀏覽器進行預渲染,渲染完成把內容返回,這樣爬蟲就能夠拿到有內容的HTML了。prerender中間件就是用來判斷請求是否來自搜索引擎爬蟲和轉發請求的。

值得注意的是,prerender服務是不包含無頭瀏覽器的,因此須要自行安裝chrome瀏覽器。所以,整個方案運行須要三部分:

  • chrome瀏覽器
  • prerender服務
  • prerender中間件

那麼prerender服務是怎麼知道頁面渲染已經完成的呢? Prerender服務經過計算未完成的請求數量,來肯定頁面什麼時候完成加載。一旦未完成的請求數達到零,服務會等待一段時間(默認500ms),而後保存HTML。

prerender的最佳實踐

通過實踐,請求一個通過prerender渲染的頁面是時間,快的時候約2s,慢的時候會長達8s。通常來講,請求時間在3s之內是最好的。因此我從如下幾個方面入手,探索prerender的優化方法。

減小資源請求的時間

影響prerender渲染時間的資源主要有js請求資源和api請求資源,api請求時間通常由後端決定,因此我考慮的是如何減小js資源請求時間。通常prerender服務渲染的資源請求地址是由頁面請求URL決定的,因此通常是線上的地址,若是咱們把prerender服務部署在網站的服務器上,讓prerender服務請求資源走本地,那麼就能夠縮短資源的請求時間了。

若是你的線上服務是開啓了CDN的話,那麼資源走本地還有一個好處,就是能夠節省CDN流量。

優化prerender選項

prerender提供了一些自定義的選項

pageDoneCheckInterval:這個參數是prerender檢查頁面請求是否完成的定時器時間,默認是500ms,即每500ms檢查未完成的請求數量是否爲零,我將其修改成100ms,提升其檢查的頻率。

waitAfterLastRequest:這個參數是最後一個請求完成以後等待的時間,默認是500ms,主要是請求完成以後,頁面更新渲染須要時間,當即返回的話,可能請求的數據來不及渲染,我將時間修改成200ms。

prerender插件

httpHeaders —— 返回合理的HTTP狀態碼

添加httpHeaders這個插件,能夠更改返回的HTML的HTTP狀態碼,添加方式以下

var prerender = require('prerender');
var server = prerender()
server.use(prerender.httpHeaders());
server.start();
複製代碼

prerender經過識別在<head>中的<meta>標籤來設置頁面返回的HTTP狀態碼。

<meta name="prerender-status-code" content="404">
複製代碼

若是你須要設置301重定向,能夠這樣作

<meta name="prerender-status-code" content="301">
<meta name="prerender-header" content="Location: http://www.xxx.com">
複製代碼

blockResources —— 無需等待圖片資源

prerender是根據未完成的請求數來判斷是否渲染結束的。可是咱們給搜索引擎返回的HTML只須要渲染經過js動態增長的DOM,其實不須要渲染css或者渲染接口返回的圖片的,咱們來看下prerender在渲染中是否會請求這些資源。 prerender能夠開啓是否打印請求,開啓方式以下:

var server = prerender({
    logRequests: true
});
複製代碼

開啓以後就能夠在控制檯看到請求了,請求裏面是包含css和圖片資源的。

2019-07-17T04:34:03.180Z - 47 http://xxx.com/css/chunk-f4a02584.da8dca38.css
2019-07-17T04:34:03.180Z {
  source: 'network',
  level: 'error',
  text: 'Failed to load resource: net::ERR_INVALID_ARGUMENT',
  timestamp: 1563338043130.37,
  url: 'http://xxx.com/wefid/css/chunk-f4a02584.da8dca38.css',
  networkRequestId: '1000039068.65' 
}

2019-07-17T04:34:03.924Z + 3 http://xxx.com/img/erweima_wx.a84d82ef.jpg
2019-07-17T04:34:03.924Z + 4 http://xxx.com/img/erweima_wb.06971584.png
複製代碼

爲何prerender要等待這些資源呢?由於prerender服務還有一個強大的功能,那就是Prerender.com,其能夠經過一個接口給你返回以下的東西:

  • 網頁的HTML文件
  • 網頁的屏幕截圖(視口或全屏)
  • 網頁的PDF文件
  • 網頁的HAR文件
  • 執行您本身的javascript並返回json和HTML

很明顯,這些功能是須要加載你所需的CSS或圖片資源的,否則網頁顯示有問題。這個時候,若是你只須要知足SEO需求而不須要Prerender.com的功能的話,那麼blockResources插件就能夠派上用場了。插件添加方式以下:

var prerender = require('prerender');
var server = prerender()
server.use(prerender.blockResources());
server.start();
複製代碼

使用blockResources插件以後,圖片資源和字體資源會被abort(捨棄)。

自定義渲染結束時間

若是你想更細粒化地控制prerender的返回時機,提早結束或者延後結束,那麼可使用這個標誌window.prerenderReady

首先須要設置window.prerenderReady爲false,prerender在檢測到window.prerenderReadyfalse以後,會等待你設置爲true再返回結果。

<script> window.prerenderReady = false; </script>
複製代碼

當你渲染完成以後,通常在接口請求完成並渲染完成以後

window.prerenderReady = true;
複製代碼

這樣你就能夠更加自由地控制渲染結束的時機。

開啓緩存

緩存這裏有兩個方面,一方面是HTTP緩存(瀏覽器緩存),另外一方面是渲染結果緩存。

首先HTTP緩存可讓prerender服務不用頻繁地發起資源請求,節省傳輸時間。這個我就不展開將,我想講的是渲染結果緩存。prerender中間件提供了兩種緩存方式, redis 或者 memcached ,以redis爲例:

$ npm install redis
複製代碼
var redis = require("redis"),
client = redis.createClient();

prerender.set('beforeRender', function(req, done) {
	client.get(req.url, done);
}).set('afterRender', function(err, req, prerender_res) {
	client.set(req.url, prerender_res.body)
});
複製代碼

你能夠經過 beforeRender 和 afterRender 這兩個鉤子進行細粒化地控制,對於內容變化頻繁的不緩存或緩存時間短,對於內容變化不頻繁的設置長時間緩存。開啓緩存不只能夠加速返回時間,還能夠減輕服務器的壓力。

統計和監控

統計和監控能夠放在中間件的 afterRender 中進行。

prerender.set('afterRender', function(err, req, prerender_res) {
  if(err){
    // 這裏是錯誤監控代碼
    // ...
    // return
  }
  let {headers: req_headers, originalUrl} = req
  let {headers: res_headers, body} = prerender_res
  // 這裏是統計代碼,能夠保存請求和返回的相關信息
})
複製代碼

小結

經過以上的優化方法(除了自定義渲染結束時間和開啓緩存),我已經將HTML的請求時間穩定在2.5s左右。

總結

以上就是我想講的關於前端編碼SEO的所有內容,總而言之,就是

  • 合適的HTML標籤和屬性
  • 合理的HTTP狀態碼
  • Sitemap & robot.txt
  • 合適的渲染方案
相關文章
相關標籤/搜索