外行看熱鬧,內行看門道,在SEO的路上,每一個從業者對本身都是信心滿滿,這在很大程度上,都是依託於本身的實戰經驗,但有的時候,實戰的結果基於行業的問題,關鍵詞的屬性,每每存在諸多「巧遇」。
簡單來說,當你經過大量實踐獲得結果,所給出的理論推斷,可能就是一個偶然,而在某種程度上與搜索引擎理論的研究多是截然不同。
好比:近期一些SEO機構所討論的內容原創問題,一段英文,一段中文,貌似收錄很好。
那麼,中英文結合的文章,有利於SEO嗎?
根據以往搜索引擎的工做原理的研究,城思seo,將經過以下內容闡述:
一、主題提取
一般來說,搜索引擎在面對一篇文章的時候,咱們都很是清楚,它會經過百度蜘蛛去爬行頁面中的相關性內容,而將每個文章,經過中文分詞,切分紅一個個詞組。 但咱們認爲並非全部行業都會出現這個狀況。
好比:城思seo是一個專業作SEO培訓的自媒體博客。
當搜索引擎面對這樣一句話的時候,一般它可能會拆分出以下關鍵詞:城思,seo,百度關鍵詞排名優化,SEO外包服務,上海,SEO。
而在這個時候,這裏面會有一個很是有意思的小疑問,有的小夥伴就會講,爲何不是城思seo,而是城思和seo。
這是一個很是好的問題,一般而言對於一些新有名詞,搜索引擎是很難判斷它的相關性的,它須要藉助大量的文章去學習與分析。
隨着必定時間的推移,城思seo,這個關鍵詞,就不在會被搜索引擎所拆分,而當成一個獨立的關鍵詞,這裏面涉及一些列天然語言學習的策略,就不一一展開。
二、主題識別
而對於一段英文,一段中文的內容頁面,實際上它是一個多語言的學習與分析,搜索引擎會怎麼去識別呢?
一般而言,搜索引擎同樣會去拆分這個頁面,對於英文段落,因爲百度早期更多的專一於中文關鍵詞的研究,這個時候在去拆分英文段落的時候,實際上獲得的相關性的特徵向量,是沒有辦法匹配到詞庫列表中。
這個時候,搜索引擎就會去作一件事情,那就是針對這些英文段落去進行及時翻譯,將它整合成中文,而進行進一步判斷。
在這個過程當中會產生諸多問題,好比:
①英文段落,拆分的關鍵詞,翻譯以後和主題不相關的問題。
②英文段落,拆分關鍵詞,翻譯錯誤的問題。
③英文段落,拆分關鍵詞後,很難進行有效翻譯的問題。
三、主題定位
當搜索引擎對於頁面內容進行拆分以後,就會根據整理出的相關關鍵詞進行主題關鍵詞分析,一般在這個環節,並非單單的依託於關鍵詞密度,還會進一步分析詞組之間的相關性。
去定義這個頁面的核心主題究竟是什麼,而對於包含英文段落的內容,常常會因爲「翻譯」問題,產生大量不相關性的關鍵詞。
搜索引擎在判斷這個頁面內容質量的時候,就會給予較高的評分,由於,一些冗餘的關鍵詞太多。