和處理頁面的關鍵詞一樣,對用戶輸入的搜索關鍵詞也需要進行拆分和降噪等操作,將其拆分為關鍵詞組,并剔除對搜索結果影晌不大的詞。
提取頁面
確定好關鍵詞后,搜索引擎就會從檢索數據庫中提取出包含有這關鍵詞的頁面,但是這些頁面并不會全部參與排名。因為搜索結果一般會有幾十萬甚至上干萬條,全部進行排名會使計算量非常大、速度非常慢,而且用戶通常也只會查看前面幾頁的結果,所以搜索引擎通常不會顯示所有的搜索結果,只會顯示權重最高的幾百條搜索結果。
綜合排序
搜索引擎會根據不同維度的得分對參與排名的頁面進行綜合排序,以得到最終的搜索結果。綜合排序主要包括以下6個方面的內容。
相關性丨相關性指頁面內容與搜索關鍵詞的匹配程度,如頁面所包含搜索關鍵詞的個數,這些關鍵詞出現的位置,以及外部網頁指向該頁面所使用的錨文本等能夠體現頁面內容與搜索關鍵詞的匹配程度的指標。
權威性|權威性更高的網站提供的內容更真實可靠,所以其網頁排名越靠前。
時效性|時效性指頁面是否為新出現的網頁,且頁面內容是新鮮的。目前,時效性在搜索引擎的排序中越來越重要。
豐富度|豐富度指頁面內容的豐富程度。如果頁面內容很豐富那么它不僅可以滿足用戶的單一需求,還可以滿足用戶的延伸需求。
加權|加權指通過人工方式提高某些頁面(如官方網站、特殊通道頁面等)的排名。
降權丨降權指降低有作弊嫌疑的網頁的排名的做法